{include file="header.html"} {include file="collect_head.html"}

规则基本信息 {include file="collect_basic.html"}

内容类型：

列表页配置

匹配网址： (一行填写一条)	{$rules.regxurl_list\|htmlspecialchars}
	http://xxfseo.com/a/list_{p,1,5,1}.html {p,1,5,1} 表示分页，参数：p后面的数字分别代表开始、结束、递增/减值，即 {p,开始,结束,递增/减值}

内容获取

*网址匹配：
	如：http://x.com/html/(d).html ，通配符号：(*)（任意字符）、(w)（数字字母下划线）、(d)（数字）
测试地址：	(可填，不填则系统自动随机获取一条)
*内容截取规则：	{$rules.body_area_regx\|htmlspecialchars}	正则截取，如：<div class="abc"[^>]+>(.*)</div> 一行一条规则，系统会取成功匹配的内容

过滤配置

内容最小长度：	* 一个中文字的长度为2，建议>100以上
内容过滤标签：	使用内置过滤（过滤大部分无用标签，包括A标签） {foreach $tagArr as $k=>$vo} {$vo} {/foreach}
正则过滤：一行一条规则	{$rules.body_filter_regx\|htmlspecialchars}	正则过滤，如：<script[^>]+>(.*?)</script>
过滤词语： (一行填写一个)	{$rules.sift_words\|htmlspecialchars}	包含词语的内容自动过滤，如果只是删除则前面每个词加*号

保存规则返回列表