{include file="header.html"} {include file="collect_head.html"}
规则基本信息 {include file="collect_basic.html"}
内容类型:
列表页配置
匹配网址:
(一行填写一条)
  http://xxfseo.com/a/list_{p,1,5,1}.html

{p,1,5,1} 表示分页,参数:p后面的数字分别代表开始、结束、递增/减值,即 {p,开始,结束,递增/减值}
内容获取
*网址匹配:
  如:http://x.com/html/(d).html ,通配符号:(*)(任意字符)、(w)(数字字母下划线)、(d)(数字)
测试地址: (可填,不填则系统自动随机获取一条)
*内容截取规则: 正则截取,如:<div class="abc"[^>]+>(.*)</div>

一行一条规则,系统会取成功匹配的内容
过滤配置
内容最小长度: * 一个中文字的长度为2,建议>100以上
内容过滤标签:
{foreach $tagArr as $k=>$vo} {/foreach}
正则过滤:
一行一条规则
正则过滤,如:<script[^>]+>(.*?)</script>
过滤词语:
(一行填写一个)
包含词语的内容自动过滤,如果只是删除则前面每个词加*号
  保存规则 返回列表