{include file="header.html"} {include file="collect_head.html"}
规则基本信息 {include file="collect_basic.html"}
保存类型: 保存到什么库中,栏目库的通常为产品名称、小说的章节
类型: 子页标题(标题不在列表的,在子页面的,如:小说的章节
列表页配置
匹配网址:
(一行填写一条)
  http://xxfseo.com/a/list_{p,1,5,1}.html

{p,1,5,1} 表示分页,参数:p后面的数字分别代表开始、结束、递增/减值,即 {p,开始,结束,递增/减值}
标题获取
*一级网址匹配:
  如:http://x.com/html/(d).html ,通配符号:(*)(任意字符)、(w)(数字字母下划线)、(d)(数字)
*子页网址匹配:
  如:http://x.com/html/(d).html ,通配符号:(*)(任意字符)、(w)(数字字母下划线)、(d)(数字)
过滤配置
标题最小长度: 一个中文字的长度为2*
正则过滤:
一行一条规则
正则过滤,如:<script[^>]+>(.*)</script>
过滤词语:
(一行填写一个)
包含词语的标题自动过滤,如果只是删除则前面每个词加*号
  保存规则 返回列表