首页 > 技术学习, 网站运营 > 狂人采集规则大全

狂人采集规则大全

设置贴子文章采集来源论坛网站名称 规则示范(0) 猫扑网 大杂烩(dzh.mop.com) 类型模版
贴子列表网址开始处 http://dzh.mop.com/
列表页号
列表尾缀
列表贴子网址筛选(共同点*不同点) .html?from
标题截取截取开始 标题开始代码
标题截取截取结束 标题结束代码
内容截取截取开始 内容开始代码*d666d
内容截取截取结束 内容结束代码*d666d
回贴部分截取开始 回复开始代码*d666d
回贴部分截取结束 回复结束代码*d666d
贴子采集方式 2
贴子地址错误替换贴子网址要替换的错误*替换为正确部份
防盗内容破解1
防盗内容破解2
防盗内容破解3
防盗内容破解4
页号间隔 1
简化采集规则 0
D9999D采集后的贴子文章归类到主论坛对应板块
全部贴子转入 No0 号板块 汽车音响/隔音

D9999D采集的贴子内容替换(用于消隐原网站信息)
标题开始代码
标题结束代码
内容开始代码
内容结束代码
回复开始代码
回复结束代码
分页开始代码
分页结束代码
========采集文章后两关键字之间内容替换
[img]http://i1.mopimg.cn/public/images/face/ [/img]
[img]http://i5.mopimg.cn/public/images/face [/img]
[img]http://mopimg.cn/dzh/res/images/face/ [/img]
========文章原文件代码两关键字之间内容替换

该帖由

========文章原文件代码规则截取用关键字生成

标题开始代码

标题结束代码

标题结束代码

回复结束代码

内容开始代码
内容结束代码

内容开始代码

  • 回复结束代码
  • 回复开始代码
  • 回复结束代码
  • 回复开始代码
  • ========文章列表原文件代码关键字替换
    ========文章列表原文件代码文章地址合成开始结束位置
    最新发表 div class=”page fr”>
    ====无超链接规则====

    D9999D规则作者信息

    因IE版本不同,源代码不一样,为确保您能正常采集,请务必升级您的IE版本到11

    DAAAAD

设置贴子文章采集来源论坛网站名称 规则示范(0) 猫扑网 大杂烩(dzh.mop.com) 类型模版 贴子列表 […]

  1. 还没有评论
评论提交中, 请稍候...

留言

(Spamcheck Enabled)

Trackbacks & Pingbacks ( 0 )
  1. 还没有 trackbacks