小说源码的采集:
关关软件采集+火车头软件采集+后台网页版采集
其它源码的采集:
火车头软件采集+后台网页版采集
1、目标站是什么,采集来就是什么
2、如果目标站的内容中带有网址或其它广告,可在采集时过滤掉
3、默认已设置有过滤,但难免有漏网之鱼,此时可自行设置过滤
一、采集时如何过滤广告
1、关关软件采集的过滤功能
1、编号1中进入:采集规则管理
2、编号2中导入采集规则
3、编号3中点击对应的项目
(从上往下,依次为:书名、简介、章节名、章节内容)
4、编号4中填写要过滤的字符,一行一个
5、编号5保存,完成,新采集生效
2、火车头软件采集的过滤功能
二、采集之后如何过滤广告
针对小说站
后台=>左侧=>常用管理=>文件管理=>cj=>Rules=>allbook.txt
编辑此文件,添加你想过滤的字符,一行一个