织梦建站是一套比较完善的系统。今天我来给大家说一下如何进行采集规则的写法。我们用经验的地址来做测试。
工具/原料
织梦系统
方法/步骤
1
首先进入系统点击采集,然后选择采集节点管理,
2
点击新增节点,进入采集类型选择今天我们选择普通文章采集
3
点击确定后进入列表页采集,
4
进入采集页面后我们可以看到各种需要填写的 分别是:节点名称、编码、来源属性、文章网址匹配规则等几项,其中节点名称和编码我们不做介绍。
6
按照上图写完后点击测试,出现一个网址列表,可以复制到浏览器里看看分页是否正确。
7
然后开始对列表页进行匹配,这里就需要看经验的分页代码,首先我们看分页的开始代码,首先找到开始代码这个代码必须是唯一的如:唯一的结束代码: 点击测试后我们看到一排测试数据就是采集过来的数据但是很多东西是没必要的比如经验上的id等这里我们就需要做一些限制来屏蔽id,点击返回上一步来修改。这里我们限制必须带有/article/ 不能包含/list/2 :如图设置 点击测试,文章正常 然后我们来获取内容:跟列表一样找到唯一的标识: 然后点击保存可以开始采集试试咯ok看效果。 注意某些网站每个栏目不一样需要注意采集的规则适当调整我选择的是分页那里的代码,写完后点击保存并测试8911
[内容] 我这里是这样写的根据经验的格式,然后选择一些规则对js、div、table等屏蔽即可。12注意事项
下一篇:简单自定义SeekBar的写法