多语言展示
当前在线:369今日阅读:168今日分享:49

火车头采集器采集文章内容[精编图文版]

之前,已经为大家分享了两篇关于火车头采集器的图文教程:火车头采集器安装流程[精编图文版] 和火车头采集器采集文章网址[精编图文版] ,关于软件安装和采集文章网址在这里就不再讲解,今天与大家一起耿分享火车头采集器采集文章内容的方法。
工具/原料
1

火车头采集器

2

目标网站

方法/步骤
1

打开火车头采集器,接着我们上一节讲到采集文章列表,然后双击“文章列表”中的一条文章网址

2

进入到文章内容采集编辑页面,点击 测试 按钮,可以看到已经获取文章

3

我们可以看到获取的文章里有很多无用的标签和内容,需要我们来规定采集的区域,在浏览器中打开目标采集网址,右键查看源代码,找到文章内容的开始和结束标签。

4

双击 内容 标签,打开后将找到的开始和结束标签,放到对应的框里面,然后单击 确定,然后进行测试,可以看到文章内容已经采集到了。

5

我们可以看到有很多没有用的标签,需要去除无用标签,双击 内容 标签,在HTML标签排除中去掉无用的标签。

6

这样我们的文章就采集成功了!

注意事项
1

开始和结束标签,需要是唯一的,可以利用ctrl+F进行查找

2

标签排除时,千万不要点击所有标签

推荐信息