如何使用java代码，爬取页面特定内容？

hello，大家好。大家都知道爬虫方向一直是python的天下但是你知道吗？java也可以写爬虫哦！今天要教大家的是如何使用java代码爬取页面中的内容。

工具/原料

idea

jsoup 依赖

一丢丢的java基础

方法/步骤

第二步：找到我们需要的图片元素对象使用 css 选择器 jsoup已经为我们封装好了，一起来看吧

第三步：获取图片的网络路径

第四步：通过网络图片地址，将图片下载到本地

代码都在这里了： public static void main(String [] args) throws IOException { Document doc = Jsoup.connect('http://www.baidu.com/').get(); Elements select = doc.select('.index-logo-src'); int i = 1; java.net.URL url = null; for (Element element : select) { String src = element.attr('src'); src = src.substring(2); src = 'http://' + src; url = new java.net.URL(src); DataInputStream dataInputStream = new DataInputStream(url.openStream()); FileOutputStream fileOutputStream = new FileOutputStream(new File('e:/img/' + (i) + '.gif')); ByteArrayOutputStream output = new ByteArrayOutputStream(); byte[] buffer = new byte[1024]; int length; while ((length = dataInputStream.read(buffer)) > 0) { output.write(buffer, 0, length); } byte[] bytes = output.toByteArray(); fileOutputStream.write(output.toByteArray()); dataInputStream.close(); fileOutputStream.close(); i++; } }

注意事项

如果对你有帮助的话就点个赞吧！

上一篇：怎么查询自己继续教育情况

下一篇：规培期间需要拿继续教育学分吗

欧尼酱

如何使用java代码，爬取页面特定内容？

小米路由器如何更改无线网络名称

如何使用连续取样进行PS抠图？

如何在Word中制作连续块状流程图？

excel2016如何创建SmartArt连续图片列表

excel2010中如何制作一个连续图片列表

word连续分节符如何设置

word分节后如何设置连续页码

在word文档中如何设置可以使页码连续

PPT演示文档如何插入连续图片列表

房产证没下来的房子如何买卖

一梯四户高层住宅如何挑选户型

如何选择旅行背包？旅行背包选购的小常识

登山包，户外双肩包的织带断裂我们如何补救？

如何挑选骆驼户外背包

如何挑选一款户外骑行包

如何更好地把握校园招聘季，拿到满意的offer？

老毛桃winpe如何加载注册表编辑器

如何使用cmd命令连续检查指定地址的连通性？

Excel如何制作雷达图

如何查看TCP和UDP的连接方式

文书编号怎么查询案件信息

启信宝怎样查企业信息

失信被执行人名单信息公布与查询

怎么查失信人员名单？

中国执行信息网如何查个人征信

中国执行信息网怎么查个人征信

怎样在家给宠物狗洗澡

生病的宠物狗怎么喂养

泰迪的日常健康检查包括哪些

是不是柯基犬幼犬发热了就是得病呢

狗毛梳密与体温

狗狗的体温多少才正常呢

高考冲刺怎么复习 冲刺怎么提分最快

家常菜叉烧肉怎么做

煎土豆的做法

怎样一个人练习乒乓球技术

怎样使用氩弧焊

如何说腹语？

科三变道怎么操作步骤

myeclipse怎么安装怎样安装myeclipse

高考冲刺怎么复习冲刺怎么提分最快