java爬虫系列：怎么用jsoup解析xml?(9)

jsoup是一个很强大的爬虫框架，当然也是很强大的html和xml解析器。xml文档是一种非常常见的文档，比如支付结果回调：微信和支付宝返回的都是xml，这里将分享怎么用jsoup解析xml文档

工具/原料

eclipse/idea

jsoup

方法/步骤

第一步：同html一样，xml也需要一个文档，这里就新建一个xml文档进行解析，代码如下： xx ooxx

第二步：把xml文档加载到程序中，这里注意文件的路径不要错了，代码如下：Document dom = Jsoup.parse(new File("C:/Users/admin/Desktop/a.xml"), "UTF-8");

第三步：xml文档加载后，可以看到返回的就是一个Document对象，所有就可以使用Document方法了，获取text，代码如下：Document dom = Jsoup.parse(new File("C:/Users/admin/Desktop/a.xml"), "UTF-8"); String s = dom.select("b").text(); System.out.println(s);

第四步：还可以获取节点的id值，这些方法同前面的分享的一样，可以参考前几篇经验，代码如下：String s = dom.select("c").attr("id"); System.out.println(s);

第五步：xml转换成html，在jsoup里面这种转换是很简单的，只需要简简单单的一句就搞定，代码如下：String html = dom.outerHtml(); System.out.println(html);

第六步：jsoup对html和xml解析非常方便，但是jsoup不能执行js文件，模仿不了点击事件，但是配合Selenium 一起更好用。在下一个系列中将会分享Selenium 的使用

注意事项

注意路径

上一篇：如何用python写第一个爬虫

下一篇：怎么用C#爬虫解析table表格样式的网站?

欧尼酱

java爬虫系列：怎么用jsoup解析xml?(9)

java爬虫系列：怎么用jsoup解析xml?(9)

如何利用Raptor判断不同分数学生等级

如何在Illustrator中制作水仙花文字效果

camtasia studio 8 怎么用?

怎样画钢笔画“风中女”？

怎么来画穿着百褶裙的大长腿简笔画呢？

泡泡袖怎么画

怎样画简笔画“拎包的女孩”？

牛仔短裤和低腰裤该怎么画？

如何用SAI画竖条上衣+牛仔休闲裤套装5-39

怎样在画图中绘制六角星和它的外接正方形

明日方舟怎么玩，明日方舟如何操作

明日方舟怎么刷初始号

陈洪绶式仕女的画法

明日方舟主线攻略

式神六星怎么培养?

Photoshop教程：为皱褶T恤衫添加变形图案

明日方舟怎么刷初始/刷初始攻略

明日方舟cbex7攻略

明日方舟公开招募怎么出五星

明日方舟星极