多语言展示
当前在线:1971今日阅读:181今日分享:30

Python库之BeautifulSoup库的搜索文档树(续1)

BeautifulSoup模块是用来从HTML/XML等文件提取所需数据的Python库.模块定义了许多有效的方法,便于处理导航、搜索、修改分析树等功能.与re模块相比,实现相同的功能简便高效.下图是bs4模块定义的子模块以及BeautifulSoup模块定义的函数.下文将介绍如何用搜索文档树.
工具/原料
1

ubuntu 16.04LTS系统

2

交互开发环境IPython 2.4.1

3

Python 2.7.12

方法/步骤
2

函数find_parent( name , attrs , recursive , text , **kwargs )功能:搜索当前tag的父节点.注意:参数name可以为过滤器的几种类型.         参数attrs可以同时指定过滤器的多个属性.         参数recursive:可以指定 recursive=False只搜当前tag        参数text:搜索字符串,还可以与其它参数混合使用来过滤tag

3

函数find_previous_siblings( name , attrs , recursive , text , **kwargs )和find_previous_sibling( name , attrs , recursive , text , **kwargs ).功能:功能:搜索当前tag的兄弟节点前者是所有的兄弟节点.注意:参数name可以为过滤器的几种类型.         参数attrs可以同时指定过滤器的多个属性.         参数recursive:可以指定 recursive=False只搜当前tag        参数text:搜索字符串,还可以与其它参数混合使用来过滤tag

4

函数find_all_next( name , attrs , recursive , text , **kwargs )功能:搜索当前tag的后面的所有满足过滤器条件的节点.注意:参数name可以为过滤器的几种类型.         参数attrs可以同时指定过滤器的多个属性.         参数recursive:可以指定 recursive=False只搜当前tag        参数text:搜索字符串,还可以与其它参数混合使用来过滤tag

5

函数find_next( name , attrs , recursive , text , **kwargs ).功能:搜索当前tag的后面的一个满足过滤器条件的节点.注意:参数name可以为过滤器的几种类型.         参数attrs可以同时指定过滤器的多个属性.         参数recursive:可以指定 recursive=False只搜当前tag        参数text:搜索字符串,还可以与其它参数混合使用来过滤tag

6

函数find_all_previous( name , attrs , recursive , text , **kwargs )功能:搜索当前tag的前面的所有满足过滤器条件的节点.注意:参数name可以为过滤器的几种类型.         参数attrs可以同时指定过滤器的多个属性.         参数recursive:可以指定 recursive=False只搜当前tag        参数text:搜索字符串,还可以与其它参数混合使用来过滤tag

7

函数find_previous( name , attrs , recursive , text , **kwargs )功能:搜索当前tag的前面的一个满足过滤器条件的节点.注意:参数name可以为过滤器的几种类型.         参数attrs可以同时指定过滤器的多个属性.         参数recursive:可以指定 recursive=False只搜当前tag        参数text:搜索字符串,还可以与其它参数混合使用来过滤tag

注意事项

注意函数返回一个节点和所有节点的区别,以及函数入参的含义

推荐信息