Urllib库是Python中的一个功能强大、用于操作URL,并在爬虫时经常使用的一个库。在Python2.X中,分为Urllib库和Urllib2库,Python3.X之后合并到Urllib库中,在这里使用Python3.X进行讲解。 如何使用Urllib快速爬取一个网页?
工具/原料
1
Python
2
urllib
方法/步骤
1
首先,需要导入对应模块,所以,需要输入以下代码导入urllib.request:>>>import urllib.request
3
此时,需要使用file.read()方法读取全部内容:>>>data = file.read()>>>data
注意事项
在这里使用Python3.X
上一篇:python爬虫怎么写
下一篇:python爬取三种方法