多语言展示
当前在线:1044今日阅读:26今日分享:39

Python写网络爬虫-Urllib库

Urllib库是Python中的一个功能强大、用于操作URL,并在爬虫时经常使用的一个库。在Python2.X中,分为Urllib库和Urllib2库,Python3.X之后合并到Urllib库中,在这里使用Python3.X进行讲解。    如何使用Urllib快速爬取一个网页?
工具/原料
1

Python

2

urllib

方法/步骤
1

首先,需要导入对应模块,所以,需要输入以下代码导入urllib.request:>>>import urllib.request

3

此时,需要使用file.read()方法读取全部内容:>>>data = file.read()>>>data

注意事项

在这里使用Python3.X

推荐信息