Python是现在很流行的一种编程语言,以其功能的强大深受程序员的喜爱。下面小编就为大家介绍如何使用Python实现根据网址采集网页。快来看看吧。
方法/步骤
1
引入模块“urllib2”。
2
设置要采集的地址:url=‘http://www.baidu.com/’。
3
使用“urlopen”方法返回网页文件:a=urllib.request.urlopen(url)。
4
只能使用“read”方法获取网页文件的内容:f=a.read()。
5
看一下“f”的长度就知道是否真的返回了网页:len(f)。
下一篇:Python编程初学者指南