python3使用urllib爬去ajax加载的页面实例

方法/步骤

先查看要爬取的页面豆瓣电影的分类页地址：movie.douban.com/tag/#/，下面加载更多的按钮就是通过ajax加载电影信息

打开Python开发工具IDLE，新建‘pdouban.py’文件,测试爬虫，写代码如下：import urllib.request url = 'xxx:movie.douban.com/tag/#/' headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.36 (KHTML,like GeCKO) Chrome/45.0.2454.85 Safari/537.36 115Broswer/6.0.3', 'Referer':'xxx://movie.douban.com/', 'Connection':'keep-alive'} req = urllib.request.Request(url,headers=headers) res = urllib.request.urlopen(req) content = res.read().decode('utf8') print (content) xxx是对应的超文本传输协议

F5运行代码，成功打印出网页内容

F12打开页面开发者模式，点击加载更多按钮，查看network加载时发送请求数据。

观察发现请求url参数中每次步进为20Request URL:xxx://movie.douban.com/j/new_search_subjects?sort=U&range=0,10&tags=&start=0xxx://movie.douban.com/j/new_search_subjects?sort=U&range=0,10&tags=&start=20

观察发现请求返回值是json格式字符串

为打印出电影名，修改代码如下：import urllib.request import json url = 'xxx://movie.douban.com/j/new_search_subjects?sort=U&range=0,10&tags=&start=0' headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1;WOW64) AppleWebKit/537.36 (KHTML,like GeCKO) Chrome/45.0.2454.85 Safari/537.36 115Broswer/6.0.3', 'Referer':'xxx://movie.douban.com/', 'Connection':'keep-alive'} req = urllib.request.Request(url,headers=headers) res = urllib.request.urlopen(req) content = res.read().decode('utf8') dcontent = json.loads(content) for item in dcontent['data']: print (item['title'])

F5运行代码，成功打印出电影名，外层再加上步进20的循环就可以打印多次请求的电影名了

上一篇：如何用python3爬取招聘网站

下一篇：营养美味：萝卜丝虾丸汤的做法

欧尼酱

python3使用urllib爬去ajax加载的页面实例

如何用python写爬虫

python爬虫怎么写

Python写网络爬虫-Urllib库

python爬取三种方法

python爬虫socket.timeout的使用

怎么用python爬数据

用python爬取商品页面信息

Python爬虫：如何爬虫实现以及2大解析方法

Python爬虫--BeautifulSoup（2）

python爬虫--爬取网页数据的一般步骤

python turtle教程6

python3爬虫怎样构建请求头，怎样构建header

如何使用python语言中pandas模块randn和randint

如何使用python语言pandas模块pivot_table方法

Python爬虫动态ip代理防止被封的方法

如何使用python语言中的pandas的cumsum创建数据

如何用python3爬取招聘网站

python3使用urllib爬去ajax加载的页面实例

python如何爬取网页里的伪元素

python爬虫之BeautifulSoup初始运行时警告

怎么看出折耳猫发病了

如何由医学生转变为实习医生或医生

医学生毕业考试不及格怎么办？

桃花枝插水里怎样养

桃花的生长过程是什么

医学生也可以在网上回答问题

医学生要怎么度过考试

剑侠情缘手游武当和桃花哪个好

医脉通怎么认证医生

水养桃花怎样养得好

如何从一名医学生成长为一名合格的医生

英雄联盟天降幸运活动如何参加

适合五一劳动节的活动？

宝可梦大探险礼物攻略

基础防骗知识！！

家庭如何才能防盗

零基础该如何学好舞蹈呢？必须做到的12点

独自旅行要注意些什么？

#过年#过年时候的防忽悠指南

消逝的光芒2九级橙装怎么获得