多语言展示
当前在线:845今日阅读:176今日分享:34

页面字段怎么显示出来

我们在使用Python语言编写程序时,经常需要使用爬虫从网页中爬取一些数据,这时候往往获取到的数据是一长串的字符串,我们该如何从其中提取出来页面字段并且显示出来?
工具/原料
1

Python IDE(Visual Studio Code)

2

Python扩展

3

一台安装了最新Windows10系统的计算机

4

稳定的互联网连接

方法/步骤
1

打开一个工作文件夹,在左侧的文件列表中,点击新建按钮,新建一个新的源文件,注意后缀名要为.py表明这是一个python文件

2

在文件的首部首先导入我们需要用到的包,因为需要获取网页请求要用到request,对具体的数据进行解析要用到json

3

然后创建几个url对象,分别为我们需要爬取数据的网址,再使用一个对象保存请求返回的数据

5

由于我们需要与服务器进行交互,需要发送HTTP请求,在报文中指定所有应该发送的参数

6

确认上述代码输入无误后,点击运行按钮,稍等片刻即可看到获取到的数据,必须对其中的内容进行提取才可显示出具体的页面字段

7

我们只需要使用json包的load语句在对应[]的内传入需要提取的关键字,即可得到对应的信息,点击运行即可看到简约的结果

注意事项
1

本经验的实现基于系统自带的requests和json包进行实现

2

本经验仅供参考,具体的实现过程可能会随着软件版本更新而变化

推荐信息