当前位置:AIGC资讯 > 数据采集 > 正文

Python爬虫——使用JSON库解析JSON数据

文章目录

1 如何在网页中获取 JSON 数据? 2 Python 内置的 JSON 库

这几天在琢磨爬取动态网页,发现需要爬取 js 内容,虽然说最后还是没有用上 JSON 库进行解析,不过笔记写的都写了,就发出来记录一下吧。

1 如何在网页中获取 JSON 数据?

打开一个具有动态渲染的网页,按 F12 打开浏览器开发工具,点击“网络”,再刷新一下网页,观察是否有新的数据包。

发现有 js 后缀的文件,这就是我们想要的 json 数据了。

2 Python 内置的 JSON 库

内置的 json 库的函数:

dumps:用于将 Python 的数据类型转化为 json 字符串。

loads:将 json 字符串转化为 Python 的数据类型。

实例 1:

import json

data = [ { 'a' : 1, 'b' : 2, 'c' : 3, 'd' : 4, 'e' : 5 } ]

data2 = json.dumps(data)
print(data2)

输出结果:

[{"a": 1, "c": 3, "b": 2, "e": 5, "d": 4}]

实例 2:

#!/usr/bin/python
import json

jsonData = '{"a":1,"b":2,"c":3,"d":4,"e":5}';

text = json.loads(jsonData)
print(text)

输出结果:

{u'a': 1, u'c': 3, u'b': 2, u'e': 5, u'd': 4}

更新时间 2023-11-08