Python中处理JSON文件的最新教程

myrgd • 2024年11月24日下午1:55 • python, 数据库

在 Python 中处理 JSON 文件是非常常见的操作。JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，易于人类阅读和编写，也容易机器解析和生成。Python 提供了强大的 json 模块来方便地处理 JSON 数据。

目录表

基本操作：读取、写入和解析 JSON 文件

以下是一个关于如何使用 Python 中的 json 模块处理 JSON 文件的最新教程，包括读取、写入、解析和生成 JSON 数据的基本操作。

1. 导入 `json` 模块

在开始之前，你需要导入 Python 的 json 模块：

import json

2. 读取 JSON 文件

假设你有一个名为 data.json 的 JSON 文件，内容如下：

{
    "name": "John",
    "age": 30,
    "city": "New York"
}

要读取这个 JSON 文件，可以使用 json.load() 方法，它将 JSON 数据从文件中读取并转换为 Python 字典对象：

# 读取 JSON 文件
with open('data.json', 'r') as file:
    data = json.load(file)

# 打印读取的数据
print(data)

输出：

{'name': 'John', 'age': 30, 'city': 'New York'}

3. 写入 JSON 文件

如果你有一个 Python 字典，想要将其保存为 JSON 格式到文件中，可以使用 json.dump() 方法。

# Python 字典
data = {
    "name": "Jane",
    "age": 25,
    "city": "Los Angeles"
}

# 写入 JSON 文件
with open('output.json', 'w') as file:
    json.dump(data, file, indent=4)  # indent=4 美化输出，增加可读性

输出： 创建 output.json 文件，内容如下：

{
    "name": "Jane",
    "age": 25,
    "city": "Los Angeles"
}

indent 参数用于格式化 JSON 输出，使其更加易读。你还可以使用 ensure_ascii=False 来处理非 ASCII 字符，保持其原始格式。

4. 解析 JSON 字符串

有时，JSON 数据可能以字符串形式存在，例如从 API 获取的数据。你可以使用 json.loads() 方法将其转换为 Python 数据结构：

# JSON 字符串
json_string = '{"name": "Alice", "age": 28, "city": "Chicago"}'

# 解析 JSON 字符串
data = json.loads(json_string)

# 打印数据
print(data)

输出：

{'name': 'Alice', 'age': 28, 'city': 'Chicago'}

5. 将 Python 对象转换为 JSON 字符串

如果你需要将 Python 对象转换为 JSON 字符串，可以使用 json.dumps() 方法。这个方法也可以让你指定格式化选项（如 indent 和 ensure_ascii）。

# Python 字典
data = {
    "name": "Bob",
    "age": 32,
    "city": "San Francisco"
}

# 转换为 JSON 字符串
json_string = json.dumps(data, indent=4)

# 打印 JSON 字符串
print(json_string)

输出：

{
    "name": "Bob",
    "age": 32,
    "city": "San Francisco"
}

6. 处理复杂的数据类型

Python 的 json 模块也可以处理更复杂的数据类型，如列表和嵌套字典。比如，下面的 JSON 数据包含一个嵌套的列表：

{
    "name": "Charlie",
    "age": 22,
    "skills": ["Python", "Machine Learning", "AI"]
}

读取这类数据和之前的方法相同：

# 读取嵌套数据
with open('complex_data.json', 'r') as file:
    data = json.load(file)

print(data)

输出：

{
    'name': 'Charlie',
    'age': 22,
    'skills': ['Python', 'Machine Learning', 'AI']
}

7. 处理 JSON 中的日期和自定义数据类型

如果你的 JSON 数据中包含日期或其他特殊数据类型，Python 的 json 模块提供了 default 参数，允许你指定如何处理这些数据。

例如，如果你的 JSON 中包含 datetime 对象，你可以将其转换为字符串格式：

import json
from datetime import datetime

# Python 字典包含日期
data = {
    "name": "David",
    "date_joined": datetime.now()
}

# 自定义序列化方法
def datetime_converter(obj):
    if isinstance(obj, datetime):
        return obj.isoformat()
    raise TypeError("Type not serializable")

# 转换为 JSON 字符串
json_string = json.dumps(data, default=datetime_converter, indent=4)

# 打印 JSON 字符串
print(json_string)

输出：

{
    "name": "David",
    "date_joined": "2024-11-24T14:10:21.736136"
}

在这个例子中，datetime_converter 函数将 datetime 对象转换为 ISO 格式的字符串，以便 JSON 可以处理它。

8. 从文件中读取并处理异常

在读取 JSON 文件时，可能会遇到无效的 JSON 格式或其他问题。你可以使用 try-except 块来捕获异常：

try:
    with open('invalid_data.json', 'r') as file:
        data = json.load(file)
except json.JSONDecodeError as e:
    print(f"JSON 解码错误: {e}")
except FileNotFoundError:
    print("文件未找到")

9. 使用 JSON 格式化工具

Python 提供了 json.tool 模块，可以直接在命令行上格式化和查看 JSON 文件：

cat data.json | python -m json.tool

这会将 data.json 格式化并输出。

总结

在 Python 中，处理 JSON 文件通常涉及以下几个步骤：

使用 json.load() 和 json.dump() 进行文件的读取和写入。
使用 json.loads() 和 json.dumps() 处理字符串和数据对象之间的转换。
处理复杂数据类型和日期时，可以利用 default 参数来指定自定义的序列化方法。

这些方法使得你能够在 Python 中方便地操作 JSON 数据，处理 API 返回的数据、保存配置文件等。

发布者：myrgd，转载请注明出处：https://www.object-c.cn/4494

Like (0)

0 0

关于作者

myrgd

207 文章

0 评论

14 问题

0 粉丝

这个人很懒，什么都没有留下～

开源AI大模型工作神器Flowise本地部署与远程访问教程

Previous 2024年11月24日下午1:45

在 Ubuntu 20.04 上安装 CUDA (Compute Unified Device Architecture) 支持 NVIDIA GPU 的加速计算

Next 2024年11月24日下午2:31

python

PHM技术：一维信号时序全特征分析（统计域/频域/时域）信号处理

PHM（Prognostics and Health Management，预测与健康管理）技术中的一维信号时序特征分析，旨在从信号中提取与设备健康状态相关的多种特征。以下是针对统计域、频域和时域特征分析的详细介绍和常见方法。 1. 时域特征分析时域特征直接从原始信号提取，描述信号的统计特性或时间行为。这些特征反映信号的幅值、变化趋势和波形形状。1.1 常用…

myrgd
2024年11月28日
000
python

用python 通过 OAuth2 获取 Outlook 邮箱收件箱的步骤如下

通过 OAuth2 获取 Outlook 邮箱收件箱的步骤如下。我们将使用 Microsoft Graph API，它是访问 Microsoft 365 服务（包括 Outlook 邮箱）的推荐方法。 1. 创建 Azure 应用程序在 Azure 门户中，创建一个应用以获取必要的 OAuth2 凭据。 2. 配置 Python 项目安装必要库：必要配…

myrgd
2024年11月24日
000
java

在使用 Kettle 9.1 连接 MySQL 时，遇到错误提示 Connection failed. Verify all connection parameters and confirm that the appropriate driver is installed.

在使用 Kettle 9.1 连接 MySQL 时，遇到错误提示 Connection failed. Verify all connection parameters and confirm that the appropriate driver is installed. 通常是由于以下几个原因导致的： 1. MySQL 驱动未正确配置Kettle 需要…

myrgd
2024年11月27日
000
数据库

Redis 一个高性能的内存数据存储系统

Redis 缓存详解 Redis 是一个高性能的内存数据存储系统，广泛用于缓存和会话存储。它支持多种数据结构（如字符串、哈希、列表、集合、有序集合等），使其非常适合用于缓存策略的实现。下面将详细解释 Redis 缓存中常见的问题和解决方案，涵盖性能优化、缓存失效、缓存穿透、缓存雪崩、缓存击穿等常见缓存问题。 1. 缓存穿透缓存穿透指的是查询的数据根本不…

myrgd
2024年11月23日
000
数据库

Redis 实现分布式锁详解

分布式锁用于解决分布式系统中多个进程或线程同时访问共享资源时的数据一致性问题。Redis 是实现分布式锁的一个高效工具，因为其性能高、支持单线程操作以及丰富的原子操作。以下是 Redis 实现分布式锁的完整教程。一、分布式锁的基本要求二、使用 Redis 实现分布式锁 1. 加锁（SET 命令实现原子操作） Redis 提供的 SET 命令可以用来实现分…

myrgd
2024年11月23日
000
数据库

2024 最新 Git 的安装与使用教程

Git 是一个免费的分布式版本控制系统，是现代开发中必不可少的工具。以下是最新的 Git 安装与使用教程，涵盖了从安装到基础使用的全部内容。一、Git 安装 1. Windows 系统（1）下载安装（2）安装步骤（3）验证安装打开命令行窗口（如 cmd 或 PowerShell），输入以下命令：输出类似以下内容则表示安装成功： 2. macOS …

myrgd
2024年11月23日
000
开源技术

在 Neo4j 中存储 Liquidity Structure（的层次和关联结构)

在 Neo4j 中存储 Liquidity Structure（流动性结构）的层次和关联结构时，可以使用其图数据库的特性：节点（Node）表示实体，关系（Relationship）表示这些实体之间的连接。流动性结构通常涉及多层次的实体（如母公司、子公司、账户、资金池等）及其关联关系。以下是具体实现步骤： 1. 设计数据模型节点类型：实体层次（Hierarc…

myrgd
2024年12月2日
000
后端开发

在 .NET 8 框架中使用 Web API 项目并通过引用 SqlSugar ORM 来操作数据库

在 .NET 8 框架中使用 Web API 项目并通过引用 SqlSugar ORM 来操作数据库，可以遵循以下步骤： 1. 准备工作确保已安装 .NET 8 SDK 和 SqlSugar NuGet 包。创建或打开现有的 Web Core API 项目。安装 SqlSugar NuGet 包： 2. 配置 SqlSugar在 Web API 项目中配置 …

myrgd
2024年11月27日
000
python

Python 3.10 最新版本下载安装指南（2024）

Python 3.10 是一个稳定且功能强大的 Python 版本，支持多种新特性，如模式匹配（match/case）等。以下是 Python 3.10 最新版本的下载安装步骤。 1. 下载 Python 3.10 官方地址 2. 安装步骤 Windows 安装如果显示 Python 3.10.x，说明安装成功。 MacOS 安装验证安装：应显示 Py…

myrgd
2024年11月21日
000
python

使用 Python Selenium 控制 Chrome 浏览器进行自动化操作

使用 Python Selenium 控制 Chrome 浏览器进行自动化操作是 Web 自动化测试和爬虫的常用方法之一。以下是一个完整的入门教程，包括如何安装、配置以及一些示例代码。 1. 安装所需环境 1.1 安装 Selenium 使用 pip 安装 Selenium： 1.2 下载 ChromeDriver 1.3 配置 ChromeDriver …

myrgd
2024年11月25日
000
python

2024最新版 Anaconda 安装方法

Anaconda 是一个非常流行的数据科学与机器学习平台，包含 Python、常用库、以及环境管理工具 Conda。以下是 2024 年最新版 Anaconda 的安装步骤。 1. 下载 Anaconda 下载地址 2. 安装步骤 Windows 系统 MacOS 系统 Linux 系统打开终端，定位到下载目录：运行安装脚本：执行安装脚本：许可协议：…

myrgd
2024年11月21日
000
python

在Python中的Numpy库下载与安装教程

Python 的 Numpy 库下载与安装（超详细教程） NumPy 是 Python 中一个非常强大的科学计算库，特别适用于处理大规模的数组、矩阵计算以及执行高效的数学操作。无论是机器学习、数据分析还是科学计算，NumPy 都是基础工具之一。下面是关于如何下载和安装 NumPy 的详细教程，包括在不同操作系统上的安装方法。 1. 确认环境与准备工作在开…

myrgd
2024年11月25日
000
python

使用 Python 和 PyHive 连接 Hive 数据库需要安装相关依赖并配置好 Hive 服务

使用 Python 和 PyHive 连接 Hive 数据库需要安装相关依赖并配置好 Hive 服务。以下是具体步骤：1. 安装依赖确保安装了以下库：PyHive：提供与 Hive 的交互。Thrift：支持 Hive 使用 Thrift 协议通信。Sasl：如果 Hive 使用 Kerberos 验证，需要安装此模块。Pyhive[Hive]：PyHive…

myrgd
2024年11月28日
000
python

python反爬-图像验证码与滑块验证码的跳过反selenium检测，动态ip等问题

针对反爬措施，Python可以使用以下策略来跳过图像验证码与滑块验证码、反检测Selenium，以及通过动态IP规避限制。这是一个分步说明： 1. 图像验证码的跳过与破解1.1 图像验证码处理对于简单的图像验证码，可以使用 OCR 技术直接识别验证码内容。常用库包括：Tesseract-OCR: 一款开源 OCR 工具。Pytesseract: Tesser…

myrgd
2024年11月28日
000
python

Python 变量类型和输入/输出相关运算符介绍

Python 是一种动态类型语言，变量类型由值决定，并且可以在运行时随时更改。在开发中，变量的操作与输入/输出息息相关，理解它们的运算符及常见用法非常重要。 1. Python 变量类型 Python 中变量不需要显式声明。以下是常见的变量类型和它们的特性：类型描述示例整数 (int) 用于存储整数，支持正负数和进制表示。 a = 10 浮点数 (f…

myrgd
2024年11月21日
000