当前位置:首页 > 文章列表 > 文章 > python教程 > Working with CSV, JSON, and Binary Files in Python

Working with CSV, JSON, and Binary Files in Python

来源:dev.to 2024-11-13 08:18:46 0浏览 收藏

今天golang学习网给大家带来了《Working with CSV, JSON, and Binary Files in Python》,其中涉及到的知识点包括等等,无论你是小白还是老手,都适合看一看哦~有好的建议也欢迎大家在评论留言,若是看完有所收获,也希望大家能多多点赞支持呀!一起加油学习~

Working with CSV, JSON, and Binary Files in Python

在这个博客系列中,我们将探索如何在 python 中处理文件,从基础知识开始,逐步进展到更高级的技术。

在本系列结束时,您将对 python 中的文件操作有深入的了解,使您能够有效地管理和操作文件中存储的数据。

该系列将由五篇文章组成,每篇文章都建立在上一篇文章的知识之上:

  • python 文件处理简介:读写文件
  • 使用不同的文件模式和文件类型
  • 在 python 中处理大文件和文件操作
  • 使用上下文管理器和异常处理来实现稳健的文件操作
  • (本文)高级文件操作:使用 csv、json 和二进制文件

到目前为止,在 python 文件处理系列中,我们已经介绍了读写文件、处理大文件以及通过上下文管理器和异常处理确保稳健的文件操作的基础知识。

最后一篇文章将探讨高级文件操作,重点关注 csv、json 和二进制文件等常见格式。

这些格式广泛用于数据交换和存储,掌握如何使用它们将为您提供在 python 中有效处理各种文件类型的工具。


使用 csv 文件

csv(逗号分隔值)文件通常用于存储表格数据,例如电子表格或数据库。

python 通过内置的 csv 模块使处理 csv 文件变得容易,该模块提供了读取和写入 csv 文件的功能。

读取 csv 文件

要读取 csv 文件,我们使用 csv.reader() 函数,该函数返回一个读取器对象,可以迭代该对象来访问文件中的行。

示例:读取 csv 文件

import csv

# open the csv file for reading
with open('data.csv', 'r') as file:
    reader = csv.reader(file)

    # iterate through each row in the csv
    for row in reader:
        print(row)

在此示例中,我们使用上下文管理器打开 csv 文件,并使用 csv.reader() 逐行读取它。

每一行都作为值列表返回,从而可以轻松处理数据。

读取带标题的 csv 文件

如果您的 csv 文件有标题,您可以使用 csv.dictreader() 函数将每一行作为字典访问,其中键是列标题。

import csv

# open the csv file with headers
with open('data_with_headers.csv', 'r') as file:
    reader = csv.dictreader(file)

    # iterate through each row, accessing values by column name
    for row in reader:
        print(f"name: {row['name']}, age: {row['age']}")

在这种情况下,dictreader() 函数将 csv 的第一行视为标题,允许您通过标题名称引用列。

写入 csv 文件

写入 csv 文件同样简单。

csv.writer() 函数创建一个 writer 对象,允许您将行写入文件。

示例:写入 csv 文件

import csv

# data to write to csv
data = [
    ["name", "age", "occupation"],
    ["alice", 30, "engineer"],
    ["bob", 25, "designer"],
    ["charlie", 35, "teacher"]
]

# open a csv file for writing
with open('output.csv', 'w', newline='') as file:
    writer = csv.writer(file)

    # write each row of data
    writer.writerows(data)

在此示例中,我们使用 writer.writerows() 将多行数据写入 csv 文件。

数据列表中的每个子列表代表 csv 中的一行。


使用 json 文件

json(javascript 对象表示法)是一种轻量级数据交换格式,易于人类阅读和编写,也易于机器解析和生成。

python 的 json 模块提供了读取和写入 json 文件的函数,使其成为处理结构化数据的通用格式。

读取 json 文件

在 python 中读取 json 文件就像使用 json.load() 函数一样简单,该函数将 json 数据转换为 python 数据结构(例如字典或列表)。

示例:读取 json 文件

import json

# open and read the json file
with open('data.json', 'r') as file:
    data = json.load(file)

# accessing json data as a python dictionary
print(data['name'])
print(data['age'])

在此示例中,我们将 json 数据加载到 python 字典中,并通过键访问各个元素。

写入 json 文件

要将python数据写入json文件,可以使用json.dump()函数。

该函数将 python 对象序列化为 json 格式的字符串并将其写入文件。

示例:写入 json 文件

import json

# data to write to json
data = {
    "name": "alice",
    "age": 30,
    "occupation": "engineer"
}

# open a json file for writing
with open('output.json', 'w') as file:
    json.dump(data, file, indent=4)

在此示例中,我们将 python 字典写入 json 文件。

indent=4 参数确保 json 输出的格式良好,并带有缩进,以提高可读性。


使用二进制文件

二进制文件以二进制格式存储数据,用于图像、音频、视频和序列化数据等非文本数据。

与文本文件不同,您需要以二进制模式('rb'、'wb')打开二进制文件才能读取或写入它们。

读取二进制文件

要读取二进制文件,您可以以“rb”模式打开它并以字节形式读取数据。

示例:读取二进制文件

# open the binary file for reading
with open('image.png', 'rb') as file:
    binary_data = file.read()

# print the first 10 bytes of the file
print(binary_data[:10])

在此示例中,我们以二进制模式打开一个图像文件并以字节形式读取其内容。

然后,您可以根据您的用例处理二进制数据(例如图像处理、音频处理)。

写入二进制文件

写入二进制数据同样简单。

您需要以“wb”模式打开文件并将数据以字节形式写入。

示例:写入二进制文件

# Binary data to write
binary_data = b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR'

# Open the binary file for writing
with open('output_image.png', 'wb') as file:
    file.write(binary_data)

在此示例中,我们将二进制数据写入文件,该文件可以是图像、音频或任何其他二进制格式的一部分。


结论

在这篇文章中,我们探索了 python 中的高级文件操作,重点是处理 csv、json 和二进制文件。

每种格式都有自己的用例,python 提供了简单的内置工具来帮助您有效地读取和写入这些文件类型。

  • csv:非常适合表格数据,并且可以使用 csv 模块轻松处理。
  • json:非常适合结构化数据,尤其是在使用 api 和 web 数据时。
  • 二进制文件:适用于图像、音频和视频等非文本数据,可以使用二进制模式处理。

通过这些技术,您现在可以在 python 中处理各种文件格式,使您的程序更加通用并能够处理各种数据。

感谢您关注 python 文件处理系列!

本篇关于《Working with CSV, JSON, and Binary Files in Python》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于文章的相关知识,请关注golang学习网公众号!

版本声明
本文转载于:dev.to 如有侵犯,请联系study_golang@163.com删除
1390 元,科幻世界《刘慈欣文集》(8 卷本) 亲笔签名限量版发售1390 元,科幻世界《刘慈欣文集》(8 卷本) 亲笔签名限量版发售
上一篇
1390 元,科幻世界《刘慈欣文集》(8 卷本) 亲笔签名限量版发售
Go 语言中 var a[2][]int 这种嵌套结构的类型是什么?
下一篇
Go 语言中 var a[2][]int 这种嵌套结构的类型是什么?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    151次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    144次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    158次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    154次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    161次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码