当前位置:首页 > 文章列表 > 文章 > python教程 > Python处理Protobuf与序列化技巧

Python处理Protobuf与序列化技巧

2025-08-13 11:06:46 0浏览 收藏

在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是文章学习者,那么本文《Python操作Protobuf及序列化方法》就很适合你!本篇内容主要包括##content_title##,希望对大家的知识积累有所帮助,助力实战开发!

Protobuf文件设计应预留字段、使用oneof和repeated关键字、添加版本注释以增强扩展性;处理兼容性问题需保持字段编号不变、避免删除字段、合理使用optional和enum的allow_alias;Protobuf相比JSON具有体积小、解析快的优势,但可读性差,因此更适合高性能要求的内部服务通信和数据存储场景,而JSON更适合配置文件和对外API等需高可读性的场景。

Python如何操作Protobuf?protobuf序列化

Protobuf (Protocol Buffers) 是一种轻便高效的结构化数据存储格式,特别适合做数据交换协议和数据存储。Python 操作 Protobuf 核心在于定义 .proto 文件,然后使用 Protobuf 编译器生成 Python 代码,最后在 Python 代码中使用生成的类进行序列化和反序列化。

protobuf序列化

首先,你需要安装 Protobuf 编译器 protoc 和 Python 的 Protobuf 库。

# 安装 protobuf 编译器 (例如在 Ubuntu 上)
sudo apt-get update
sudo apt-get install protobuf-compiler

# 安装 Python protobuf 库
pip install protobuf

假设我们有一个简单的 .proto 文件,描述一个 Person 对象:

// person.proto
syntax = "proto3";

package example;

message Person {
  string name = 1;
  int32 id = 2;
  string email = 3;
}

接下来,使用 protoc 编译器生成 Python 代码:

protoc --python_out=. person.proto

这会在当前目录下生成 person_pb2.py 文件,其中包含了 Person 类的定义。

现在,可以在 Python 代码中使用这个类进行序列化和反序列化了:

import person_pb2

# 创建一个 Person 对象
person = person_pb2.Person()
person.name = "John Doe"
person.id = 123
person.email = "john.doe@example.com"

# 序列化
serialized_data = person.SerializeToString()
print(f"Serialized data: {serialized_data}")

# 反序列化
new_person = person_pb2.Person()
new_person.ParseFromString(serialized_data)

print(f"Name: {new_person.name}, ID: {new_person.id}, Email: {new_person.email}")

这就是一个基本的操作流程。

Protobuf 文件应该如何设计才能更好地适应未来的需求变化?

设计 Protobuf 文件时,考虑未来的扩展性至关重要。 一个好的策略是预留一些字段,即使当前用不到。例如,可以添加一些编号较高的字段,并附上注释说明“Reserved for future use”。 另外,使用 oneof 关键字可以处理互斥字段的情况,避免不必要的字段同时存在。 同时,尽量使用 repeated 关键字来表示列表,即使当前列表只有一个元素,也方便未来扩展为多个元素。 版本控制也很重要,可以考虑在 .proto 文件中加入版本号注释,方便追踪变更历史。 例如,可以这样写: // Version: 1.0

如何处理 Protobuf 序列化中的兼容性问题?

Protobuf 的设计目标之一就是保持向后兼容性。 当你修改 .proto 文件时,只要遵循一些规则,就可以保证新旧代码可以互相解析。 最重要的是,不要修改已有的字段编号,也不要删除已有的字段。 如果需要修改字段类型,要确保新的类型可以兼容旧的类型。 例如,将 int32 改为 int64 是安全的,但反过来则可能导致数据丢失。 可以使用 optional 关键字来添加新的字段,这样旧的代码在解析新的消息时,会忽略这些未知的字段。 另外,可以使用 enum 类型来表示枚举值,并添加 allow_alias 选项,允许不同的枚举值使用相同的编号。 例如:

enum Status {
  option allow_alias = true;
  OK = 0;
  PENDING = 1;
  RUNNING = 1; // RUNNING 和 PENDING 具有相同的编号
}

Protobuf 与 JSON 相比,有哪些优缺点?在什么场景下更适合使用 Protobuf?

Protobuf 和 JSON 都是常用的数据序列化格式,但它们各有优缺点。 Protobuf 的优点是体积小、解析速度快,因为它采用二进制格式存储数据,并且使用了高效的编码算法。 JSON 的优点是可读性好,易于调试,因为它是文本格式,可以直接用文本编辑器打开查看。 另外,JSON 的生态系统非常完善,很多编程语言都提供了内置的 JSON 解析库。 Protobuf 更适合对性能要求较高的场景,例如网络传输、数据存储等。 JSON 更适合对可读性要求较高的场景,例如配置文件、API 接口等。 一个常见的场景是,内部服务之间使用 Protobuf 进行数据交换,而对外提供的 API 使用 JSON 格式。 这样既可以保证内部服务的性能,又可以方便外部开发者使用。

好了,本文到此结束,带大家了解了《Python处理Protobuf与序列化技巧》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!

span内联元素怎么设置?span标签使用方法span内联元素怎么设置?span标签使用方法
上一篇
span内联元素怎么设置?span标签使用方法
JavaScript闭包保存角色状态技巧
下一篇
JavaScript闭包保存角色状态技巧
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    162次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    155次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    166次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    165次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    173次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码