python protobuf

张

张建站

2026/5/5 13:46:34

10分钟阅读

好的我们从资深开发者的角度聊聊 Python 里的 Protocol Buffers简称 protobuf。这东西说白了就是一种结构化的数据序列化格式。现实生活里咱们要存个联系人信息通常用表格或卡片姓名、电话、邮箱。在程序里也得有类似的结构。你可能会想到 JSON写个{name: 张三, phone: 138...}清晰明了。Protobuf 干的也是这个事儿但方式不同——它先给你一套描述语言.proto 文件定义好数据的“骨架”然后通过编译器把这个描述翻译成各种编程语言包括 Python的源代码。这些代码里就包含了定义好的数据类以及把这个类转换成紧凑的二进制格式、或者从二进制格式还原回数据类的能力。那它能做什么呢核心价值就俩高效传输和跨语言沟通。想象一下你的 Python 后端服务需要跟一个用 Go 写的另一个服务交换数据。用 JSON双方都得写大量解析和验证代码而且 JSON 文本携带了大量冗余的结构信息比如键名phone反复出现网络传输时带宽消耗大解析时也要花时间。用了 protobuf你只需定义好.proto文件两边各自生成 Python 和 Go 的代码直接调用生成的序列化/反序列化函数底层就变成了一坨紧凑到极致的二进制数据。这坨数据小、传输快解析也几乎零开销。另外微服务间 gRPC 远程调用也是建立在 protobuf 上的用它定义接口和数据丝滑顺畅。具体怎么用呢得先建个文件比如addressbook.protosyntax proto3; message Person { string name 1; int32 id 2; string email 3; repeated string phone 4; // 可以多个电话 }定义好骨架后在终端执行protoc --python_out. addressbook.proto会生成addressbook_pb2.py。引入这个模块就可以像操作普通 Python 对象一样使用它了fromaddressbook_pb2importPerson pPerson()p.name李四p.id123p.emailliexample.comp.phone.append(138-4567-8901)# 序列化成二进制数据binary_datap.SerializeToString()# 反序列化回来p2Person()p2.ParseFromString(binary_data)print(p2.name)# 输出李四注意字段的赋值和访问方式非常像操作字典或对象但实际编译后的代码是精确定义的类效率高很多。不过有个小坑字符串默认是字节串bytes新版本proto3里string字段实际上是 Unicode与 Python 字符串无缝对接但处理二进制数据时用bytes类型会比较清晰。聊到最佳实践有几个经验之谈版本控制.proto文件是团队间的契约一定要纳入版本管理Git 等。修改 schema 时要小心兼容性——新增字段只能加optional或repeated不能随意改名或删字段最好用reserved关键字标记已废弃的字段编号避免未来误用。字段编号的艺术编号 1-15 占用 1 个字节16-2047 占用 2 个字节。频繁出现的字段用小的编号能压缩序列化后的体积。比如 ID 字段通常用 1。性能敏感场景尽量避免把map或repeated嵌套过多层序列化/反序列化时会产生大量临时对象。如果需要传输大量小消息可以考虑用stream模式gRPC 里很好用批量发送而不是用一个大消息包裹所有数据。避免全局字段定义消息时不要在每个字段后加default值proto3 已经去掉了而是用默认的零值空字符串、0、False。如果需要区分“未设置”和“零值”用wrapper类型如google.protobuf.Int32Value比较优雅不过会多两个字节的开销。最后跟同类技术比一比。最常联想到的是 JSON 和 MessagePack。JSON 的优势是人可读、调试方便但体积大、解析慢MessagePack 类似二进制 JSON也是键值对结构体积和速度比 JSON 好但缺少强类型检查容易因为拼写错误导致奇怪 bug。Protobuf 则牺牲了可读性二进制看不懂换来了极致的性能、超小的体积、强类型约束编译期就检查字段名和类型而且代码生成后调用非常规范团队协作时能减少很多心智负担。但代价是修改 schema 需要重新编译部署时要把新的.proto文件分发给所有依赖方不如 JSON 那样“热加载”。总的来说如果你的系统涉及跨语言调用、高性能数据传输、或者追求长期维护的稳定性Protobuf 是经得住考验的选择。要是只是个快速原型或者纯前端场景JSON 可能更方便。没有银弹看场景选工具就好。

TPFanCtrl2：掌握ThinkPad风扇控制的终极解决方案

TPFanCtrl2：掌握ThinkPad风扇控制的终极解决方案【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 TPFanCtrl2是一款专为ThinkPad笔记本电脑设计的开源风扇控…...

2026/5/5 13:46:08 阅读更多 →

3步终极攻略：从零开始用Happy Island Designer打造专业级岛屿规划

3步终极攻略：从零开始用Happy Island Designer打造专业级岛屿规划【免费下载链接】HappyIslandDesigner "Happy Island Designer (Alpha)"，是一个在线工具，它允许用户设计和定制自己的岛屿。这个工具是受游戏《动物森友会》(Anima…...

2026/5/5 13:43:50 阅读更多 →

OpenLDAP匿名访问惹的祸？手把手教你用cn=config.ldif和sssd.conf两步搞定安全加固

OpenLDAP匿名访问漏洞实战：从应急响应到安全加固全解析凌晨三点，手机突然响起刺耳的告警声——安全团队扫描发现生产环境的LDAP服务存在未授权访问漏洞。作为运维负责人，我瞬间清醒：这意味着任何人都能直接查询企业所有用户目录信…...

2026/5/5 13:42:59 阅读更多 →

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 上周，当我需要从百度网盘下载一个3GB的设计素材时…...

2026/5/5 6:11:25 阅读更多 →

构建Web3多智能体世界：从账户抽象到AI驱动的链上经济

1. 项目概述：一个由AI驱动的Web3多智能体世界EmpowerTours 是一个我深度参与构建的、运行在 Monad 区块链上的综合性 Web3 平台。它不仅仅是一个应用，更是一个持续运行的多智能体世界，并深度集成在 Farcaster 社交协议中，作为一个…...

2026/5/5 6:16:07 阅读更多 →

2026届最火的降AI率网站推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 需要从源头优化以及后期校正两方同时着手，来降低文本里AIGC也就是人工智能生成内…...

2026/5/5 4:22:03 阅读更多 →