【ProtoBuf】protobuf序列化协议

news/2025/2/13 6:40:32/

Protobuf介绍

Protobuf (Protocol Buffers) 是谷歌开发的一款无关平台,无关语言,可扩展,轻量级高效的序列化结构的数据格式,用于将自定义数据结构序列化成字节流,和将字节流反序列化为数据结构。所以很适合做数据存储和为不同语言,不同应用之间互相通信的数据交换格式,只要实现相同的协议格式,即后缀为proto文件被编译成不同的语言版本,加入各自的项目中,这样不同的语言可以解析其它语言通过Protobuf序列化的数据。目前官方提供c++,java,go等语言支持。

下面表格是支持语言的列表及各个语言的插件

支持语言很多,C++ java python php golang 等

Protobuf应用场景

对于protobuf的使用场景,简单来说,业务要求命中其优点越多,缺点越少,就更能够使用Protobuf,比如说在某些场景对消息大小很敏感,或者传输的数据量不大,比如说APP登录场景,那么可以考虑使用Protobuf

选择序列化协议需要考虑哪些

  • 序列化之后的数据流的大小(占用网络带宽),对于高并发的场景下这点很重要。
  • 序列化和反序列化的性能(占用CPU和内存资源)。
  • 是否支持多语言。

常见数据交互格式对比

  • JSON (JavaScript Object Notation):一般用于WEB项目中,因为浏览器对JSON格式的数据支持非常好,大部分编程语言有很多内建函数支持,而且JSON几乎支持所有编程语言。
  • XML:XML在WebService中的应用比较多,相比于JSON,它的数据更加冗余,因为需要成对的闭合标签,而JSON使用了键值对的方式,不仅压缩了一定的数据空间,同时也有更好的可读性。
  • Protobuf:谷歌公司新开发的一种数据格式,适合高性能,对响应速度有要求的数据传输场景。因为Protobuf是二进制数据格式,需要编码和解码。数据本身不具有可读性,因此只能反序列化得到可读数据。

相对于其他数据格式Protobuf的优势:

  • 序列化后体积比JSON和XML小,适合网络传输。
  • 序列化反序列化速度快,比JSON的处理速度快。
  • 消息格式升级和兼容性还不错。

Protobuf的序列化与反序列化.

  • 序列化:将数据结构或者对象转化成二进制串的过程。
  • 反序列化:将序列化过程中所产生的二进制串转换成数据结构或对象的过程。

Protobuf的优点和缺点

优点:

  • Protobuf序列化速度快,序列化后的体积比xml更小,传输更快。使用相对也简单,因为Proto编译器能自己序列化和反序列化。
  • 可以定义自己的数据结构,然后使用代码生成器去生成的代码来读写这个数据结构,甚至可以在不用重新部署的情况下来更新这个数据结构,只需要使用Protobuf对数据结构进行一次描述,就可以利用不同的语言或者从不同的数据流对你的结构化数据轻松的读写。
  • 向后兼容性好,不需要破坏旧的数据格式,依靠老的数据格式的程序就可以对数据结构更新。
  • 语义比xml更加清晰,无需类似xml解析器的东西(因为Protobuf编译器会将.proto文件编译成对应的数据访问用以对Protobuf数据进行序列化和反序列化操作)。
  • 跨平台,跨语言,可扩展性好。
  • 维护成本比较低,多个平台只需要维护一套.proto对象协议文件。
  • 加密性好。

缺点:

  • Protobuf功能简单,无法用来表示复杂的概念。
  • 相比xml,xml具有某种程度的自解释性,因为最终是转成二进制流,不像xml和json能够直接查看明文。

那么为什么不直接使用XML

同XML相比,Protobuf的优势在于高性能,它以高效的二进制存储方式比XML小3到10倍,快20到100倍,原因在于:

  • ProtoBuf序列化后所生成的二进制消息非常紧凑。
  • ProtoBuf封解包过程非常简单。

protobuf对传输的数据采取一种最简单的key-value形式的存储方式(但其中有一种类型的数据不是k-v形式,后面会讲),这钟存储方式极大的节省了空间。除此之外protobuf还采取了varint(变长编码)形式来压缩数据,对体积较小的字段分配较少的空间,由此使得压缩后的文件非常“紧凑”。

Protobuf语法

要想使用Protobuf就需要先定义proto文件,先熟悉protobuf消息定义的相关语法。

1. 定义消息类型

syntax = "proto3";message SendRequest {string query = 1;int32 page_number = 2;repeated int32 result_per_page = 3;
}

.proto文件的第一行指定了使用proto3语法,说明使用的是proto3版本。如果省略protocol buffer编译器就默认使用proto2语法。他必须是文件中非空非注释行的第一行。

message表示消息类型,可以有多个。

SendRequest定义中指定了三个字段(name/value键值对),每个字段都会有名称和类型。

repeated是字段规则。

Protobuf各个语言标量类型对应关系

一个标量消息字段可以含有一个如下类型,下面表格定义了在.proto文件中的类型,以及与之对应在自动生成访问类中定义类型。
在这里插入图片描述

2. 定义字段的规则

message的字段必须符合以下规则:

singular:一个遵循singular规则的字段,在一个结构良好的message消息体(编码后的message)可以有0或1个该字段(但是不可以有多个)。这是proto3语法的默认字段规则。(这个理解起来有些晦涩,举例来说上面例子中三个字段都是singular类型的字段,在编码后的消息体中可以有0或者1个query字段,但不会有多个。)

repeated:遵循repeated规则的字段在消息体重可以有任意多个该字段值,这些值的顺序在消息体重可以保持(就是数组类型的字段)

3. 添加更多消息类型

在单个.proto文件中可以定义多个message,这在定义多个相关message时非常有用。比如说,我们定义SendRequest对应的响应messageSendResponse,把它加到之前的.proto文件中。

syntax = "proto3";message SendRequest {string query = 1;int32 page_number = 2;repeated int32 result_per_page = 3;
}message SendResponse {...
}

4. 添加注释

.proto文件中的注释和C,C++的注释风格相同,使用// 和 /* … */

syntax = "proto3";message SendRequest {string query = 1;         // 查询int32 page_number = 2;    // 页码repeated int32 result_per_page = 3;   //分页数
}

5. message支持嵌套使用

message SendResponse {message Result {string url = 1;string title = 2;repeated string snippets = 3;}repeated Result results = 1;
}

6.使用其它消息类型

可以将其它消息类型作为字段的类型,如下,有多个message中都包含Person类型,此时就可以在相同的.proto文件定义一个Person类型,然后在需要用到的message中指定一个Person字段。

message Personinfo {repeated Person info = 1;
}
message Person {string name = 1;int32 age = 2;repeated int32 weight = 3;
}

上面也可以嵌套在一起写

message Personinfo {message Person {string name = 1;int32 age = 2;repeated int32 weight = 3;}repeated Person info = 1;
}

如果想在它的父消息类型外部重用这个消息类型,可以使用Personinfo.Person的方式

message PersonMessage {Personinfo.Person info = 1
}

7. 定义服务(Service)

如果想将消息类型用在RPC系统中,可以在.proto文件中定义一个RPC服务接口,protobuf编译器会根据所选择语言生成对应语言的服务接口代码及存根。例如定义一个RPC服务并具有一个方法,该方法能够接受SearchRequest并返回一个SearchResponse,此时就可以在.proto文件进行如下定义:

service SearchService {//rpc(rpc关键字) 服务函数名  (传入参数) 返回(返回参数)rpc  Search (SearchRequest) returns (SearchResponse) ;
}

gRPC就是使用Protobuf的一个RPC系统,gRPC在使用Protobuf时候非常有效。

Protobuf是如何工作的

.proto文件是protobuf一个重要的文件,它定义了需要序列化数据的结构,当protobuf编译器(protoc)来运行.proto文件时候,编译器将生成所选择的语言的代码,比如你选择go语言,那么就会将.proto转换成对应的go语言代码,对于go来说,编译器会为每个消息类型生成一个pd.go文件,而C++会生成一个.h文件和一个.cc文件。

使用protobuf的3个步骤是:

  • 在.proto文件中定义消息格式。
  • 用protobuf编译器编译.proto文件。
  • 用C++/Java/go等对应的protobuf API来写或者读消息。

在.proto文件定义消息,message是.proto文件最小的逻辑单元,由一系列name-value键值对构成。下面的.proto文件定义了一个"人"的消息:

message Person {required string name = 1;required int32 id = 2;optional string email = 3;enum PhoneType {MOBILE = 0;HOME = 1;WORK = 2;}message PhoneNumber {required string number = 1;optional PhoneType type = 2 [default = HOME];}repeated PhoneNumber phone = 4;
}

message消息包含一个或多个编号唯一的字段,每个字段由字段限制,字段类型,字段名和编号四部分组成,字段限制分为:optional(可选的)、required(必须的)以及repeated(重复的)。定义好消息后,使用ProtoBuf编译器生成C++对应的.h和.cc文件,源文件提供了message消息的序列化和反序列化等方法


http://www.ppmy.cn/news/173014.html

相关文章

联想计算机配置在哪里,联想笔记本电脑配置有哪些 买笔记本时如何查看其配置...

买笔记本电脑比买台式机更注重它的配置,我们在购买的时候也是根据自己的实际需求来选择电脑的配置情况来参考的,配置是比品牌更重要的选择,那么联想笔记本电脑配置有哪些呢?买笔记本时又是如何查看它的配置呢? 一、联想笔记本电脑配置有哪些…

联想微型计算机快捷键,联想笔记本电脑快捷键大全

现在电脑已经是生活必不可缺少的电子产品之一,无论学习还是办公都不可缺少。笔记本电脑给我们带来方便高效的办公,最大的优点就是携带方便,无论外出都可以自如办公,在笔记本的使用上,很多电脑小白不懂一些笔记本使用技…

如何查看笔记本电脑的型号?

WinR,输入:“dxdiag”,查看“系统型号”,如图:

笔记本型号分类解释大全

系列: A系列一般定位为为纯粹高性能的机型,忽略重量和外观的因素,同时将售价控制到很低的水平。如A8Jm,高性能但外壳采用ABS 。学生同志很喜欢。嘿嘿。。 M系列:定位于主流商用。性能先进,同时兼顾便携性。…

联想IdeaPad系列笔记本型号详细解读

2008年,联想顺利完成了ideaPad和ThinkPad两个子品牌的融合,令旗下的笔记本产品线规划变得更为清晰,即 ideaPad定位于消费类市场,ThinkPad定位于商用市场。 如果您想购买一款时尚、漂亮的家用笔记本,经常需要用它来看电影、玩游戏,那么应该在ideaPad系列中挑选。但面对众彩…

联想(lenovo)笔记本的型号解析

联想 ( lenovo ) 笔记本 的型号解析 目前联想笔记本以ideaPad和ThinkPad两大系列为主体,其中ideaPad面向家庭用户,注重个性时尚与影音娱乐,ThinkPad面向办公人士,注重安全稳定和高效耐用。此外,…

排序算法、HashMap原理以及单例模式

文章目录 1、二分查找2、冒泡排序3、选择排序4、插入排序5、希尔排序6、快速排序(面试写这个)7、ArrayList8、Iterator9、LinkedList10、HashMap10.1、基本数据结构底层数据结构,1.7和1.8有什么不同? 10.2、树化与退化为何要用红黑…

大湾区C++模拟题

大湾区信息学创新大赛模拟题 一、单项选择题(15题共30分) 1.计算机的运算速度取决于给定的时间内,它的处理器所能处理的数据量。处理器一次能处理的数据量叫字长。已知64位奔腾处理器一次能处理64个信息,相当于( A …