RTMP协议分析

embedded/2024/10/21 6:16:41/

理论

总体介绍

        RTMP协议是应⽤层协议,是要靠底层可靠的传输层协议(通常是TCP)来保证信息传输的可靠性的。在基于传输层协议的链接建⽴完成后,RTMP协议也要客户端和服务器通过“握⼿”来建⽴基于传输层链接之上的RTMP Connection链接,在Connection链接上会传输⼀些控制信息,如SetChunkSize,SetACKWindowSize。其中CreateStream命令会创建⼀个Stream链接,⽤于传输具体的⾳视频数据和控制这些信息传输的命令信息。RTMP协议传输时会对数据做⾃⼰的格式化,这种格式的消息我们称之为RTMP Message,⽽实际传输的时候为了更好地实现多路复⽤、分包和信息的公平性,发送端会把Message划分为带有Message ID的Chunk,每个Chunk可能是⼀个单独的Message,也可能是Message的⼀部分,在接受端会根据chunk中包含的data的⻓度,message id和message的⻓度把chunk还原成完整的Message,从⽽实现信息的收发。

     介绍

       RTMP(Real Time Messaging Protocol)是一个应用层协议,主要用于 在Flash player和服务器之间传输视频、音频、控制命令等内容。 该协议的突出优点是: 低延时。RTMP基于TCP, 默认使用端口1935。

RTMP 的主要特点如下:

  1. 实时性强:

    • RTMP 采用 TCP 作为传输层协议,可以提供更可靠的实时数据传输。
    • 通过分块传输和优先级控制等机制,可以最大限度地减少传输延迟。
  2. 可靠性高:

    • RTMP 建立在 TCP 之上,能够保证数据传输的可靠性。
    • 支持重传机制来弥补丢包对实时性的影响。
  3. 支持多种媒体格式:

    • RTMP 可以传输 FLV、MP3、H.264 等常见的视频和音频格式。
    • 还支持 ActionScript 对象等数据格式的传输。
  4. 广泛应用:

    • RTMP 被广泛应用于直播、视频点播、在线教育等领域。
    • 主要被 Adobe Flash/AIR 平台和 NGINX 服务器所支持。

总之, RTMP 是一种专门为实时流媒体传输而设计的开放协议,具有高实时性、高可靠性和多格式支持等特点,是当前互联网视频直播和点播领域的重要技术标准之一。

名词解释

为了方便后续阅读,先学习主要的名词解释:
1. Payload: 数据包中包含的数据,例如音频样本或压缩视频数据。
2. Packet: 由固定的头部和载荷数据组成的数据包。
3. Port: 传输协议用于区分主机内部多个目的地的抽象。 
4. Transport address: 网络地址和端口的组合,标识传输层端点。
5. Message stream/stream id: 消息流动的逻辑通信通道。
6. Message stream ID: 每个消息都有一个ID,用于标识消息所属的消息流。
7. Chunk (块): 消息的一个片段,消息被分成较小的部分并交错发送。
8. Chunk stream(块流): 允许块在特定方向流动的逻辑通信通道。
9. Chunk stream ID: 每个块都有一个ID,用于标识块所属的块流。
10. Multiplexing: 将独立的音频/视频数据合成为一个连贯的音频/视频流的过程。
11. DeMultiplexing: 多路复用的反向过程,将交错的音频和视频数据组装成原始的音频和视频数据。
12. Remote Procedure Call (RPC): 允许客户端或服务器调用对端子程序或过程的请求。
13. Metadata: 对数据的描述,如电影标题、时长、创作日期等。
14. Application Instance: 客户端连接的服务器上的应用程序实例。
15. Action Message Format (AMF): 用于序列化ActionScript对象图的紧凑二进制格式。

RTMP播放基本流程

往后我们通过wireshark抓包方式,来检验。

 Step 1:tcp三次握手

Step 2:rtmp握⼿

 RTMP握手主要分为: 简单握手和复杂握手

简单握手

建⽴⼀个有效的RTMP Connection链接,⾸先要“握⼿”:客户端要向服务器发送C0,C1,C2(按序)三个 chunk,服务器向客户端发送S0,S1,S2(按序)三个chunk,然后才能进⾏有效的信息传输。

RTMP协议的实现者需要保证这⼏点:

客户端要等收到S1之后才能发送C2
客户端要等收到S2之后才能发送其他信息(控制信息和真实⾳视频等数据)
服务端要等到收到C0之后发送S1
服务端必须等到收到C1之后才能发送S2
服务端必须等到收到C2之后才能发送其他信息(控制信息和真实⾳视频等数据)

 实际实现中为了在保证握⼿的身份验证功能的基础上尽量减少通信的次数,⼀般的发送顺序是这样的,这⼀点可以通过wireshark抓ffmpeg推流包进⾏验证

握手包分析

Time (4 bytes): 这个字段包含一个时间戳,这个时间戳应该被用作此端点发送的所有未来块的时间戳的起点
Zero (4 bytes): 这个字段必须全为 0。
Random data (1528 bytes): 这个字段可以包含任何任意值。由于每个端点都必须区分它发起的握手的响应和它的对等端发起的握手,因此这些数据应该足够随机。但不需要加密安全的随机性或动态值。 

交互流程

复杂握手

复杂握手主要是增加了更严格的验证。
主要是将简单握手中1528Bytes随机数的部分平均分成两部分,一部分764Bytes存储public key(公共密钥),另一部分764Bytes存储digest(密文,32字节)。
另外, 复杂握手还有一个明显的特征就是: Version部分不为0,服务器端可根据这个来判断是否简单握手或复杂握手。

 Step 3: connect(连接)

这里也叫连接,连接的是什么呢? 这里必须明白RTMP中一个很重要的概念: Application Instance。连接的是rtmp://192.168.126.129/live/36
其中live就是Application Instance(sport, music)不同的 Application Instance可根据功能等进行区分,比如直播可以用live来表示,点播回放可以用vod来表示。
播放该流时,connect的地址就是rtmp://192.168.126.129/live/36

 流程

客户端发送 connect 命令消息给服务器:这个命令消息包含一些连接参数,如应用程序名称、客户端版本、认证信息等。

服务器处理 connect 命令:服务器验证客户端提供的连接参数是否有效。如果验证通过,服务器会建立一个新的 NetConnection 对象,并返回一个 _result 响应给客户端。
这个 _result 响应包含一些连接元数据,如服务器版本、服务器时间等信息。
客户端处理服务器的 _result 响应:客户端可以根据 _result 响应中的信息,确认连接是否成功建立。

 Step 4: createStream(创建流)

 创建逻辑通道createStream命令用于创建逻辑通道,该通道用于传输视频、音频、
metadata。

在服务器的响应报文中会返回 ,用于唯一的标示该Stream。
注:Message ID和Stream ID的区别

客户端发送 createStream 命令消息给服务器:它的作用是在服务器端创建一个新的消息流。
服务器处理 createStream 命令:服务器会创建一个新的 NetStream 对象,并返回一个 _result 响应给客户端。这个 _result 响应包含了新创建的 NetStream 对象的流 ID。
客户端处理服务器的 _result 响应:客户端接收到服务器的 _result 响应后,就获得了新创建流的流 ID。客户端可以使用这个流 ID 来标识后续发送到服务器的消息流。

举例可看出返回的Stream ID为1。后续的视频或音频的Stream ID就是1 

 

 Step 5: play(播放)

客户端发送play命令来播放指定流。开始传输音视频数据。
如果发送play命令后想要立即播放,需要清空play队列中的其它流,并将reset置为true。
 

Step 6: deleteStream(删除流) 

删除指定Stream ID的流。服务器不用对这条命令发送响应报文。

 小结

以上简述了rtmp的交互逻辑,具体详细的包字段可查阅官方文档。

RTMP层次 (数据角度)

RTMP层次 (数据发送角度)

 RTMP层次 (数据接收角度)


 

小结

通过上述,我们已经知道了将flv格式数据进行封包成rtmp格式,将数据传输到对端。对端通过解包方式得到flv格式数据。后续我们将讨论flv如何进行传输的。

扩展阅读

RTMP 传输分析-CSDN博客

 学习资料分享

0voice · GitHub


http://www.ppmy.cn/embedded/129196.html

相关文章

如何将LiDAR坐标系下的3D点投影到相机2D图像上

将激光雷达点云投影到相机图像上做数据层的前融合,或者把激光雷达坐标系下标注的物体点云的3d bbox投影到相机图像上画出来,都需要做点云3D点坐标到图像像素坐标的转换计算,也就是LiDAR 3D坐标转像素坐标。 看了网上一些文章都存在有错误或者…

【微信小程序_17_生命周期】

摘要:本文介绍了小程序的生命周期,包括生命周期的定义、分类、生命周期函数等内容。生命周期分为应用生命周期和页面生命周期,生命周期函数由小程序框架提供,会按次序自动执行,开发人员可利用这些函数在特定时间点执行操作,如在页面加载时初始化数据。 微信小程序_17_生命…

Centos7升级到openssh9.9

openssh9.9 是2024.9.20出的最新版ssh。因为客户扫描出一大堆centos7的漏洞,全是这个openssh的,好多补丁,所以索性升级到最新版。 需要自己制作rpm包,这个我是不懂,照这个来: Linux服务器升级openssh9.9最…

Lua变量

软考鸭微信小程序 过软考,来软考鸭! 提供软考免费软考讲解视频、题库、软考试题、软考模考、软考查分、软考咨询等服务 Lua是一种轻量级的脚本语言,以其简单、高效和易于嵌入的特性而广受欢迎。在Lua中,变量是存储数据的容器,可以存储不同类型…

深入理解C语言中的时间统计

1. 引言 在计算机科学中,理解和测量程序的运行时间对于优化性能至关重要。C语言提供了多种工具来帮助开发者进行时间统计。本文旨在提供一个全面而深入的理解框架,使读者能够有效地利用这些工具。 2. 时间表示与获取 C语言中使用time_t类型来表示时间…

【从零开发Mybatis】引入XNode和XPathParser

引言 在上文,我们发现直接使用 DOM库去解析XML 配置文件,非常复杂,也很不方便,需要编写大量的重复代码来处理 XML 文件的读取和解析,代码可读性以及可维护性相当差,使用起来非常不灵活。 因此&#xff0c…

Spring Boot:中小型医院网站开发新选择

3 系统分析 3.1 可行性分析 通过对本基于Spring Boot的中小型医院网站实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、操作可行性、经济可行性和时间可行性四方面进行分析。 3.1.1 技术可行性 本基于Spring Boot的中小型…

01.单例模式设计思想

01.单例模式设计思想 目录介绍 01.单例模式基础介绍 1.1 模式的动机1.2 单例模式特点1.3 单例模式定义1.4 单例使用场景1.5 单例模式思考 02.单例模式设计思考 2.1 为何要用单例2.2 处理资源访问冲突2.3 表示全局唯一类 03.如何实现单例模式 3.1 如何实现一个单例3.2 饿汉式实…