之前我们已经把应用层http协议说完了,我们知道一些优秀的应用层协议会绑定知名端口号,就是说它们的端口号默认是固定的,比如http是80,https是443,ssh是22等,我们也可以通过查看下面的文件来查看知名端口号
cat /etc/services
并且我们还要知道端口号到进程是唯一的,就是说,一个进程可以绑定多个端口号,但是一个端口号只能被一个进程绑定
下面我们正式进入UDP
UDP 全称用户数据报协议(User Datagram Protocol)
下面是UDP的报文格式
我们说传输层协议是操作系统的一部分,所谓的协议在C语言中不过是结构体,我们可以在Linux内核源代码中看到相关结构体定义
也就是说报头占8个字节,这里的16位UDP长度指的是报头+正文的总长度(字节),16位表示的最大的数是2^16-1,也就是说UDP一次发送的报文长度是64kb-1,如果一次发送的数据超过这么多,sendto就会调用失败
一个很关键的问题就是UDP如何解包和分用,解包其实就是通过16位UDP长度,这个长度减去报头的八个字节其实就是报文的长度
并且根据目的端口号就可以向上交付给应用层的某个进程,如何通过端口号找到相对应的进程呢?我们可以认为OS为我们维护一张hash表,表中存着端口号到进程PCB的映射关系
UDP没有发送缓冲区,并且它也不需要,调用sendto时数据会直接交给内核,内核将数据交给下面的网络层进行后续的传输动作
但是UDP是有接收缓冲区的,但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致;并且如果缓冲区满了,再到达的UDP数据就会被丢弃
这也就是为什么UDP是不可靠的,当然我们不能把它看成一种缺点,而是一种特点,因为不可靠也就决定了它是比较简单的;如果要添加可靠性,那协议就会复杂,这样的协议叫做TCP
UDP的特点:
无连接:知道对端的IP和端口号就直接进行传输,不需要建立连接
不可靠:没有确认机制,没有重传机制;如果因为网络故障没有把信息发到对方,UDP协议层不会给应用层返回任何错误信息
面向数据报:发送方如何发,接收方就要如何收(调用多少次write,就要调用多少次read),不能够灵活的控制读写数据的次数和数量