c++理论篇(一) ——浅谈tcp缓存与tcp的分包与粘包

ops/2024/10/18 20:20:41/

介绍

网络通讯中,Linux系统为每一个socket创建了接收缓冲区与发送缓冲区,对于TCP协议来说,这两个缓冲区是必须的.应用程序在调用send/recv函数时,Linux内核会把数据从应用进程拷贝到socket的发送缓冲区中,应用程序在调用recv/read函数时,内核把接收缓冲区中的数据拷贝到应用进程的接收缓冲区中.
在这里插入图片描述

我们也可以查看socke缓冲区的大小:

int bufsize=0;
socket_t optlen=sizeof(bufsize);
getsockopt(sockfd,SOL_SOCKET,SO_SNDBUF,&bufsize,(socklen_t*)&optlen); //获取发送缓冲区大小
cout<<"send buffer size:"<<bufsize<<endl; //打印getsockopt(sockfd,SOL_SOCKET,SO_RCVBUF,&bufsize,(socklen_t*)&optlen); //获取接收缓冲区大小
cout<<"recv buffer size:"<<bufsize<<endl; //打印

一些思考

  1. send函数会阻塞吗
    会,如果发送端的发送缓冲区与接收端的接收缓冲区已满,那么send函数会阻塞,直到缓冲区有空闲位置。

  2. 向socket发送数据后,如果关闭socket,对端会接收到数据吗
    会,因为socket缓冲区是双向的,发送端和接收端都会缓冲数据

Nagle算法

前言

在TCP协议中,无论发送多少数据,都要在数据前面加上协议头,同时,对方收到数据后,也需要回复ACK表示确认。为了尽可能的利用网络带宽,TCP希望每次都能够以MSS(Maximum Segment Size,最大报文长度)的数据块来发送数据。

Nagle算法的目的

Nagle算法就是为了尽可能发送大块的数据,避免网络中充斥着小数据块。

Nagle算法的工作原理

Nagle算法的定义是:任意时刻,最多只能有一个未被确认的小段,小段是指小于MSS的数据块,未被确认是指一个数据块发送出去后,没有收到对端回复的ACK。
举个例子:发送端调用send()函数将一个int型数据(称之为A数据块)写入到socket中,A数据块会被马上发送到接收端,接着,发送端又调用send()函数写入一个int型数据(称之为B数据块),这时候,A块的ACK没有返回(已经存在了一个未被确认的小段),所以B块不会立即被发送,而是等A块的ACK返回之后(大概40ms)才发送。

ACK延迟机制

TCP协议中不仅仅有Nagle算法,还有一个ACK延迟机制:当接收端收到数据之后,并不会马上向发送端回复ACK,而是延迟40ms后再回复,它希望在40ms内接收端会向发送端回复应答数据,这样ACK就可以和应答数据一起发送,把ACK捎带过去。

Nagle的缺点与解决方案

如果TCP连接的一端启用了Nagle算法,另一端启用了ACK延时机制,而发送的数据包又比较小,则可能会出现这样的情况:发送端在等待上一个包的ACK,而接收端正好延迟了此ACK,那么这个正要被发送的包就会延迟40ms。
解决方案
开启TCP_NODELAY选项,这个选项的作用就是禁用Nagle算法

#include <netinet/tcp.h>   // 注意,要包含这个头文件。
int opt = 1;   
setsockopt(sockfd, IPPROTO_TCP, TCP_NODELAY,&opt,sizeof(opt));

对时效要求很高的系统,例如联机游戏、证券交易,一般会禁用Nagle算法

Tcp的分包与粘包

  • 分包:tcp报文的大小缺省是1460字节,如果发送缓冲区中的数据超出了1460字节,那么Tcp将会拆分多个包来发送,如果接收方及时从接收缓冲区中取走了数据,看起来就像是接收了多个报文。

  • 粘包:tcp接收到数据后,有序的放在缓冲区中,由于数据与数据之间不存在分隔符的说法,如果接收方没有及时的从缓冲区中取走数据,看起来就会和粘起来一样。

解决方案

为了解决上述出现的问题,我们对发送报文与接收报文的方式进行了修改。

  • 发送端:先发送报文长度,再发送报文内容。
  • 服务端:先接收报文长度,再接收报文内容。

结语

这一篇文章主要是为下一篇网络编程的服务端与客户端编写做一个引子,介绍一些有关网络编程的基本知识,因为下一篇文章将会给大家介绍在c++网络编程中有关服务端与客户端的编写,本文只做一些理论介绍,大家下篇见!


http://www.ppmy.cn/ops/20773.html

相关文章

AI自动生成PPT文档 aippt的API介绍文档

官方链接直达&#xff01; 产品介绍​ 能力介绍​ AiPPT 是一款智能生成演示幻灯片的在线工具。专业设计团队打造海量模板资源&#xff0c;输入标题即可轻松生成完整的PPT。同时 AiPPT 支持导入多格式文档一键生成 PPT&#xff0c;让 PPT 创作更加高效。聚焦于内容&#xff0…

变频器基础原理

文章目录 0. 基本知识1.三相的电压之和为02.正弦交流相量的相量表示法(相量只是表示正弦量&#xff0c;而不等于正弦量 &#xff1b;只有正弦量才能用相量表示)引入相量表示法目的:一种正弦量的产生方式:正弦量的相量表示&#xff0c;使用欧拉公式表示复数 3.用复数表示正弦量&…

排序3——C语言

排序 1. 归并排序2. 计数排序3. 各排序的稳定性及复杂度 1. 归并排序 归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。 思路&#xff1a;将已有序的子序列合并&#xff0c;得到完全有序的序列&#xff1b;即先使每个子序列有序&am…

【数据结构6--图】

目录 1 图2 图的定义和基本概念&#xff08;在简单图范围内&#xff09;3 图的类型定义4 图的存储结构4.1 邻接矩阵 表示法4.2 邻接表 表示法4.3 十字链表 表示法4.4 邻接多重表 表示法 5 图的遍历5.1 深度优先搜索-DFS 及 广度优先遍历-BFS 6 图的应用6.1 最小生成树6.1.1 克鲁…

Quarto Dashboards 教程 1:Overview

「写在前面」 学习一个软件最好的方法就是啃它的官方文档。本着自己学习、分享他人的态度&#xff0c;分享官方文档的中文教程。软件可能随时更新&#xff0c;建议配合官方文档一起阅读。推荐先按顺序阅读往期内容&#xff1a; 1.quarto 教程 1&#xff1a;Hello, Quarto 2.qu…

盲人使用公共设施:科技助力无障碍出行与智能识别

在我们的日常生活中&#xff0c;公共设施扮演着不可或缺的角色&#xff0c;它们为人们提供了便利的服务&#xff0c;构建起和谐、高效的社会环境。然而&#xff0c;对于视障人士而言&#xff0c;尽管公共设施设计之初便考虑到通用性和包容性&#xff0c;实际使用过程中仍难免遭…

数据结构 : 树的分类及在数据库索引中的运用

文章目录 一 &#xff1a;树的分类1、二叉树&#xff08;Binary Tree&#xff09;&#xff1a;2、二叉搜索树&#xff08;Binary Search Tree, BST&#xff09;&#xff1a;3、平衡二叉树&#xff1a;4、字典树&#xff08;Trie&#xff09;&#xff1a;5、多叉树&#xff08;M…

【NLP】大语言模型基础之GPT

大语言模型基础之GPT GPT简介1. 无监督预训练2. 有监督下游任务微调 GPT-4体系结构1. GPT-4的模型结构2. GPT-4并行策略3. GPT-4中的专家并行GPT-4的特点 参考连接 以ELMo为代表的动态词向量模型开启了语言模型预训练的大门&#xff0c;此后&#xff0c;出现了以GPT和BERT为代表…