kafka 的零拷贝原理

ops/2024/11/15 0:48:03/

在实际应用中,如果我们需要把磁盘中的某个文件内容发送到远程服务器上,那么它必须经过几个拷贝的过程。

  1. 从磁盘中读取目标文件内容拷贝到内核缓冲区
  2. CPU 控制器再把内核缓冲区的数据赋值到用户空间的缓冲区中
  3. 接着在应用程序中,调用 write()方法,把用户空间缓冲区中的数据拷贝到内核下的Socket Buffer中。
  4. 最后,把在内核模式下的 SocketBuffer 中的数据赋值到网卡缓冲区(NIC Buffer)5. 网卡缓冲区再把数据传输到目标服务器上。
    在这个过程中我们可以发现,数据从磁盘到最终发送出去,要经历 4 次拷贝,而在这四次拷贝过程中,有两次拷贝是浪费的,分别是:
  5. 从内核空间赋值到用户空间
  6. 从用户空间再次复制到内核空间
    除此之外,由于用户空间和内核空间的切换会带来 CPU 的上下文切换,对于CPU性能也会造成性能影响。
    而零拷贝,就是把这两次多余的拷贝省略掉,应用程序可以直接把磁盘中的数据从内核中直接传输给Socket,而不需要再经过应用程序所在的用户空间。
    咕泡科技出品,严禁商用
    零拷贝通过 DMA(Direct Memory Access)技术把文件内容复制到内核空间中的ReadBuffer,接着把包含数据位置和长度信息的文件描述符加载到 Socket Buffer 中,DMA 引擎直接可以把数据从内核空间中传递给网卡设备。
    在这个流程中,数据只经历了两次拷贝就发送到了网卡中,并且减少了2 次cpu 的上下文切换,对于效率有非常大的提高。
    所以,所谓零拷贝,并不是完全没有数据赋值,只是相对于用户空间来说,不再需要进行数据拷贝。对于前面说的整个流程来说,零拷贝只是减少了不必要的拷贝次数而已。在程序中如何实现零拷贝呢?
     在 Linux 中,零拷贝技术依赖于底层的 sendfile()方法实现
     在 Java 中,FileChannal.transferTo() 方法的底层实现就是 sendfile() 方法。除此之外,还有一个 mmap 的文件映射机制
    它的原理是:将磁盘文件映射到内存, 用户通过修改内存就能修改磁盘文件。使用这种方式可以获取很大的 I/O 提升,省去了用户空间到内核空间复制的开销。

http://www.ppmy.cn/ops/9619.html

相关文章

文心一言与GPT-4全面对比——人工智能语言模型的新纪元

随着人工智能领域的快速发展,各种高级语言模型相继问世,它们在文本生成、自然语言理解、对话系统等多个方面展示了惊人的能力。其中,最为瞩目的便是OpenAI发布的GPT-4和国内百度的文心一言。这两个模型都被设计用来处理复杂的语言理解和生成任…

Stable Diffusion模型介绍

在深度学习和人工智能领域,Stable Diffusion模型作为一项前沿技术,已经引起了广泛的关注。本文将深入探讨Stable Diffusion模型的种类、特点以及它们在不同场景下的应用。 1. CheckPoint模型 Checkpoint模型是Stable Diffusion系列中的主模型&#xff…

【C++ STL序列容器】array 数组

文章目录 【 1. 基本原理 】【 2. array 的创建 】2.1 不赋初值2.2 赋默认值2.3 赋指定值 【 3. array 的成员函数 】实例 【 1. 基本原理 】 array 是在 C 普通数组的基础上添加了一些成员函数和全局函数。在使用上,它 比普通数组更 安全,且效率并没…

r-tree 总结

R树是一种用于空间搜索的空间索引结构。它们特别适用于索引多维数据,尤其是在地理信息系统(GIS)和空间数据库中。R树(R-tree)是一种用于高维空间索引的数据结构,经常用于数据库和地理信息系统(GIS)中。下面是R树的总结: 基本概念:R树将空间对象组织成一个包含多个边界…

RTT设备驱动框架学习(CAN设备)

RTT设备框架属于组件和服务层,是基于RTT内核之上的上层软件。 设备框架是针对某一类外设,抽象出来的一套统一的操作方法及接入标准,可以屏蔽硬件差异,为应用层提供统一的操作方法。 RTT设备框架分为三层:设备驱动层、…

kubebuilder(2)创建项目及初始化

一个demo项目来了解kubebuilder的项目结构 初始化项目 mkdir demo-operator cd demo-operator kubebuilder init --domain demo.com --repo demo.com/tutorial 这一步创建了 Go module 工程基本的模板文件,引入了必要的依赖 如果不用--repo参数,也可…

七、Mock 模拟后端接口

1、安装:pnpm install -D vite-plugin-mock mockjs 2、vite.config.ts 配置文件启用插件。 // mock 插件提供的方法 import { viteMockServe } from vite-plugin-mockexport default defineConfig({plugins: [vue(),viteMockServe({mockPath: mock,enable: true,/…

Mysql基础知识学习总结

文章目录 一.数据库的相关概念二.关系模型的核心概念三.SQL分类四.SQL语句注释命令行连接Mysql客户端desc基本用法输出解释示例 show基本用法显示数据库列表显示当前数据库中的表显示表的列信息显示表的索引信息显示服务器状态和系统变量显示创建表的SQL语句显示当前的权限 sel…