首页 > 其他分享 >图解I/O中的零拷贝技术

图解I/O中的零拷贝技术

时间:2024-03-16 19:59:05浏览次数:21  
标签:DMA 拷贝到 技术 内核 缓冲区 拷贝 图解 CPU

什么是零拷贝?

        零拷贝是一种计算机系统中的 I/O 优化技术,它的核心思想是在数据传输过程中尽可能地减少或完全避免 CPU 将数据从一个存储区域复制到另一个存储区域的操作,从而减少了上下文切换和 CPU 拷贝时间,提高了系统的性能和效率。在 Java 领域,诸如 Netty、Kafka、RocketMQ 等框架就使用了零拷贝技术来提高性能和效率,尤其在处理大规模数据传输时表现突出。

什么是 DMA 技术?

        直接内存访问(Direct Memory Access 技术。简单理解就是,在进行 I/O 设备和内存的数据传输的时候,数据搬运的工作全部交给 DMA 控制器,而 CPU 不再参与任何与数据搬运相关的事情,这样 CPU 就可以去处理别的事务

传统I/O是如何操作的?

read(file, tmp_buf, len);
write(socket, tmp_buf, len);

        期间共发生了 4 次用户态与内核态的上下文切换,因为发生了两次系统调用,一次是 read() ,一次是 write(),每次系统调用都得先从用户态切换到内核态,等内核完成任务后,再从内核态切换回用户态。

其次,还发生了 4 次数据拷贝,其中两次是 DMA 的拷贝,另外两次则是通过 CPU 拷贝的:

  • 第一次拷贝,把磁盘上的数据拷贝到操作系统内核的缓冲区里,这个拷贝的过程是通过 DMA 搬运的。
  • 第二次拷贝,把内核缓冲区的数据拷贝到用户的缓冲区里,于是我们应用程序就可以使用这部分数据了,这个拷贝到过程是由 CPU 完成的。
  • 第三次拷贝,把刚才拷贝到用户的缓冲区里的数据,再拷贝到内核的 socket 的缓冲区里,这个过程依然还是由 CPU 搬运的。
  • 第四次拷贝,把内核的 socket 缓冲区里的数据,拷贝到网卡的缓冲区里,这个过程又是由 DMA 搬运的。

bd8cb556fdfa42059dfd7dfdd50b879c.png

那零拷贝的方案有哪些呢?

1、Mmap+Write

        在前面我们知道,read() 系统调用的过程中会把内核缓冲区的数据拷贝到用户的缓冲区里,于是为了减少这一步开销,我们可以用 mmap() 替换 read() 系统调用函数。

buf = mmap(file, len);
write(sockfd, buf, len);

  mmap() 系统调用函数会直接把内核缓冲区里的数据「映射」到用户空间,这样,操作系统内核与用户空间就不需要再进行任何的数据拷贝操作。

具体过程如下:

  1. 应用进程调用了 mmap() 后,DMA 会把磁盘的数据拷贝到内核的缓冲区里。接着,应用进程跟操作系统内核「共享」这个缓冲区;
  2. 应用进程再调用 write(),操作系统直接将内核缓冲区的数据拷贝到 socket 缓冲区中,这一切都发生在内核态,由 CPU 来搬运数据;
  3. 最后,把内核的 socket 缓冲区里的数据,拷贝到网卡的缓冲区里,这个过程是由 DMA 搬运的。

d15c9f711f0a4fe1a3cac241e6f23ff1.png

我们可以得知,通过使用 mmap() 来代替 read(), 可以减少一次数据拷贝的过程。

但这还不是最理想的零拷贝,因为仍然需要通过 CPU 把内核缓冲区的数据拷贝到 socket 缓冲区里,而且仍然需要 4 次上下文切换,因为系统调用还是 2 次。

2、SendFile

在 Linux 内核版本 2.1 中,提供了一个专门发送文件的系统调用函数 sendfile(),函数形式如下:

#include <sys/socket.h>
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

它的前两个参数分别是目的端和源端的文件描述符,后面两个参数是源端的偏移量和复制数据的长度,返回值是实际复制数据的长度。

首先,它可以替代前面的 read() 和 write() 这两个系统调用,这样就可以减少一次系统调用,也就减少了 2 次上下文切换的开销。

其次,该系统调用,可以直接把内核缓冲区里的数据拷贝到 socket 缓冲区里,不再拷贝到用户态,这样就只有 2 次上下文切换,和 3 次数据拷贝。如下图:

9c83230e5ed84fe7b9717924997e9388.png

        但是这还不是真正的零拷贝技术,如果网卡支持 SG-DMA(The Scatter-Gather Direct Memory Access)技术(和普通的 DMA 有所不同),我们可以进一步减少通过 CPU 把内核缓冲区里的数据拷贝到 socket 缓冲区的过程。

具体过程如下:

  • 第一步,通过 DMA 将磁盘上的数据拷贝到内核缓冲区里;
  • 第二步,缓冲区描述符和数据长度传到 socket 缓冲区,这样网卡的 SG-DMA 控制器就可以直接将内核缓存中的数据拷贝到网卡的缓冲区里,此过程不需要将数据从操作系统内核缓冲区拷贝到 socket 缓冲区中,这样就减少了一次数据拷贝;

a4dc47710d2d44fe806ad89af7bb74c1.png

        这就是所谓的零拷贝(Zero-copy)技术,因为我们没有在内存层面去拷贝数据,也就是说全程没有通过 CPU 来搬运数据,所有的数据都是通过 DMA 来进行传输的。

总结:

I/O操作数据拷贝次数上下文切换次数
传统I/O2次CPU拷贝,2次DMA拷贝4
Mmap+Write1次CPU拷贝,2次DMA拷贝4
SendFile1次CPU拷贝,2次DMA拷贝2
SendFile + 支持 SG-DMA1次DMA拷贝,1次SG-DMA拷贝2

        零拷贝技术的文件传输方式相比传统文件传输的方式,减少了 2 次上下文切换和数据拷贝次数,只需要 2 次上下文切换和数据拷贝次数,就可以完成文件的传输,而且 2 次的数据拷贝过程,都不需要通过 CPU,2 次都是由 DMA 来搬运。

所以,总体来看,零拷贝技术可以把文件传输的性能提高至少一倍以上

ps:以下是我整理的java面试资料,感兴趣的可以看看。最后,创作不易,觉得写得不错的可以点点关注!

链接:https://www.yuque.com/u39298356/uu4hxh?# 《Java面试宝典》 

标签:DMA,拷贝到,技术,内核,缓冲区,拷贝,图解,CPU
From: https://blog.csdn.net/qq_53281187/article/details/136753556

相关文章

  • Docker与containerd:容器技术的双璧
    ......
  • WiFi的WPA3安全技术
    WiFi安全加密的演进下图所示,当前最新的加密方式是WPA3。WPA3对现有网络提供了全方位的安全防护,增强了公共网络、家庭网络和802.1X企业网的安全性。 WPA3的核心为对等实体同时验证方式(SimultaneousAuthenticationofEquals,SAE),即通信双方利用本地私钥和对方传输的公钥......
  • “成像光谱遥感技术中的AI革命:ChatGPT应用指南“
    遥感技术主要通过卫星和飞机从远处观察和测量我们的环境,是理解和监测地球物理、化学和生物系统的基石。ChatGPT是由OpenAI开发的最先进的语言模型,在理解和生成人类语言方面表现出了非凡的能力。本文重点介绍ChatGPT在遥感中的应用,人工智能在解释复杂数据、提供见解和帮助决策过......
  • 数据爬取与可视化技术——urllib、XPath、lxml案例爬取新浪股票吧
    shy:数据爬取与可视化技术系列已发文三篇了,更多爬虫技术请查看专栏文章。数据爬取与可视化技术——使用urllib库爬取网页获取数据数据爬取与可视化技术——使用XPath和lxml库爬取、解析、提取数据shy:现已开辟专栏四个:C++、ACM、数据库系统概论、数据爬取与可视化技术,更多......
  • 网络安全等级保护2.0自查表 | 技术部分
    等保2.0自查表,技术部分,参考标准:GB∕T22239-2019《信息安全技术网络安全等级保护基本要求》GB∕T28448-2019《信息安全技术网络安全等级保护测评要求》等保2.0自查表技术部分范围控制点检查项三级要求二级要求安全物理环境物理位置选择a)机房场地应......
  • 基本技术指标 Python 实现
    布林带SharpCharts计算*MiddleBand=20-daysimplemovingaverage(SMA)*UpperBand=20-daySMA+(20-daystandarddeviationofpricex2)*LowerBand=20-daySMA-(20-daystandarddeviationofpricex2)点击这里下载此电子表格示例。")布林......
  • 实时数据传输的新里程——Server-Sent Events(SSE)消息推送技术
    目录一、背景介绍二、SSE场景案例三、工作原理    3.1SSE工作流程    3.2工作原理一、背景介绍    传统的请求模型是客户端发送一个请求到服务端,然后服务端做相应的处理,然后再将结果返回给客户端,这种“一问一答”的方式随着时间的推移并不......
  • 论IT技术人员嘴笨
        相信大家看到这个标题,会觉得我们技术人员是懒得和产品、销售等扯淡。产品谈卖点、产品力、行业规模、开发投入、预期产出、开发周期和里程碑计划等项目信息,这恰恰是上层领导最关心的事,人是感性动物,上层领导不了解实际技术实现及难度,他所得到的信息都是产品汇总汇报给他......
  • 技术开发者如何在工作中做出成绩?
    技术开发者如何在工作中做出成绩?  https://new.qq.com/rain/a/20240229A06JM2001、正确认识目标与方向,一个短期利益,一个长期价值;2、技术视野,远远不够,那只是信息输入与想法修正的过程;3、回到系统中思考,哪里只有专业,更少的信息喧嚣;4、技术应该如何被应用,持续思考技术的延展性;......
  • RAG 范式、技术和趋势
    这里分享同济大学HaofenWang的关于检索增强生成的报告:《Retrieval-AugmentedGeneration(RAG):Paradigms,Technologies,andTrends》,RAG范式、技术和趋势。RAG概述为什么会有RAG,主要是缘于LLM的一些不足:幻觉过时的信息参数化知识效率低缺乏专业领域的深入知识......