首页 > 系统相关 >NIO效率高的原理之零拷贝与直接内存映射

NIO效率高的原理之零拷贝与直接内存映射

时间:2023-06-30 22:34:21浏览次数:38  
标签:NIO 映射 内核 缓冲区 拷贝 内存

零拷贝 零拷贝是指避免在用户态(User-space) 与内核态(Kernel-space) 之间来回拷贝数据的技术。 传统IO 传统IO读取数据并通过网络发送的流程,如下图       传统IO

  1. read()调用导致上下文从用户态切换到内核态。内核通过sys_read()(或等价的方法)从文件读取数据。DMA引擎执行第一次拷贝:从文件读取数据并存储到内核空间的缓冲区。
  2. 请求的数据从内核的读缓冲区拷贝到用户缓冲区,然后read()方法返回。read()方法返回导致上下文从内核态切换到用户态。现在待读取的数据已经存储在用户空间内的缓冲区。至此,完成了一次IO的读取过程。
  3. send()调用导致上下文从用户态切换到内核态。第三次拷贝数据从用户空间重新拷贝到内核空间缓冲区。但是,这一次,数据被写入一个不同的缓冲区,一个与目标套接字相关联的缓冲区。
  4. send()系统调用返回导致第四次上下文切换。当DMA引擎将数据从内核缓冲区传输到协议引擎缓冲区时,第四次拷贝是独立且异步的。
内存缓冲数据(上图中的read buffer和socket buffer ),主要是为了提高性能,内核可以预读部分数据,当所需数据小于内存缓冲区大小时,将极大的提高性能。
    添加图片注释,不超过 140 字(可选)   IO的内核切换 磁盘到内核空间属于DMA拷贝,用户空间与内核空间之间的数据传输并没有类似DMA这种可以不需要CPU参与的传输方式,因此用户空间与内核空间之间的数据传输是需要CPU全程参与的(如上图所示)。
DMA拷贝即直接内存存取,原理是外部设备不通过CPU而直接与系统内存交换数据
所以也就有了使用零拷贝技术,避免不必要的CPU数据拷贝过程。 NIO的零拷贝 NIO的零拷贝由transferTo方法实现。transferTo方法将数据从FileChannel对象传送到可写的字节通道(如Socket Channel等)。在transferTo方法内部实现中,由native方法transferTo0来实现,它依赖底层操作系统的支持。在UNIX和Linux系统中,调用这个方法会引起sendfile()系统调用,实现了数据直接从内核的读缓冲区传输到套接字缓冲区,避免了用户态(User-space) 与内核态(Kernel-space) 之间的数据拷贝。   ​ NIO零拷贝 使用NIO零拷贝,流程简化为两步:
  1. transferTo方法调用触发DMA引擎将文件上下文信息拷贝到内核读缓冲区,接着内核将数据从内核缓冲区拷贝到与套接字相关联的缓冲区。
  2. DMA引擎将数据从内核套接字缓冲区传输到协议引擎(第三次数据拷贝)。
内核态与用户态切换如下图:       NIO零拷贝的内核切换 相比传统IO,使用NIO零拷贝后改进的地方:
  1. 我们已经将上下文切换次数从4次减少到了2次;
  2. 将数据拷贝次数从4次减少到了3次(其中只有1次涉及了CPU,另外2次是DMA直接存取)。
如果底层NIC(网络接口卡)支持gather操作,可以进一步减少内核中的数据拷贝。在Linux 2.4以及更高版本的内核中,socket缓冲区描述符已被修改用来适应这个需求。这种方式不但减少上下文切换,同时消除了需要CPU参与的重复的数据拷贝。   ​   NIO 用户这边的使用方式不变,依旧通过transferTo方法,但是方法的内部实现发生了变化:
  1. transferTo方法调用触发DMA引擎将文件上下文信息拷贝到内核缓冲区。
  2. 数据不会被拷贝到套接字缓冲区,只有数据的描述符(包括数据位置和长度)被拷贝到套接字缓冲区。DMA 引擎直接将数据从内核缓冲区拷贝到协议引擎,这样减少了最后一次需要消耗CPU的拷贝操作。
NIO零拷贝适用于以下场景:
  1. 文件较大,读写较慢,追求速度
  2. JVM内存不足,不能加载太大数据
  3. 内存带宽不够,即存在其他程序或线程存在大量的IO操作,导致带宽本来就小
NIO的零拷贝代码示例
/**
 * filechannel进行文件复制(零拷贝)
 *
 * @param fromFile 源文件
 * @param toFile 目标文件
 */
public static void fileCopyWithFileChannel(File fromFile, File toFile) {
 try (// 得到fileInputStream的文件通道
 FileChannel fileChannelInput = new FileInputStream(fromFile).getChannel();
 // 得到fileOutputStream的文件通道
 FileChannel fileChannelOutput = new FileOutputStream(toFile).getChannel()) {

 //将fileChannelInput通道的数据,写入到fileChannelOutput通道
 fileChannelInput.transferTo(0, fileChannelInput.size(), fileChannelOutput);
 } catch (IOException e) {
 e.printStackTrace();
 }
}

static final int BUFFER_SIZE = 1024;
/**
 * BufferedInputStream进行文件复制(用作对比实验)
 *
 * @param fromFile 源文件
 * @param toFile 目标文件
 */
public static void bufferedCopy(File fromFile,File toFile) throws IOException {
 try(BufferedInputStream bis = new BufferedInputStream(new FileInputStream(fromFile));
 BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream(toFile))){
 byte[] buf = new byte[BUFFER_SIZE];
 while ((bis.read(buf)) != -1) {
 bos.write(buf);
 }
 }
}

 

在不需要进行数据文件操作时,可以使用NIO的零拷贝。但如果既需要IO速度,又需要进行数据操作,则需要使用NIO的直接内存映射。 直接内存映射 Linux提供的mmap系统调用, 它可以将一段用户空间内存映射到内核空间, 当映射成功后, 用户对这段内存区域的修改可以直接反映到内核空间;同样地, 内核空间对这段区域的修改也直接反映用户空间。正因为有这样的映射关系, 就不需要在用户态(User-space)与内核态(Kernel-space) 之间拷贝数据, 提高了数据传输的效率,这就是内存直接映射技术。 NIO的直接内存映射 JDK1.4加入了NIO机制和直接内存,目的是防止Java堆和Native堆之间数据复制带来的性能损耗,此后NIO可以使用Native的方式直接在 Native堆分配内存。
背景:堆内数据在flush到远程时,会先复制到Native 堆,然后再发送;直接移到堆外就更快了。 在JDK8,Native Memory包括元空间和Native 堆。
    ​   直接内存 直接内存的创建 在ByteBuffer有两个子类,HeapByteBuffer和DirectByteBuffer。前者是存在于JVM堆中的,后者是存在于Native堆中的。   ​   UML 申请堆内存
public static ByteBuffer allocate(int capacity) {
 if (capacity < 0)
 throw new IllegalArgumentException();
 return new HeapByteBuffer(capacity, capacity);
}

  

申请直接内存

public static ByteBuffer allocateDirect(int capacity) {
return new DirectByteBuffer(capacity);
}

  

使用直接内存的原因
  1. 对垃圾回收停顿的改善。因为full gc时,垃圾收集器会对所有分配的堆内内存进行扫描,垃圾收集对Java应用造成的影响,跟堆的大小是成正比的。过大的堆会影响Java应用的性能。如果使用堆外内存的话,堆外内存是直接受操作系统管理。这样做的结果就是能保持一个较小的JVM堆内存,以减少垃圾收集对应用的影响。(full gc时会触发堆外空闲内存的回收。)
  2. 减少了数据从JVM拷贝到native堆的次数,在某些场景下可以提升程序I/O的性能。
  3. 可以突破JVM内存限制,操作更多的物理内存。
当直接内存不足时会触发full gc,排查full gc的时候,一定要考虑。
使用直接内存的问题
  1. 堆外内存难以控制,如果内存泄漏,那么很难排查(VisualVM可以通过安装插件来监控堆外内存)。
  2. 堆外内存只能通过序列化和反序列化来存储,保存对象速度比堆内存慢,不适合存储很复杂的对象。一般简单的对象或者扁平化的比较适合。
  3. 直接内存的访问速度(读写方面)会快于堆内存。在申请内存空间时,堆内存速度高于直接内存。
直接内存适合申请次数少,访问频繁的场合。如果内存空间需要频繁申请,则不适合直接内存。 NIO的直接内存映射 NIO中一个重要的类:MappedByteBuffer——java nio引入的文件内存映射方案,读写性能极高。MappedByteBuffer将文件直接映射到内存。可以映射整个文件,如果文件比较大的话可以考虑分段进行映射,只要指定文件的感兴趣部分就可以。 由于MappedByteBuffer申请的是直接内存,因此不受Minor GC控制,只能在发生Full GC时才能被回收,因此Java提供了DirectByteBuffer类来改善这一情况。它是MappedByteBuffer类的子类,同时它实现了DirectBuffer接口,维护一个Cleaner对象来完成内存回收。因此它既可以通过Full GC来回收内存,也可以调用clean()方法来进行回收 NIO的直接内存映射的函数调用 FileChannel提供了map方法来把文件映射为内存对象: MappedByteBuffer map(int mode,long position,long size); 可以把文件的从position开始的size大小的区域映射为内存对象,mode指出了 可访问该内存映像文件的方式
  • READ_ONLY,(只读): 试图修改得到的缓冲区将导致抛出 ReadOnlyBufferException.(MapMode.READ_ONLY)
  • READ_WRITE(读/写): 对得到的缓冲区的更改最终将传播到文件;该更改对映射到同一文件的其他程序不一定是可见的。 (MapMode.READ_WRITE)
  • PRIVATE(专用): 对得到的缓冲区的更改不会传播到文件,并且该更改对映射到同一文件的其他程序也不是可见的;相反,会创建缓冲区已修改部分的专用副本。 (MapMode.PRIVATE)
使用参数-XX:MaxDirectMemorySize=10M,可以指定DirectByteBuffer的大小最多是10M。
直接内存映射代码示例
static final int BUFFER_SIZE = 1024;

/**
 * 使用直接内存映射读取文件
 * @param file
 */
public static void fileReadWithMmap(File file) {

 long begin = System.currentTimeMillis();
 byte[] b = new byte[BUFFER_SIZE];
 int len = (int) file.length();
 MappedByteBuffer buff;
 try (FileChannel channel = new FileInputStream(file).getChannel()) {
 // 将文件所有字节映射到内存中。返回MappedByteBuffer
 buff = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel.size());
 for (int offset = 0; offset < len; offset += BUFFER_SIZE) {
 if (len - offset > BUFFER_SIZE) {
 buff.get(b);
 } else {
 buff.get(new byte[len - offset]);
 }
 }
 } catch (IOException e) {
 e.printStackTrace();
 }
 long end = System.currentTimeMillis();
 System.out.println("time is:" + (end - begin));
}

/**
 * HeapByteBuffer读取文件
 * @param file
 */
public static void fileReadWithByteBuffer(File file) {

 long begin = System.currentTimeMillis();
 try(FileChannel channel = new FileInputStream(file).getChannel();) {
 // 申请HeapByteBuffer
 ByteBuffer buff = ByteBuffer.allocate(BUFFER_SIZE);
 while (channel.read(buff) != -1) {
 buff.flip();
 buff.clear();
 }
 } catch (IOException e) {
 e.printStackTrace();
 }
 long end = System.currentTimeMillis();
 System.out.println("time is:" + (end - begin));
}

  

 

标签:NIO,映射,内核,缓冲区,拷贝,内存
From: https://www.cnblogs.com/fcjedorfjoeij/p/17517941.html

相关文章

  • NIO效率高的原理之零拷贝与直接内存映射
    零拷贝零拷贝是指避免在用户态(User-space)与内核态(Kernel-space)之间来回拷贝数据的技术。传统IO传统IO读取数据并通过网络发送的流程,如下图传统IOread()调用导致上下文从用户态切换到内核态。内核通过sys_read()(或等价的方法)从文件读取数据。DMA引擎执行第一次拷贝:从文件读取......
  • Kotlin 集合 - 创建列表、集合和映射
    集合是保存多个相同或不同类型元素的容器。它们提供了各种方法和操作来有效地操纵和访问存储的数据。了解如何创建和使用集合对于任何Kotlin开发人员都至关重要,因为这使他们能够有效地组织和管理数据。列表列表是Kotlin中允许重复元素的有序集合。它们提供了根据元素在列表中的......
  • 一篇文章搞懂NIO效率高的原理
    NIO相比BIO的优势NIO(Non-blockingI/O,在Java领域,也称为NewI/O),是一种同步非阻塞的I/O模型,也是I/O多路复用的基础,已经被越来越多地应用到大型应用服务器,成为解决高并发与大量连接、I/O处理问题的有效方式。bio与nio面向流与面向缓冲JavaNIO和BIO之间第一个最大的区别是,BIO是面向流......
  • 一篇文章搞懂NIO效率高的原理
    NIO相比BIO的优势NIO(Non-blockingI/O,在Java领域,也称为NewI/O),是一种同步非阻塞的I/O模型,也是I/O多路复用的基础,已经被越来越多地应用到大型应用服务器,成为解决高并发与大量连接、I/O处理问题的有效方式。   bio与nio面向流与面向缓冲JavaNIO和BIO......
  • 光脚丫学LINQ(010):将内存中的对象转换为XML
    视频演示:http://u.115.com/file/f24db1fdfa 通过LINQ查询,可以轻松地在内存中的数据结构、SQL数据库、ADO.NET数据集和XML流或文档之间转换数据。下面的示例将内存中的数据结构中的对象转换为XML元素。List<Student>Students=newList<Student>(){newStudent{......
  • 数据在内存中的存放
    1.整形变量在内存中的存储原码、反码、补码计算机中整数都是以二进制进行存储的。其中有三种表示方法:原码,反码与补码。他们分为符号位、数值位两部分。计算机中存储的是补码形式。规定符号位用0表示正,用1表示负。原码:直接将二进制按照正负数的形式翻译成二进制即可。......
  • 内存分配与回收策略
    内存分配与回收策略对象的内存分配,就是在堆上分配(也可能经过JIT编译后被拆散为标量类型并间接在栈上分配),对象主要分配在新生代的Eden区上,少数情况下可能直接分配在老年代,分配规则不固定,取决于当前使用的垃圾收集器组合以及相关的参数配置。以下列举几条最普遍的内存分配规则......
  • 光脚丫学LINQ(041):使用对象关系设计器修改映射关系
    演示视频:http://u.115.com/file/f2b86d8eab演示重点此演示视频主要介绍了如何使用VS提供的【对象关系设计器】这个工具来建立实体类之间的关系。虽然此工具可以自动根据数据表之间的关系来建立起对象模型中实体类与实体类之间的关系。然而,默认情况下,它所建立的关系貌似都是清一色的......
  • 如果面试官问你:Redis 内存满了怎么办?
    Redis占用内存大小Redis的内存淘汰LRU算法LRU在Redis中的实现LFU算法问题Redis占用内存大小我们知道Redis是基于内存的key-value数据库,因为系统的内存大小有限,所以我们在使用Redis的时候可以配置Redis能使用的最大的内存大小。1、通过配置文件配置通过在Redis安装目录下面的redis.c......
  • Nacos占用内存的大文件有哪些?
    1、log文件:nacos2.1.0-beta\logs;没啥可说的,定期清理2、如图所示:data下的文件,可以删除,删除后重启会重新自动生成新的文件;定期清理  end......