首页 > 其他分享 >【转】值得一用的 IO 神器 Okio

【转】值得一用的 IO 神器 Okio

时间:2023-08-26 17:57:34浏览次数:38  
标签:Buffer segment 一用 next byteCount IO Okio Segment

IO 神器 Okio

官方 是这么介绍 Okio 的:

Okio is a library that complements java.io and java.nio to make it much easier to access, store, and process your data. It started as a component of OkHttp, the capable HTTP client included in Android. It’s well-exercised and ready to solve new problems.

重点是这一句它使访问,存储和处理数据变得更加容易,既然 Okio 是对 java.io 的补充,那是否比传统 IO 好用呢?

看下 Okio 这么使用的,用它读写一个文件试试:

    // OKio写文件 
    private static void writeFileByOKio() {
        try (Sink sink = Okio.sink(new File(path));
             BufferedSink bufferedSink = Okio.buffer(sink)) {
            bufferedSink.writeUtf8("write" + "\n" + "success!");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
    //OKio读文件
    private static void readFileByOKio() {
        try (Source source = Okio.source(new File(path));
             BufferedSource bufferedSource = Okio.buffer(source)) {
            for (String line; (line = bufferedSource.readUtf8Line()) != null; ) {
                System.out.println(line);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

从代码中可以看出,读写文件关键一步要创建出 BufferedSourceBufferedSink 对象。有了这两个对象,就可以直接读写文件了。

Okio为我们提供的 BufferedSink 和 BufferedSource 就具有以下基本所有的功能,不需要再串上一系列的装饰类

现在开始好奇Okio是怎么设计成这么好用的?看一下它的类设计:

在Okio读写使用中,比较关键的类有 Source、Sink、BufferedSource、BufferedSink。

Source 和 Sink

SourceSink 是接口,类似传统 IO 的 InputStreamOutputStream,具有输入、输出流功能。

Sourec 接口主要用来读取数据,而数据的来源可以是磁盘,网络,内存等。

public interface Source extends Closeable {
  long read(Buffer sink, long byteCount) throws IOException;
  Timeout timeout();
  @Override void close() throws IOException;
}

Sink 接口主要用来写入数据。

public interface Sink extends Closeable, Flushable {
  void write(Buffer source, long byteCount) throws IOException;
  @Override void flush() throws IOException;
  Timeout timeout();
  @Override void close() throws IOException;
}

BufferedSource 和 BufferedSink

BufferedSourceBufferedSink 是对 SourceSink 接口的扩展处理。Okio 将常用方法封装在 BufferedSource/BufferedSink 接口中,把底层字节流直接加工成需要的数据类型,摒弃 Java IO 中各种输入流和输出流的嵌套,并提供了很多方便的 api,比如 readInt()readString()

public interface BufferedSource extends Source, ReadableByteChannel {
  Buffer getBuffer();
  int readInt() throws IOException;
  String readString(long byteCount, Charset charset) throws IOException;
}
public interface BufferedSink extends Sink, WritableByteChannel {
  Buffer buffer();
  BufferedSink writeInt(int i) throws IOException;
  BufferedSink writeString(String string, int beginIndex, int endIndex, Charset charset)
      throws IOException;
}

RealBufferedSink 和 RealBufferedSource

上面的 BufferedSourceBufferedSink 都还是接口,它们对应的实现类就是 RealBufferedSinkRealBufferedSource 了。

final class RealBufferedSource implements BufferedSource {
  public final Buffer buffer = new Buffer();
  
  @Override public String readString(Charset charset) throws IOException {
    if (charset == null) throw new IllegalArgumentException("charset == null");
    buffer.writeAll(source);
    return buffer.readString(charset);
  }
  
  //...
}
final class RealBufferedSink implements BufferedSink {
  public final Buffer buffer = new Buffer();
  
  @Override public BufferedSink writeString(String string, int beginIndex, int endIndex,
      Charset charset) throws IOException {
    if (closed) throw new IllegalStateException("closed");
    buffer.writeString(string, beginIndex, endIndex, charset);
    return emitCompleteSegments();
  }
  //...
}

RealBufferedSourceRealBufferedSink 内部都维护一个 Buffer 对象。里面的实现方法,最终实现都转到 Buffer 对象处理。所以这个 Buffer 类可以说是 Okio 的灵魂所在。下面会详细介绍。

Buffer

Buffer 的好处是以数据块 SegmentInputStream 读取数据的,相比单个字节读取来说,效率提高了,是一种空间换时间的策略。

public final class Buffer implements BufferedSource, BufferedSink, Cloneable, ByteChannel {
  Segment head;
  @Override public Buffer getBuffer() {
    return this;
  }
  
  @Override public String readString(long byteCount, Charset charset) throws EOFException {
    checkOffsetAndCount(size, 0, byteCount);
    if (charset == null) throw new IllegalArgumentException("charset == null");
    if (byteCount > Integer.MAX_VALUE) {
      throw new IllegalArgumentException("byteCount > Integer.MAX_VALUE: " + byteCount);
    }
    if (byteCount == 0) return "";
    Segment s = head;
    if (s.pos + byteCount > s.limit) {
      // If the string spans multiple segments, delegate to readBytes().
      return new String(readByteArray(byteCount), charset);
    }
    String result = new String(s.data, s.pos, (int) byteCount, charset);
    s.pos += byteCount;
    size -= byteCount;
    if (s.pos == s.limit) {
      head = s.pop();
      SegmentPool.recycle(s);
    }
    return result;
  }
  //...
}

从代码中可以看出,这个 Buffer 是个集大成者,实现了 BufferedSinkBufferedSource 的接口,也就是意味着它同时具有读和写的功能。

Buffer 包含了指向第一个和最后一个 Segment 的引用,以及当前读写位置等信息。当进行读写操作时,Buffer 会在 Segment 之间移动,而不需要进行数据的实际拷贝。那 Segment ,又是什么呢?

final class Segment {
  //大小是8kb
  static final int SIZE = 8192;
  //读取数据的起始位置
  int pos;
  //写数据的起始位置
  int limit;
  //后继
  Segment next;
  //前继
  Segment prev;
  
  //将当前的Segment对象从双向链表中移除,并返回链表中的下一个结点作为头结点
  public final @Nullable Segment pop() {
    Segment result = next != this ? next : null;
    prev.next = next;
    next.prev = prev;
    next = null;
    prev = null;
    return result;
  }
  //向链表中当前结点的后面插入一个新的Segment结点对象,并移动next指向新插入的结点
  public final Segment push(Segment segment) {
    segment.prev = this;
    segment.next = next;
    next.prev = segment;
    next = segment;
    return segment;
  }
  //单个Segment空间不足以存储写入的数据时,就会尝试拆分为两个Segment
  public final Segment split(int byteCount) {
   //...
  }
  //合并一些邻近的Segment
  public final void compact() {
     
  }
}

poppush 方法可以看出 Segment 是一个双向链表的数据结构。一个 Segment 大小是 8kb。正是由于 Segment 使 IO 读写操作能如此高效。

Segment 紧密相关的还有一个 `SegmentPoll 。

final class SegmentPool {
  static final long MAX_SIZE = 64 * 1024;
  static @Nullable Segment next;
  
  //当池子里面有空闲的 Segment 就直接复用,否则就创建一个新的 Segment
  static Segment take() {
    synchronized (SegmentPool.class) {
      if (next != null) {
        Segment result = next;
        next = result.next;
        result.next = null;
        byteCount -= Segment.SIZE;
        return result;
      }
    }
    return new Segment(); // Pool is empty. Don't zero-fill while holding a lock.
  }
  //回收 segment 进行复用,提高效率
  static void recycle(Segment segment) {
    if (segment.next != null || segment.prev != null) throw new IllegalArgumentException();
    if (segment.shared) return; // This segment cannot be recycled.
    synchronized (SegmentPool.class) {
      if (byteCount + Segment.SIZE > MAX_SIZE) return; // Pool is full.
      byteCount += Segment.SIZE;
      segment.next = next;
      segment.pos = segment.limit = 0;
      next = segment;
    }
  }
}

SegmentPool 是一个缓存 Segment 的池,它有 64kb 大小也就是 8Segment 的长度。既然作为一个池,就和线程池的作用类似,为了复用前面被回收的 Segment。recycle() 方法的作用则是回收一个 Segment 对象。被回收的 Segment 对象将会被插入到 SegmentPool 中的单链表的头部,以便后面继续复用。

SegmentPool 的作用防止已申请的资源被回收,增加资源的重复利用,减少 GC,过于频繁的 GC 是会降低性能的

可以看到 Okio 在内存优化上下了很大的功夫,提升了资源的利用率,从而提升了性能。

总结

不仅如此,Okio还提供其他很有用的功能:

比如提供了一系列的方便工具

  • GZip的透明处理
  • 对数据计算md5、sha1等都提供了支持,对数据校验非常方便



作者:树獭非懒

链接:https://juejin.cn/post/6923902848908394510

标签:Buffer,segment,一用,next,byteCount,IO,Okio,Segment
From: https://www.cnblogs.com/jmcui/p/17640768.html

相关文章

  • Stable Diffusion web UI 部署详细教程
    前言本文使用AutoDL平台进行StableDiffusionwebUI云端部署AutoDL官网:[AutoDL算力云|弹性、好用、省钱。租GPU就上AutoDL]StableDiffusionwebUI官网:AUTOMATIC1111/stable-diffusion-webui:StableDiffusionwebUI(github.com)步骤租用实例选择社区镜像AUTOM......
  • 利用GitHub 的Actions自动同步gitee仓库,并Gitee Pages 自动部署项目
    Gitee同步GitHub仓库GitHub有时候访问速度慢,加载不了图片等问题。过程记录GitHub的Actions会处理.github下的工作流文件夹workflows。只要在g项目根目录下创建.github/workflows/,在这个文件夹里再创建Sync.yml文件,填入以下代码。当产生push操作就会自动同步gitee<divid="......
  • AI绘画StableDiffusion美女实操教程:斗破苍穹-小医仙
    之前分享过StableDiffusion的入门到精通教程:AI绘画:StableDiffusion终极炼丹宝典:从入门到精通但是还有人就问:安装是安装好了,可是为什么生成的图片和你生成的图片差距那么远呢?怎么真实感和质感一个天一个地呢?出图效果展示:那么,我画的图,和你画的图,差别在哪里呢?很关键的因素,就......
  • 2023.08.24T3 - brain - solution
    brainProblem给定一棵以\(1\)为根的树,给定树上所有点权与边权。记\(d(i,j)\)表示\(i\)到\(j\)的路径长度。定义一棵树的权值为:\[\sum\limits_{i=1}^{n-1}\sum\limits_{j=i+1}^{n}a_{i}a_{j}d(i,j)\]定义一次对点\(i\)的改造操作为:删掉\(i\)与其父节......
  • vue项目axios请求 解决跨域问题 2种方法
    前端添加vue.config.js文件 【【4k小白到全栈】进阶课好看登录页面Vue3+Ts+Pinia+Axios+VueRouyer+SpringBoot2.7+MybatisPlus前后端分离】https://www.bilibili.com/video/BV1x14y1Z74z?p=26&vd_source=da9319adec9f5f92ccc22db2f6108195 后端  response.setConte......
  • How to get the Axios's response file type All In One
    HowtogettheAxios'sresponsefiletypeAllInOne获取Axios请求响应头中的文件类型AxiosAPIhttps://www.npmjs.com/package/axiosdemosimportfsfrom'node:fs';importpathfrom'path';importaxiosfrom'axios';asyncfunctio......
  • ENVI+ERDAS实现Hyperion叶绿素含量反演:经验比值法、一阶微分法
    本文介绍基于ENVI与ERDAS软件,依据Hyperion高光谱遥感影像,采用经验比值法、一阶微分法等,对叶绿素含量等地表参数加以反演的具体操作。目录1前期准备与本文理论部分1.1几句闲谈1.2背景知识1.2.1Hyperion数据介绍1.2.2遥感图像分类方法1.2.3大气校正1.2.4反演算法2基于经验......
  • 玩转K8s + Istio
    K8S与Istio分工Istio介绍术语服务网格(ServiceMesh)用来描述组成应用程序的微服务网络以及它们之间的交互,它的核心思想就是Sidecar模式。Sidecar模式是一种将应用功能从应用本身剥离出来作为单独进程的设计模式,该模式允许我们向应用无侵入添加多种功能。通信的事情全部交给......
  • ssh连华为云的linux服务器报 WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!
    谜底啊,就藏在谜面上└─#sshuname@ip-p22@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@WARNING:REMOTEHOSTIDENTIFICATIONHASCHANGED!@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ITISPOSSIBLETHATSOMEONEISDOIN......
  • 使用Apache IoTDB进行IoT相关开发的架构设计与功能实现(9)
    降频聚合查询本节主要介绍下频聚合查询的相关示例,使用分组依据子句,用于根据用户给定的分区条件对结果集进行分区,并聚合分区的结果集。IoTDB支持根据时间间隔和自定义滑动步长对结果集进行分区,不小于时间间隔,未设置则默认等于时间间隔。默认情况下,结果按时间升序排序。还可以使用Jav......