首页 > 其他分享 >BufferedInputStream详解

BufferedInputStream详解

时间:2024-03-24 09:02:47浏览次数:21  
标签:文件 读取 BufferedInputStream int 详解 缓冲区 读取数据

  咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java之IO流啦,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好习惯,别被干货淹没了哦~

在这里插入图片描述

前言

  在进行Java编程时,避免不了要进行一些文件操作。虽然Java提供了很多类和方法来进行文件操作,但是由于I/O操作是比较费时的,所以我们需要考虑如何优化文件操作的效率。本文介绍了如何使用Java中的BufferedInputStream类来提高I/O操作的效率。

摘要

  本文主要介绍了如何使用Java中的BufferedInputStream类来优化I/O操作。首先介绍了BufferedInputStream类的作用和原理,然后分别从文件读取和文件写入两个角度,介绍了如何使用BufferedInputStream类来提高文件操作的效率。最后通过测试用例来验证了BufferedInputStream类的优化效果。

BufferedInputStream

简介

  BufferedInputStream是Java中的一个输入流,它实现了输入流的缓冲功能,使读取数据更加高效。当从一个InputStream中读取数据时,Java在内部会一次读取一个字节。这种方式读取数据的效率非常低,因为每次读取都需要和硬盘或网络进行IO操作,而这些操作非常耗时。因此,使用BufferedInputStream可以先将读取的数据缓存到内存中,在内存中慢慢读取,这样就可以减少IO操作的次数,提高读取数据的效率。在使用BufferedInputStream时,可以通过调用read()方法来读取数据,该方法会从缓冲区中读取数据,如果缓冲区中没有数据,则会调用底层流来读取数据。

作用和原理

  BufferedInputStream类是Java中的一个输入流缓冲器,它可以提高I/O操作的效率。BufferedInputStream类的原理是,当我们从文件中读取数据时,它会先将数据读入内存缓冲区中,然后再从缓冲区中逐个地读取数据。这样可以减少一些不必要的I/O操作,从而提高读取数据的效率。

优缺点

  BufferedInputStream是Java中的一个输入流包装类,它提供了输入流缓冲区的功能,可以提高读取数据的效率。

优点:

  1. 提供了输入流的缓冲功能,减少了底层输入流的读取次数。这种减少I/O操作的方式可以显著提高读取数据的性能,特别是在处理大量数据时。
  2. 具有预读的功能,可以一次性读取多个字节到缓冲区中,从而减少了对底层输入流的访问次数。
  3. 可以通过设置合适的缓冲区大小来优化读取性能,尤其是在连续读取大型数据块时。

缺点:

  1. 需要额外的内存空间来存储缓冲区,可能会占用较大的内存。
  2. 当读取数据量较小时,缓冲区的额外开销可能会引起性能下降。

应用场景

  1. 读取大文件或数据流时,使用BufferedInputStream可以提高读取性能。
  2. 在网络传输中,可以使用BufferedInputStream来缓冲输入流,减少网络I/O的次数,提高网络传输性能。
  3. 当需要连续读取大量数据块时,可以使用BufferedInputStream来将其存储在缓冲区中,减少对底层输入流的访问次数。

源码分析

  在BufferedInputStream的源码中,它维护了一个内部的字节数组缓冲区,默认缓冲区大小为8192字节(8KB)。当从BufferedInputStream中读取数据时,它会先检查缓冲区中是否还有可读取的数据,如果有,则直接从缓冲区中返回数据;如果没有,则从底层输入流中读取数据,并同时将读取的数据存入缓冲区中。在写入数据时也是类似的过程,先写入缓冲区,当缓冲区满或者需要刷新缓冲时,再将数据写入底层输出流。

  BufferedInputStream的源码比较复杂,涉及缓冲区的管理、数据读写等操作,通过内部的缓冲区来实现数据的快速读取和写入。在具体使用时,我们只需要关注使用API即可,无需深入理解其具体实现细节。

  由于BufferedInputStream主要的作用是在数据源和程序之间添加一个缓冲区,来提高IO操作的效率。读取数据时,BufferedInputStream先从缓冲区中读取,如果缓冲区中没有数据,则从数据源中读取一定量的数据放入缓冲区中,然后再从缓冲区中读取数据,这样就可以避免频繁地访问物理设备,提高了效率。

下面是BufferedInputStream的源码分析:

public class BufferedInputStream extends FilterInputStream {
    protected volatile byte buf[];
    //缓冲区大小
    protected int count;
    protected int pos;
    protected int markpos = -1;
    protected int marklimit;
    protected boolean mSkipLF = false;
    //默认缓冲区大小
    static int defaultBufferSize = 8192;
    //跳过缓冲区数据并重新读取数据
    private void fill() throws IOException {
        //pos记录缓存区的位置
        pos = 0;
        count = 0;
        int n = in.read(buf, pos, buf.length);
        if (n > 0) {//如果成功从输入流中读取数据
            count = n;
        }
    }
    //构造方法传入InputStream流对象
    public BufferedInputStream(InputStream in) {
        this(in, defaultBufferSize);
    }
    public BufferedInputStream(InputStream in, int size) {
        super(in);
        if (size <= 0) {
            throw new IllegalArgumentException("Buffer size <= 0");
        }
        buf = new byte[size];
    }
    //读取单个字节
    public synchronized int read() throws IOException {
        //如果当前数据已经读取完了,从输入流读取数据并缓存
        if (pos >= count) fill();
        //如果读完了还为空则返回-1
        return (pos < count) ? (buf[pos++] & 0xff) : -1;
    }
    //读取多个字节
    private int read1(byte[] b, int off, int len) throws IOException {
        int avail = count - pos;
        //如果缓存区正在被使用,则重新从流中读取数据到缓冲区中
        if (avail <= 0) {
            if (len >= buf.length && markpos < 0) {
                return in.read(b, off, len);
            }
            fill();
            avail = count - pos;
            if (avail <= 0) return -1;
        }
        int cnt = (avail < len) ? avail : len;
        System.arraycopy(buf, pos, b, off, cnt);
        pos += cnt;
        return cnt;
    }
    //读取多个字节,并返回读取的字节数
    public synchronized int read(byte b[], int off, int len)
        throws IOException {
        //校验参数范围
        if (b == null) {
            throw new NullPointerException();
        } else if (off < 0 || len < 0 || len > b.length - off) {
            throw new IndexOutOfBoundsException();
        } else if (len == 0) {
            return 0;
        }
        int n = 0;
        //连续读取
        for (;;) {
            int nread = read1(b, off + n, len - n);
            if (nread <= 0) return (n == 0) ? nread : n;
            n += nread;
            //读够了就退出循环
            if (n >= len) return n;
        }
    }
    //跳过指定字节数
    public synchronized long skip(long n) throws IOException {
        if (n <= 0) {
            return 0;
        }
        //现将缓存区的数据跳过
        long avail = count - pos;
        if (avail <= 0) {
            //如果缓存区没有数据,则直接跳过n个字节
            return in.skip(n);
        }
        long skipped = (avail < n) ? avail : n;
        pos += skipped;
        n -= skipped;
        //如果还需要跳过的字节数超过了缓存区大小,则直接调用输入流的skip方法跳过
        if (n > 0) {
            skipped += in.skip(n);
        }
        return skipped;
    }
    //返回当前可读取的字节数
    public synchronized int available() throws IOException {
        int n = count - pos;
        int avail = in.available();
        return (n > (Integer.MAX_VALUE - avail)) ? Integer.MAX_VALUE : n + avail;
    }
    //标记当前位置
    public synchronized void mark(int readlimit) {
        marklimit = readlimit;
        markpos = pos;
    }
    //重置到上一次标记的位置
    public synchronized void reset() throws IOException {
        if (markpos < 0) {
            throw new IOException("Resetting to invalid mark");
        }
        pos = markpos;
    }
    //判断是否支持mark和reset方法
    public boolean markSupported() {
        return true;
    }
    //关闭流
    public void close() throws IOException {
        byte[] buffer;
        synchronized (this) {
            buffer = buf;
            buf = null;
        }
        if (buffer != null) {
            //调用输入流的close方法关闭流
            in.close();
        }
    }
}

  从源码中可以看出,BufferedInputStream主要是通过缓冲区来提高了读取效率,其读取过程与InputStream的读取过程基本一致,只不过在数据从输入流中读取后,会先将其缓存到一个缓冲区中,然后再从缓冲区中读取数据。同时,BufferedInputStream还提供了markreset方法,可以对数据流进行标记和重置,方便对流的操作。

使用BufferedInputStream类读取文件

  在进行文件读取时,我们可以使用BufferedInputStream类来提高读取效率。下面是一个使用BufferedInputStream类读取文件的示例代码:

try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream("./template/hello.txt"))) {
    byte[] buffer = new byte[1024];
    int length;
    while ((length = bis.read(buffer)) != -1) {
        // do something with the data
    }
} catch (IOException e) {
    // handle exception
}

  上面的代码中,我们首先创建了一个BufferedInputStream对象,并将其包装在一个try-with-resources语句中,这样可以自动关闭资源。然后我们创建一个字节数组作为缓冲区,读取文件时每次读取1024个字节,读取到文件末尾时返回-1。我们可以在while循环中对读取到的数据进行处理。

  使用BufferedInputStream类读取文件时,每次读取的数据会先被读入缓冲区中,当缓冲区的数据被读取完后,再从文件中读取新的数据。这样可以减少I/O操作的次数,提高读取数据的效率。

使用BufferedInputStream类写入文件

  在进行文件写入时,我们同样可以使用BufferedInputStream类来提高写入效率。下面是一个使用BufferedInputStream类写入文件的示例代码:

try (BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("./template/hello.txt"))) {
    byte[] data = "Hello, jym! ".getBytes();
    bos.write(data);
} catch (IOException e) {
    // handle exception
}

  上面的代码中,我们首先创建了一个BufferedOutputStream对象,并将其包装在一个try-with-resources语句中,这样可以自动关闭资源。然后我们将要写入的数据转换成字节数组,并通过BufferedOutputStream对象将数据写入到文件中。

  使用BufferedInputStream类写入文件时,每次写入的数据会先被写入到缓冲区中,当缓冲区的数据写满后,再将缓冲区中的数据一次性写入到文件中。这样可以减少I/O操作的次数,提高写入数据的效率。

测试用例

代码演示

  为了验证BufferedInputStream类的优化效果,我们可以编写一个测试用例。下面是一个使用BufferedInputStream类读取文件的测试用例:

package com.example.javase.io.bufferedInputStream;

import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;

/**
 * @author bug菌
 * @version 1.0
 * @date 2023/10/13 17:51
 */
public class BufferedInputStreamTest {

    public static void main(String[] args) {
        long start = System.currentTimeMillis();
        try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream("./template/hello.txt"))) {
            byte[] buffer = new byte[1024];
            int length;
            while ((length = bis.read(buffer)) != -1) {
                String content = new String(buffer, 0, length);
                System.out.println("读取内容为:" + content);
            }
        } catch (IOException e) {
            // handle exception
        }
        long end = System.currentTimeMillis();
        System.out.println("Time used: " + (end - start) + "ms");
    }
}

  上面的代码中,我们首先记录了开始时间,然后使用BufferedInputStream类读取文件,并在while循环中对读取到的数据进行处理。最后,在读取数据时,将字节数组转换为字符串,并使用 System.out.println() 方法打印出来;并记录了结束时间,并输出总共使用的时间。

  我们可以在不使用BufferedInputStream类的情况下编写一个相同的测试用例,然后比较两个测试用例的运行时间,从而验证BufferedInputStream类的优化效果。

测试代码解析

这段代码演示了如何使用BufferedInputStream读取文件内容。

  1. 首先导入需要的类,包括BufferedInputStreamFileInputStreamIOException等;

  2. 在main函数中,首先记录程序开始的时间;

  3. 使用try-with-resources语句创建一个BufferedInputStream对象,它包装了一个FileInputStream对象,用于读取指定路径下的hello.txt文件;

  4. 创建一个byte数组作为缓冲区,长度为1024;

  5. 使用while循环读取文件内容,每次读取的数据被存储在缓冲区中,长度由read()方法返回;

  6. 将从缓冲区中读取的字节转换为字符串,输出到控制台;

  7. catch IOException异常,处理异常;

  8. 记录程序结束的时间;

  9. 输出程序执行时间。

  需要注意的是,使用BufferedInputStream可以提高读取文件的效率,但在读取大文件时,可能会导致内存溢出,需要注意调整缓冲区的大小。

测试结果

如下是运行测试用例所得截图,仅供参考:

在这里插入图片描述

小结

  通过本文的介绍,我们了解了如何使用Java中的BufferedInputStream类来提高I/O操作的效率。我们可以使用BufferedInputStream类来读取文件和写入文件,达到减少I/O操作次数、提高效率的目的。同时我们还编写了一个测试用例来验证BufferedInputStream类的优化效果。

总结

  BufferedInputStream类是Java中的一个输入流缓冲器,它可以提高I/O操作的效率。我们可以使用BufferedInputStream类来读取文件和写入文件,达到减少I/O操作次数、提高效率的目的。通过编写测试用例,我们验证了BufferedInputStream类的优化效果。在进行文件操作时,我们可以尽可能使用BufferedInputStream类来提高效率。

标签:文件,读取,BufferedInputStream,int,详解,缓冲区,读取数据
From: https://blog.csdn.net/weixin_43970743/article/details/136980166

相关文章

  • 智能指针详解
    文章目录前言unique_ptrshared_ptrweak_ptr前言智能指针本质上来讲是一个存储指向堆内存指针的类,目的就是帮助我们管理内存,一旦使用了智能指针就就尽量使用new产生的指针,因为智能指针只维护同类型指针的引用计数,混用很容易造成内存重复释放的问题unique_ptrstd:......
  • JavaScript原型、原型对象、原型链系列详解(一)
    (一)、JavaScript原型原型JavaScript是一门面向对象的编程语言,其中原型(prototype)是一个重要的概念,它提供了一种创建对象的方式,使对象可以共享属性和方法。在JavaScript中,每个对象都有一个原型,可以从原型中继承属性和方法。原型的定义JavaScript的原型是一个对象,它......
  • 《数据结构与算法分析》作业一(详解版)
    1.什么是数据结构?有关数据结构的讨论涉及哪三个方面?答:(1)数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成.(2)逻辑结构、存储结构以及运算结构。2.什么是算法?算法的特性有哪些?根据这些特性,解释算法与程序的区别?答:(1)算法是一组明......
  • 模拟堆(详解+例题)
    一、定义维护一个数据集合,堆是一个完全二叉树。那么什么是二叉树呢?如图:二、关于小根堆实现性质:每个根节点都小于等于左右两边,所以树根为最小值。 2.1、堆存储(用一维数组来存) 记住规则:x(根)的左儿子=x*2;          x(根)的右儿子=x......
  • 分布式详解
    文章目录概述分布式开发优点和缺点分布式存在的作用分布式和集群的区别集群的特点BASE理论BASE理论的三要素CAP理论二段式满足cap理论的哪两个理论分析下分布式强一致性、弱一致性、最终一致性衡量分布式系统的指标分布式下down机的处理⽅案分布式系统设计paxos和raft......
  • C语言字符函数和字符串函数及内存函数详解(干货小知识:常用函数的模拟实现)
    文章目录1.字符函数1.1字符分类函数1.2字符转换函数2.字符串函数2.1strlen函数2.1.1strlen函数的使用:2.1.2strlen函数的模拟实现2.2strcpy函数2.2.1strcpy函数的使用2.2.2strcpy函数的模拟实现2.3strcat函数2.3.1strcat函数的使用2.3.2strcat函数的模拟实......
  • Redis基础命令集详解
    目录1.Redis基础命令2.Redis的经典案例2.1缓存2.2计数器2.3发布订阅Redis是一个开源、内存存储的数据结构服务器,它支持多种数据结构,如字符串、哈希表、列表、集合、有序集合等。在Redis中,使用一些基础的命令来操作这些数据结构。1.Redis基础命令下面是一些常用的R......
  • STM32之HAL开发——启动文件详解【精华版】
    启动文件介绍启动文件是使用机器认识的汇编语言,由汇编编写,是系统上电复位后第一个执行的程序,经过一些必要的配置,最终能够调用main函数,使得用户程序能够在MCU上正常运行起来的必备文件。无论是是何种MCU,从简单的51,MSP430,到ARM9,ARM11,A7都必须有启动文件,因为对于嵌入式......
  • 0基础学习C语言第一章:常量与变量详解
    一、常量定义:在程序运行过程中,其值不能被改变的量称为常量。常用常量有以下几类:1.整型常量十进制整数形式例如:234,-1232.实型(浮点型)常量十进制小数形式:由数字、小数点组成例如:2.345、-23.345指数形式:如:1.23e2(相当于1.23x10²)由于在计算机输入输出时,无法表示上角......
  • 数据结构:详解【栈和队列】的实现
    目录1.栈1.1栈的概念及结构1.2栈的实现1.3栈的功能1.4栈的功能的实现1.5完整代码2.队列2.1队列的概念及结构2.2队列的实现2.3队列的功能2.4队列的功能的实现2.5完整代码1.栈1.1栈的概念及结构栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除......