首页 > 其他分享 >面试官:字节流可以处理一切文件为什么还需要字符流呢?

面试官:字节流可以处理一切文件为什么还需要字符流呢?

时间:2024-06-15 09:01:10浏览次数:31  
标签:字符 面试官 字节 int write 输入 读取

一、写在开头

在计算机领域中百分之九十以上的程序拥有着和外部设备交互的功能,这就是我们常说的IO(Input/Output:输入/输出),所谓输入就是外部数据导入计算机内存中的过程,输出则是将内存或者说程序中的数据导入到外部存储中,如数据库、文件以及其他本地磁盘等。

二、什么是IO流

这种输入输出往往遵循着先入先出,顺序存取的特点,像水流一般,因此我们称这样的操作为流(Stream),如下我们根据不同的标准,将IO流分为几个门类:
image

根据数据流向:

  1. 输入流:数据流向程序
  2. 输出流:数据从程序流出。

根据处理单位:

  1. 字节流:一次读入或读出是8位二进制;
  2. 字符流:一次读入或读出是16位二进制
  3. JDK 中后缀是 Stream 是字节流;后缀是 Reader,Writer 是字符流。

根据功能点:

  1. 节点流:直接与数据源相连,读入或写出;
  2. 处理流:与节点流一块使用,在节点流的基础上,再套接一层。

三、输入与输出

在java.io包中多达40多个类,它们的基类来源于InputStream、OutputStream、Reader、Writer这四个,我们一一看过。

3.1 InputStream(字节输入流)

InputStream作为所有字节输入流的父类,主要作用是将外部数据读取到内存中,主要方法如下(JDK8):

  1. read():返回输入流中下一个字节的数据。返回的值介于 0 到 255 之间。如果未读取任何字节,则代码返回 -1 ,表示文件结束。
  2. read(byte b[ ]) : 从输入流中读取一些字节存储到数组 b 中。如果数组 b 的长度为零,则不读取。如果没有可用字节读取,返回 -1。如果有可用字节读取,则最多读取的字节数最多等于 b.length , 返回读取的字节数。这个方法等价于 read(b, 0, b.length)。
  3. read(byte b[], int off, int len):在read(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. skip(long n):忽略输入流中的 n 个字节 ,返回实际忽略的字节数。
  5. available():返回输入流中可以读取的字节数。
  6. close():关闭输入流释放相关的系统资源。
  7. markSupported() :该输入流是否支持mark()和reset()方法。
  8. mark(int readlimit) :标志输入流的当前位置,随后调用reset()方法将该流重新定位到最近标记的位置;参数readlimit表示:在标记位置失效前可以读取字节的最大限制。
  9. reset() :将此流重新定位到最后一次对此输入流调用 mark 方法时的位置。

image

我们使用FileInputStream(文件字节输入流)进行如上方法的使用测试:

public class Test {
    public static void main(String[] args) throws IOException {
        try (InputStream fis = new FileInputStream("E:\\input.txt")) {
            System.out.println("可读取字节数:"
                    + fis.available());
            int content;
            long skip = fis.skip(3);
            System.out.println("忽略字节数:" + skip);
            System.out.print("剩余全量字节:");
            while ((content = fis.read()) != -1) {
                System.out.print((char) content);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

image

输出:

可读取字节数:20
忽略字节数:3
剩余全量字节:name is JavaBuild

3.2 OutputStream(字节输出流)

outputstream作为所有字节输出流的父类,主要则是将内存或者说程序中的数据以字节流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。它的使用方法相比较字节输入流要少:

  1. write(int b):将特定字节写入输出流。
  2. write(byte b[ ]) : 将数组b 写入到输出流,等价于 write(b, 0, b.length) 。
  3. write(byte[] b, int off, int len) : 在write(byte b[ ]) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字节数)。
  4. flush():刷新此输出流并强制写出所有缓冲的输出字节。
  5. close():关闭输出流释放相关的系统资源。

image

我们同样以FileOutputStream为例进行上述方法的测试:

public class Test {
    public static void main(String[] args) throws IOException {
        try (FileOutputStream output = new FileOutputStream("E://output.txt")) {
            byte[] array = "JavaBuild".getBytes();
            //将一个字节数组写入本地E盘的外部文件output.txt中
            output.write(array);

            //换行方式1:Windows下的换行符为"\r\n"
            output.write("\r\n".getBytes());
            //换行方式2:推荐使用,具有良好的跨平台性
            String newLine = System.getProperty("line.separator");
            output.write(newLine.getBytes());

            //输出字节,这里的数字会被转为asicc码中对应的字符
            output.write(64);
            output.write(56);
            output.write(56);
            output.write(56);
            //关闭输出流
            output.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

效果:
image

这里可以直接输出单字节数据,也可以输出指定的字节数组。输出字节时以int类型输出,最终根据ASCII表转为字符。如十进制64的转为@符号。

3.3 Reader(字符输入流)

在讲解字符流之前,我们来解释一个面试问题:“为什么有了字节流了还需要使用更耗时的字符流”

确实,字节作为信息存储的最小单元,我们可以通过字节流实现所有信息的输入与输出,但有时候会存在一些问题,比如中文输入时的编码问题,将上述3.1中的测试代码稍微改一下,执行结果如下,中文在控制台输出时乱码了。当然我们可以通过设置编码来规避这个问题,但有时候不晓得编码时,乱码真的会带来潜在风险!
image

字符流与字节流的区别:

  • 字节流一般用来处理图像、视频、音频、PPT、Word等类型的文件。字符流一般用于处理纯文本类型的文件,如TXT文件等,但不能处理图像视频等非文本文件。
  • 字节流本身没有缓冲区,缓冲字节流相对于字节流,效率提升非常高。而字符流本身就带有缓冲区,缓冲字符流相对于效率提升不明显。

说了这么多,我们现在来看一下Reader这个字符输入流提供的主要方法吧,其实和InputStream差不多,只不过一个是以字节为单位的读取,一个是以字符为单位。

  1. read() : 从输入流读取一个字符。
  2. read(char[] cbuf) : 从输入流中读取一些字符,并将它们存储到字符数组 cbuf中,等价于 read(cbuf, 0, cbuf.length) 。
  3. read(char[] cbuf, int off, int len):在read(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. skip(long n):忽略输入流中的 n 个字符 ,返回实际忽略的字符数。
  5. close() : 关闭输入流并释放相关的系统资源。

image

我们将上述3.1中的测试代码稍作加工,采用FileReader流进行输入,打印结果:

image

可以看到即便有中文,输出在控制台也没有乱码,因为字符流默认采用的是 Unicode 编码。

那么字符流是如何实现txt文件读取的呢?通过FileReader类的继承关系我们可以看到它继承了InputStreamReader,这是一个字节转字符输入流,所以说从根本上,字符流底层依赖的还是字节流!

// 字节流转换为字符流的桥梁
public class InputStreamReader extends Reader {
}
// 用于读取字符文件
public class FileReader extends InputStreamReader {
}

3.4 Writer(字符输出流)

writer是将内存或者说程序中的数据以字符流的方式导入到外部存储中,如数据库、文件以及其他本地磁盘等。
常用方法也和OutputStream相似:

  1. write(int c) : 写入单个字符。
  2. write(char[] cbuf):写入字符数组 cbuf,等价于write(cbuf, 0, cbuf.length)。
  3. write(char[] cbuf, int off, int len):在write(char[] cbuf) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  4. write(String str):写入字符串,等价于 write(str, 0, str.length()) 。
  5. write(String str, int off, int len):在write(String str) 方法的基础上增加了 off 参数(偏移量)和 len 参数(要读取的最大字符数)。
  6. append(CharSequence csq):将指定的字符序列附加到指定的 Writer 对象并返回该 Writer 对象。
  7. append(char c):将指定的字符附加到指定的 Writer 对象并返回该 Writer 对象。
  8. flush():刷新此输出流并强制写出所有缓冲的输出字符。
  9. close():关闭输出流释放相关的系统资源。

我们同样以FileWriter为例,去测试一下:

public class Test {
    public static void main(String[] args) throws IOException {
        try (FileWriter fw = new FileWriter("E:\\outwriter.txt")) {
           fw.write("大家好!!!");
           fw.append("我是JavaBuild");
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

image

结尾彩蛋

如果本篇博客对您有一定的帮助,大家记得留言+点赞+收藏呀。原创不易,转载请联系Build哥!
image

如果您想与Build哥的关系更近一步,还可以关注“JavaBuild888”,在这里除了看到《Java成长计划》系列博文,还有提升工作效率的小笔记、读书心得、大厂面经、人生感悟等等,欢迎您的加入!
image

标签:字符,面试官,字节,int,write,输入,读取
From: https://www.cnblogs.com/JavaBuild/p/18248977

相关文章

  • C# 字符串(String)
    字符串在C#中是特殊的存在,它是引用类型(内存分配在托管堆上),属于不可改变的对象。任何对字符串的操作都会返回1个新的字符串。字符串加@符号,不会对转义字符进行处理,例如:stringstr1=@"C:\Windows\System32";字符串加$符号,可占位插入变量,例如:stringstr2=$"{str1}";.ToSt......
  • [LeetCode] 942. 增减字符串匹配
    942.增减字符串匹配由范围[0,n]内所有整数组成的n+1个整数的排列序列可以表示为长度为n的字符串s,其中:如果perm[i]<perm[i+1],那么s[i]=='I'如果perm[i]>perm[i+1],那么s[i]=='D'给定一个字符串s,重构排列perm并返回它。如果有多个有效排列perm......
  • 面试官:为什么重写equals方法必须要重新hashCode方法?
    网络上解释的很全面但是很枯涩,也有些难懂,其实就是为了保证当该对象作为key时哈希表的检索效率。如HashMap的get方法是分两步获取的第一步通过key的哈希值找到对应的哈希桶第二步通过equals方法来判断是否为同一个key(因为可能出现哈希冲突)假设一个Student类有三个属性:学号、姓......
  • 核心(Hutool-core)工具类(字符编码工具-CharsetUtil)
    介绍CharsetUtil主要针对编码操作做了工具化封装,同时提供了一些常用编码常量。常量常量在需要编码的地方直接引用,可以很好的提高便利性。字符串形式ISO_8859_1UTF_8GBKCharset对象形式CHARSET_ISO_8859_1CHARSET_UTF_8CHARSET_GBK方法编码字符串转为Charset对象Char......
  • 转换协议字节
     转换协议字节///<summary>///转换协议字节帮助类///</summary>publicclassByteUtil{///<summary>///byte数组转换int///</summary>///<paramname="src"></param>......
  • 代码随想录 算法训练营 day9 Leetcode151 反转字符串单词 karma55 右旋转字符串 28 实
    Leetcode151反转字符串单词题目链接讲解此题方法很多很重要注重基础解法classSolution{publicStringreverseWords(Strings){char[]initialArr=s.toCharArray();//新字符数组char[]newArr=newchar[initialArr.length+1];//下......
  • 【Java】 将字节数组转换为十六进制字符串:Java实现指南
    >>【痕迹】QQ+微信朋友圈和聊天记录分析工具>>(1)纯Python语言实现,使用Flask后端,本地分析,不上传个人数据。>>(2)内含QQ、微信聊天记录保存到本地的方法,真正实现自己数据自己管理。>>(3)数据可视化分析QQ、微信聊天记录,提取某一天的聊天记录与大模型对话。>>下载地......
  • Q31 LeetCode438 找到字符串中所有字母异位词
    没看懂 1classSolution{2publicList<Integer>findAnagrams(Strings,Stringp){3List<Integer>res=newArrayList<>();4int[]cnt=newint[26];5intn=p.length();6intm=s.length();7......
  • 字符数组与字符串
    一、字符数组1.字符数组初始化类型数组名[长度]={元素1,元素2...};类型数组名[长度]=“abcde”;chara[5]={'a','b','c','d','e'};charb[5]="abcde";//错误:末尾还需要存放\0for(inti=0;i<5;i++)cout<<a[i];2.字符数组的输入输出使用cin,cout......
  • 面试官:谈谈对SpringAI的理解?
    SpringAI已经发布了好长时间了,目前已经更新到1.0版本了,所以身为Java程序员的你,如果还对SpringAI一点都不了解的话,那就有点太落伍了。言归正传,那什么是SpringAI?如何快速进行SpringAI开发呢?1.什么是SpringAI?SpringAI是Spring官方社区项目,旨在简化JavaAI应......