Java I/O (Input/Output)——文件字节流
Java I/O 简介
Java I/O(输入/输出)是 Java 程序中用于处理数据输入和输出的重要部分。
输入流(Input Streams):用于从数据源读取数据。常见的输入流包括FileInputStream
(从文件读取)、BufferedInputStream
(提高读取效率)等。
输出流(Output Streams):用于将数据写入到目的地。例如FileOutputStream
(向文件写入)、BufferedOutputStream
(提高写入效率)。
字符流(Reader 和 Writer):处理字符数据,更适合处理文本。如FileReader
和FileWriter
。
缓冲流(Buffered Streams):通过缓冲区来减少实际的 I/O 操作次数,提高性能。
对象流(Object Streams):用于实现对象的序列化和反序列化,如ObjectInputStream
和ObjectOutputStream
。
在实际编程中,根据具体的需求选择合适的 I/O 流可以提高程序的效率和可读性。
计算机总线结构:
那么为什么会有I/O呢?其实I/O无时无刻不在我们身边,比如读取硬盘上的文件,网络文件的传输,鼠标键盘输入,也可以是接受单片机发回的数据,而能够支持这些操作的设备就是I/O设备。
我们可以大致看一下整个计算机的总线结构:
最核心的是CPU,CPU像计算机的大脑一样,是计算机的核心部件,几乎所有的计算都是靠这个CPU来进行的,CPU懂的比较多,它可以对各种类型进行计算,但是随着时代的发展对图形的要求越来越高,CPU就略显乏力;于是就出现了GPU(显卡),显卡就是专门对于图形进行计算。
通过北桥芯片连接到内存,这样CPU就可以对内存进行操作;南桥芯片是用于读取U盘或者硬盘内的数据 。
常见的I/O设备一般是鼠标、键盘这类通过USB进行传输的外设或者是通过Sata接口或是M.2连接的硬盘。一般情况下,这些设备是由CPU发出指令通过南桥芯片间接进行控制,而不是由CPU直接操作。
而我们在程序中,想要读取这些外部连接的!O设备中的内容,就需要将数据传输到内存中。而需要实现这样的操作,单单凭借一个小的程序是无法做到的,而操作系统(如:Windows/inux/MacOS)就是专门用于控制和管理计算机硬件和软件资源的软件,我们需要读取一个IO设备的内容时,就可以向操作系统发出请求,由操作系统帮助我们来和底层的硬件交互以完成我们的读取/写入请求。
JDK提供了一套用于IO操作的框架,为了方便我们开发者使用,就定义了一个像水流一样,根据流的传输方向和读取单位,分为字节流InputStream和OutputStream以及字符流Reader和Writer的IO框架,当然,这里的流指的是数据流,通过流,我们就可以一直从流中读取数据,直到读取到尽头,或是不断向其中写入数据,直到我们写入完成,而这类IO就是我们所说的BIO。
文件字节流:
字节流一次读取一个字节,也就是一个 byte 的大小,而字符流顾名思义,就是一次读取一个字符,也就是一个 char 的大小(在读取纯文本文件的时候更加适合)。
文件输入流:
在 Java 中,文件输入流(FileInputStream
)用于从文件中读取数据。FileInputStream
允许程序以字节为单位读取文件的内容。
创建方式:
通常通过指定要读取的文件路径来创建文件输入流对象。例如:
但是这种方式需要处理各种可能的异常,比如 FileNotFoundException 异常和 IOException 异常,并且需要手动关闭文件,完整代码如下:
仅仅是取得文件就如此费劲,不合乎常理。所以有了try-with-resources
语句这种简便方式,try-with-resources
语句是一种用于更方便、更安全地管理资源(如输入流、输出流、数据库连接等)的机制。
优点:
- 自动资源管理:无需显式地调用
close
方法来关闭资源,避免了因忘记关闭资源而导致的资源泄漏问题。 - 简洁的代码:减少了样板代码,使代码更简洁、更易读。
语法格式:
对于以上示例的完整代码转成try-with-resources
语句如下:
由此可见,try-with-resources
语句极大地提高了资源管理的便利性和可靠性,使代码更加健壮和易于维护。
数据的传递:
如图所示,在计算机数据由文件向内存进行传递的形式是以二进制01串进行的,一次一个字节,就像水流一样源源不断的传输,直至文件传输结束。
数据不断传输过来,那我们如何去读取数据呢?
调用read()方法是必要的,但是read()方法的调用方式也有很多种,这里主要列出来常见的三种。
1.直接读取
由于读取数据返回的是int类型的一个数据,所以我们用int i 去接收它,然后利用强制类型转换把i 转为char类型进行输出。调用一次读取一个字符,当读取完之后会返回-1.这样效率较为低下,所以有下面第二种读取方法。
2.循环读取
由于读取完之后会返回数字-1,所以可以利用这一性质进行while循环进行读取,直到返回-1时结束循环,代码如下:
通过这种方式就可以一次性对文件内的内容全部读取。但是由于不够灵活,可变性较差,所以还可以用下面第三种方法进行读取。
3.区间读取
区间读取,顾名思义就是定义一个固定长度的区间,将文件内的内容按照这个区间大小进行读取,当文件未读内容小于区间长度时会以小于区间长度的形式进行最后一次读取,若没有元素可读取时,一样会返回-1。具体代码如下:
读取过程中可使用available()方法查询可读数量,在上面的案例中,我将区间长度x设置为了可读长度,这样也可以一次性读取完文件内数据。也可以设置其他int类型的x作为长度参数。
这种方法在文件输出流常用,一个字节一个字节的读取出来并一个字节一个字节的写入另一个文件,相当于文件的拷贝操作。
跳过操作:skip()方法。给skip(x)传人参数x,可以设置跳过前几个字节进行读取其下一个字节。
文件输出流:
文件输出流(FileOutputStream
)用于将数据写入到文件中。文件输出流允许您以字节为单位向文件写入数据。
在写入之前您需要提供要写入的文件的路径和名称。如果文件不存在,它将被创建;如果文件已存在,默认情况下,新写入的数据会覆盖原有的内容。
stream.flush()
方法的主要作用是将输出流缓冲区中的数据强制刷新并输出。通常,当我们使用输出流(如 FileOutputStream
、BufferedOutputStream
等)写入数据时,数据并不是立即被发送到目的地(如文件),而是先被存储在缓冲区中。缓冲区的目的是减少实际的 I/O 操作次数,从而提高性能。
然而,在某些情况下,我们希望确保数据能够立即被发送出去,而不是等到缓冲区填满或者输出流被关闭。这时就可以使用 flush
方法。
默认情况下(append的参数默认是false),写入的内容会直接取代原文件内的内容,即覆盖掉。代码如下:
如果想接着文件的内容往后继续写(追加模式),那么只需要把append的参数改为true即可,代码如下:
至此,我们就完成了输出流操作,那么,就可以结合输入流和输出流进行拷贝操作了。
文件的拷贝:
文件拷贝是将一个文件的内容完整地复制到另一个文件的操作。相关的类有:
文件的拷贝操作一般使用读取数据的第三种方法,区间读取。因为这种方法可以设置足够大的区间,读取速度较快,不需要一个字节一个字节的去读取。下面是两个拷贝的示例代码:
在上述代码中,通过创建输入流 FileInputStream
从源文件读取数据,创建输出流 FileOutputStream
向目标文件写入数据。使用一个缓冲区来提高拷贝效率,每次读取一定数量的字节到缓冲区,然后将缓冲区中的数据写入目标文件,直到读取完源文件的所有内容。
文件拷贝在很多场景中都很有用,比如:
- 数据备份:将重要文件复制一份以防止数据丢失。
- 共享文件:将文件拷贝到多个位置以便不同的程序或用户使用。
例如,如果您有一个包含重要配置信息的文件,为了安全起见,可以定期进行备份拷贝。又或者在一个文件处理系统中,需要将原始文件拷贝到多个不同的目录下以供不同的模块处理。
“且将新火试新茶,诗酒趁年华。”——《望江南·超然台作》
- 点赞
- 收藏
- 关注作者
评论(0)