C语言文件的操作与处理

举报
未见花闻 发表于 2022/04/30 00:02:42 2022/04/30
【摘要】 C语言文件的操作与处理

⭐️前面的话⭐️

大家好!文件在我们生活中无处不在,这篇文章将介绍使用C语言调用文件,C语言支持两种文件类型,一种是文本文件,另一种是二进制文件,主要以文本文件的使用为主介绍C语言对文件的读写。

📒博客主页:未见花闻的博客主页
🎉欢迎关注🔎点赞👍收藏⭐️留言📝
📌本文由未见花闻原创!
📆华为云首发时间:🌴2022年4月30日🌴
✉️坚持和努力一定能换来诗与远方!
💭参考书籍:📚《C语言程序设计》
💬参考在线编程网站:🌐牛客网🌐力扣
博主的码云gitee,平常博主写的程序代码都在里面。
博主的github,平常博主写的程序代码都在里面。
🍭作者水平很有限,如果发现错误,一定要及时告知作者哦!感谢感谢!



✨1.文件与流

🌟1.1文件

⭐️1.1.1什么是文件?

文件是当今计算机系统不可或缺的部分。文件用于储存程序、文档、数 据、书信、表格、图形、照片、视频和许多其他种类的信息。作为程序员, 必须会编写创建文件和从文件读写数据的程序。

文件(file)通常是在磁盘或固态硬盘上的一段已命名的存储区。对我 们而言,stdio.h就是一个文件的名称,该文件中包含一些有用的信息。然 而,对操作系统而言,文件更复杂一些。例如,大型文件会被分开储存,或 者包含一些额外的数据,方便操作系统确定文件的种类。然而,这都是操作 系统所关心的,程序员关心的是C程序如何处理文件(除非你正在编写操作系统)。

⭐️1.1.2文本文件与二进制文件

在C语言中,<stdio.h>支持两种类型的文件∶文本文件和二进制文件。首先,要区分文本内容和二进制内容、文本文件格式和二进制文件格 式,以及文件的文本模式和二进制模式。所有文件的内容都以二进制形式(0或1)储存。但是,如果文件最初使 用二进制编码的字符(例如, ASCII或Unicode)表示文本(就像C字符串那 样),该文件就是文本文件,其中包含文本内容。如果文件中的二进制值代 表机器语言代码或数值数据(使用相同的内部表示,假设,用于long或 double类型的值)或图片或音乐编码,该文件就是二进制文件,其中包含二 进制内容。

UNIX用同一种文件格式处理文本文件和二进制文件的内容。不奇怪, 鉴于C是作为开发UNIX的工具而创建的,C和UNIX在文本中都使用\n(换行 符)表示换行。UNIX目录中有一个统计文件大小的计数,程序可使用该计 数确定是否读到文件结尾。然而,其他系统在此之前已经有其他方法处理文 件,专门用于保存文本。也就是说,其他系统已经有一种与UNIX模型不同 的格式处理文本文件。例如,以前的OS X Macintosh文件用\r (回车符)表 示新的一行。早期的MS-DOS文件用\r\n组合表示新的一行,用嵌入的Ctrl+Z 字符表示文件结尾,即使实际文件用添加空字符的方法使其总大小是256的 倍数(在Windows中,Notepad仍然生成MS-DOS格式的文本文件,但是新的 编辑器可能使用类UNIX格式居多)。其他系统可能保持文本文件中的每一 行长度相同,如有必要,用空字符填充每一行,使其长度保持一致。或者, 系统可能在每行的开始标出每行的长度。

为了规范文本文件的处理,C 提供两种访问文件的途径:二进制模式和 文本模式。 在二进制模式中,程序可以访问文件的每个字节。而在文本模式 中,程序所见的内容和文件的实际内容不同。程序以文本模式读取文件时, 把本地环境表示的行末尾或文件结尾映射为C模式。例如,C程序在旧式 Macintosh中以文本模式读取文件时,把文件中的\r转换成\n;以文本模式写 入文件时,把\n转换成\r。或者,C文本模式程序在MS-DOS平台读取文件 时,把\r\n转换成\n;写入文件时,把\n转换成\r\n。在其他环境中编写的文本 模式程序也会做类似的转换。

除了以文本模式读写文本文件,还能以二进制模式读写文本文件。如果 读写一个旧式MS-DOS文本文件,程序会看到文件中的\r 和\n 字符,不会发生映射。如果要编写旧式 Mac格式、MS-DOS格式或UNIX/Linux格式的文件模式程序,应该使用二进制模式,这样程序才能 确定实际的文件内容并执行相应的动作。
在这里插入图片描述
虽然C提供了二进制模式和文本模式,但是这两种模式的实现可以相 同。前面提到过,因为UNIX使用一种文件格式,这两种模式对于UNIX实现 而言完全相同。Linux也是如此。

文本文件具有两种二进制文件没有的特性。

  • [ ] 文本文件分为若干行。文本文件的每一行通常以一两个特殊字符结尾,特殊字符的
选择与操作系统有关。在Windows中,行末的标记是回车符(’\x0d’)与一个紧跟其后的回行符(’\x0a’)。在UNIX和Macintosh操作系统(Mac OS)的较新版本中,行末的标记是一个单独的回行符。旧版本的Mac OS使用一个单独的回车符。
  • [ ] 文本文件可以包含一个特殊的"文件末尾"标记。一些操作系统允许在文本文件的末尾
使用一个特殊的字节作为标记。在Windows中,标记为’\xla’(Ctrl+Z)。Ctrl+Z不是必需的,但如果存在,它就标志着文件的结束,其后的所有字节都会被忽略。使用Ctrl+Z 的这一习惯继承自DOS,而DOS中的这一习惯又是从CP/M(早期用于个人电脑的一种操作系统)来的。大多数其他操作系统(包括UNIX)没有专门的文件末尾字符。

二进制文件不分行,也没有行末标记和文件末尾标记,所有字节都是平等对待的。

向文件写入数据时,我们需要考虑是按文本格式存储还是按二进制格式进行存储。为了搞清楚其中的差别,考虑在文件中存储数32 767的情况。一种选择是以文本的形式把该数按字符3、2、7、6、7写入。假设字符集为ASCII,那么就可以得到下列5个字节∶
22
另一种选择是以二进制的形式存储此数(short类型),这种方法只会占用两个字节∶
33
上图栗子说明了用二进制形式存储数可以节省相当大的空间。
编写用来读写文件的程序时,需要考虑该文件是文本文件还是二进制文件。在屏幕上显示文件内容的程序可能要把文件视为文本文件。但是,文件复制程序就不能认为要复制的文件为文本文件。如果那样做,就不能完全复制含有文件末尾字符的二进制文件了。在无法确定文件是文本形式还是二进制形式时,安全的做法是把文件假定为二进制文件。

🌟1.2C语言中的流

⭐️1.2.1什么是流?

在C语言中,术语流(stream)表示任意输入的源或任意输出的目的地。许多小型程序(就像前面章节中介绍的那些)都是通过一个流(通常和键盘相关)获得全部的输入,并且通过另一个流(通常和屏幕相关)写出全部的输出。
较大规模的程序可能会需要额外的流。这些流常常表示存储在不同介质(如硬盘驱动器、CD、DVD和闪存)上的文件,但也很容易和不存储文件的设备(网络端口、打印机等)相关联。这里将集中讨论文件,因为它们常见且容易理解。(在应该说流的时候,本书有时会使用术语文件。)但是,请千万记住一点,<stdio.h>中的许多函数可以处理各种形式的流,而不仅仅可以处理表示文件的流。

程序的处理结果或计算结果会随着程序运行结束而消失。因此要将程序运行结束后仍需保存的数值和字符串等数据保存在文件(file)中。
针对文件、键盘、显示器、打印机等外部设备的数据读写操作都是通过流(stream进行的。我们可以将流想象成流淌着字符的河。
由此可见,在前面的学习中所有用到 printf函数或 scanf函数的程序都使用了。
下图就是流和输入输出的示意图。printf函数将字符’A’、‘B’、'C’输出到连接显示器的流。而从键盘输入的字符会进入流中,scanf函数会将它们取出来,并将它们的值保存至变量x

11

⭐️1.2.2标准流

我们之所以能够如此简单方便地执行使用了流的输入输出操作,是因为C语言程序在启动时已经将标准(standard stream)准备好了。
标准流有以下三种。

■ stdin —— 标准输入流(standard input stream)
用于读取普通输入的流。在大多数环境中为从键盘输入。scanf与getchar等函数会从这个流中读取字符。


■stdout —— 标准输出流(standard output stream)
用于写入普通输出的流。在大多数环境中为输出至显示器界面。printf、puts 与putchar 等函数会向这个流写入字符。


■stderr —— 标准错误流(standard error stream)
用于写出错误的流。在大多数环境中为输出至显示器界面。


222

⭐️1.2.3文件指针

表示标准流的 stdinstdoutstderr都是指向 FILE型的指针型。FILE 型是在<stdio.h>头文件中定义的,该数据类型用于记录控制流所需要的信息,其中包含以下数据。

  • [ ] 文件位置指示符(file position indicator),记录当前访问地址。
  • [ ] 错误指示符(error indicator),记录是否发生了读取错误或写入错误。
  • [ ] 文件结束指示符(end-of-file indicator)记录是否已到达文件末尾。

通过流进行的输入输出都是根据上述信息执行操作的。而且这些信息也会随着操作结果更新。FILE 型的具体实现方法因编译器而异,一般多以结构体的形式实现。

✨2.文件打开与关闭及其读写操作

🌟2.1文件的打开与关闭

⭐️2.1.1文件操作模式

333
打开文件时可以指定以下四种模式:

  1. 只读模式 —— 只从文件输入。
  2. 只写模式 —— 只向文件输出。
  3. 更新模式 —— 既从文件输入,也向文件输出。
  4. 追加模式 —— 从文件末尾处开始向文件输出。

⭐️2.1.2打开文件

文件的打开是使用fopen函数,打开后务必记得关闭!

FILE *fopen( const char *filename, const char *mode );
名称 详情
头文件 stdio.h
参数 const char *filename 文件名(或文件路径)
参数 const char *mode 文件模式(以字符串形式输入)
返回值 FILE *型的指针(返回NULL表示打开失败)
作用 打开文件(文本或二进制文件)

⭐️2.1.3关闭文件

int fclose( FILE *stream );
名称 详情
头文件 stdio.h
参数 FILE *stream 需要关闭的文件指针
返回值 整型(表示关闭流或文件指针总数,返回EOF表示文件关闭失败)
作用 关闭文件(文本或二进制文件)

示范:

#include <stdio.h>
int main()
{
	//打开文件,以w+模式为例,若没指定路径,默认跟随该.c文件
	FILE* pf = fopen("abc.txt", "w+");//read and write
	if (pf == NULL)
	{
		perror("file open");
		return -1;
	}

	//文件操作(读文件,写文件)

	//代码

	//关闭文件

	fclose(pf);

	//代码

	return 0;
}

运行完后,发现test.c目录下多了文件abc.txt
333

🌟2.2文件的读写

功能 函数名 适用于
字符输入函数 fgetc 所有输入流
字符输出函数 fputc 所有输出流
文本行输入函数 fgets 所有输入流
文本行输出函数 fputs 所有输出流
格式化输入函数 fscanf 所有输入流
格式化输出函数 fprintf 所有输出流
二进制输入 fread 文件
二进制输出 fwrite 文件

⭐️2.2.1文本文件字符输入输出

文本文件字符输入函数,用法与函数getchar基本一样。

//Read a character from a stream (fgetc, fgetwc) or stdin (_fgetchar, _fgetwchar).
int fgetc( FILE *stream );
名称 详情
头文件 stdio.h
参数 FILE *stream 输入流(从流中读取数据输入,传文件指针读取文件,传stdin读取键盘等)
返回值 整型(表示输入字符ASCII码,返回EOF表示输入失败)
作用 输入一个字符

文本文件字符输出函数,用法与函数putchar基本一样。

//Writes a character to a stream (fputc, fputwc) or to stdout (_fputchar, _fputwchar).
int fputc( int c, FILE *stream );
名称 详情
头文件 stdio.h
参数int c 待写入流字符
参数 FILE *stream 输出流(将字符写入目标流,如传文件指针输出至文件,传stdout输出至屏幕等)
返回值 整型(表示输出字符ASCII码,返回EOF表示输出失败)
作用 输出一个字符

从文件输入输出一个字符a程序:

int main()
{
	//打开文件,以w+模式为例,若没指定路径,默认跟随该.c文件
	FILE* pf = fopen("abc.txt", "w+");//read and write
	if (pf == NULL)
	{
		perror("file open");
		return -1;
	}

	//文件操作(读文件,写文件)
	
	//输出字符
	fputc('a', pf);
	//将文件指针重新定位到文件的开头
	rewind(pf);
	//输入字符
	char ch = 0;
	ch = fgetc(pf);
	printf("%c ", ch);

	//关闭文件

	fclose(pf);

	//代码

	return 0;
}

运行结果:

a
D:\gtee\C-learning-code-and-project\test_930\Debug\test_930.exe (进程 3524)已退出,代码为 0。
按任意键关闭此窗口. . .

文件中的数据:
4444

⭐️2.2.2文本文件字符串行输入输出

文件输入字符串函数,作用与gets基本一致。

//Get a string from a stream.
char *fgets( char *string, int n, FILE *stream );
名称 详情
头文件 stdio.h
参数char *string 输入的目的地址(字符指针)
参数int n 从流中读取字符后加上\0后字符串字符数数量(包括\0
参数 FILE *stream 输入流(起源地)(从流中读取数据输入,传文件指针读取文件,传stdin读取键盘等)
返回值 字符指针(表示输入目的地的地址),返回NULL表示输入失败
作用 输入一个字符,输入目标字符数组后,会在最后一个字符后面自动加上\0

文件输入字符串函数,作用与puts基本一致。

Write a string to a stream.
int fputs( const char *string, FILE *stream );
名称 详情
头文件 stdio.h
参数const char *string 待写入流字符串
参数 FILE *stream 输出流(将字符写入目标流,如传文件指针输出至文件,传stdout输出至屏幕等)
返回值 整型(返回EOF表示输出失败)
作用 输出一个字符串

在空文件abc.txt中写入字符串str1:weijianhuawen,并从文件中将该字符串输入至str2。

int main()
{
	//打开文件,以w+模式为例,若没指定路径,默认跟随该.c文件
	FILE* pf = fopen("abc.txt", "w+");//read and write
	if (pf == NULL)
	{
		perror("file open");
		return -1;
	}

	//文件操作(读文件,写文件)
	char* str1 = "weijianhuawen";
	//输出字符串
	
	if (fputs(str1, pf) == EOF)
	{
		perror("fputs");
		return -2;
	}
	//将文件指针重新定位到文件的开头
	rewind(pf);
	//输入字符串
	char str2[20] = { 0 };
	if (fgets(str2, 20, pf) == NULL)
	{
		perror("fgets");
		return -2;
	}
	printf("%s ", str2);

	//关闭文件

	fclose(pf);

	//代码

	return 0;
}

写入后的abc.txt文件内容:
12
运行结果:

weijianhuawen
D:\gtee\C-learning-code-and-project\test_930\Debug\test_930.exe (进程 24320)已退出,代码为 0。
按任意键关闭此窗口. . .

⭐️2.2.3文本文件格式化输入输出

所谓文本文件格式化输入输出,其实就是把原来输入源为键盘改为文件,输出源为屏幕改为文件。那理所当然就比原来的printfscanf函数多了一个文件指针的参数,格式化的字符串参数是一样的。

Read formatted data from a stream.
int fscanf( FILE *stream, const char *format [, argument ]... );
Read formatted data from the standard input stream.
int scanf( const char *format [,argument]... );
Print formatted data to a stream.
int fprintf( FILE *stream, const char *format [, argument ]...);
Print formatted output to the standard output stream.
int printf( const char *format [, argument]... );

直接看一个例子吧!

struct s
{
	int i;
	char c;
	double d;
};

int main()
{
	struct s s1 = { 2, 't', 2.86 };
	//打开文件,以w+模式为例,若没指定路径,默认跟随该.c文件
	FILE* pf = fopen("abc.txt", "w+");//read and write
	if (pf == NULL)
	{
		perror("file open");
		return -1;
	}

	//文件操作(读文件,写文件)
	//格式化输出

	if (fprintf(pf, "%d %c %.2lf", s1.i, s1.c, s1.d) == EOF)
	{
		perror("fputs");
		return -2;
	}
	//将文件指针重新定位到文件的开头
	rewind(pf);
	//格式化输入
	struct s s2 = { 0 };
	if (fscanf(pf, "%d %c %lf", &(s2.i), &(s2.c), &(s2.d)) == EOF)
	{
		perror("fgets");
		return -2;
	}
	printf("%d %c %.2lf ", s2.i, s2.c, s2.d);

	//关闭文件

	fclose(pf);

	return 0;
}

123

运行结果:

2 t 2.86
D:\gtee\C-learning-code-and-project\test_930\Debug\test_930.exe (进程 17076)已退出,代码为 0。
按任意键关闭此窗口. . .

⭐️2.2.4二进制文件输入输出

Reads data from a stream.
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
Writes data to a stream.
size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );
名称 详情
fread 二进制读取文件函数
头文件 stdio.h
参数void *buffer 目标地址
参数 size_t size 单个元素字节数
参数size_t count 读取元素个数
返回值 无符号整型(返回实际读取的完整项目数,如果发生错误或在达到计数之前遇到文件结尾,则该值可能小于计数。)
作用 读取文件
名称 详情
fwrite 二进制写入文件函数
头文件 stdio.h
参数const void *buffer 原数据地址
参数 size_t size 单个元素字节数
参数size_t count 写入元素个数
返回值 无符号整型(返回实际写入的完整项的数量,如果发生错误,该数量可能小于count。)
作用 写入文件
int main()
{
	//打开文件,以w+模式为例,若没指定路径,默认跟随该.c文件
	FILE* pf = fopen("abc.txt", "w+");//read and write
	if (pf == NULL)
	{
		perror("file open");
		return -1;
	}
	int arr[10] = { 24, 28, 32, 36, 42, 48, 56, 66, 86, 99 };
	//文件操作(读文件,写文件)
	//二进制写入文件
	fwrite(arr, sizeof(int), sizeof(arr) / sizeof(arr[0]), pf);
	//将文件指针重新定位到文件的开头
	rewind(pf);
	//二进制读取文件
	int a[10] = { 0 };
	fread(a, sizeof(int), sizeof(a) / sizeof(a[0]), pf);
	//验证
	int i = 0;
	for (i = 0; i < 10; i++)
	{
		printf("%d ", a[i]);
	}

	//关闭文件

	fclose(pf);

	return 0;
}

1234
在文件中储存的是二进制信息,虽然我们读不懂,但是计算机能够读懂它。

运行结果:

24 28 32 36 42 48 56 66 86 99
D:\gtee\C-learning-code-and-project\test_930\Debug\test_930.exe (进程 30204)已退出,代码为 0。
按任意键关闭此窗口. . .

⭐️2.2.5文件随机访问相关函数

首先就是前面栗子中已经使用过的函数rewind,该函数作用就是让“文件指针”指向文件开始的位置上。

Repositions the file pointer to the beginning of a file.
void rewind( FILE *stream );

因为上面栗子已经示范使用过,不再另举例子。

函数fseek,根据文件指针的位置和偏移量来定位文件指针。
函数ftell,返回文件指针相对于起始位置的偏移量。

Moves the file pointer to a specified location.
int fseek( FILE *stream, long offset, int origin );
Gets the current position of a file pointer.
long ftell( FILE *stream );
名称 详情
fseek 文件指针定位函数
头文件 stdio.h
参数FILE *stream 目标文件指针
参数 long offset 距离初始位置的偏移量
参数int origin 初始位置,有三个值可选,1.SEEK_CUR:文件当前位置;2.SEEK_END:文件末尾位置;3.SEEK_SET:文件开始位置
返回值 整型(返回0表示定位文件指针成功,否则失败)
作用 设置文件指针位置

123456

fseek(fp, 0L, SEEK_SET); // 定位至文件开始处 
fseek(fp, 10L, SEEK_SET); // 定位至文件中的第10个字节 
fseek(fp, 2L, SEEK_CUR); // 从文件当前位置前移2个字节 
fseek(fp, 0L, SEEK_END); // 定位至文件结尾 
fseek(fp, -10L, SEEK_END); // 从文件结尾处回退10个字节
名称 详情
ftell 文件偏移量函数
头文件 stdio.h
参数FILE *stream 目标文件指针
返回值 长整型(返回距离文件开始位置的偏移量大小)
作用 计算距文件开始的偏移量

✨3.文件结束判断与缓冲

🌟3.1文件读取结束判断

对于feof函数,用来判断是否位于文件末尾,参数为文件指针,如果不是文件末尾则返回0,否则返回非0值。

Tests for end-of-file on a stream.
int feof( FILE *stream );

该函数常常配合ferror函数来判断文件读取结束是因为文件读取完成而结束还是因为输入输出异常而导致文件读取结束,简单说就是判断文件读取结束是正常结束还是异常结束。
对于feeror函数,判断流上是否有错误,也就是判断读取过程中是否异常。如果正常返回0,否则返回非0值。

Tests for an error on a stream.
int ferror( FILE *stream );

样例:
1.判断文本文件读取是否正常结束。

#include <stdio.h>
#include <stdlib.h>
int main(void) {
	int c; // 注意:int,非char,要求处理EOF
	FILE* fp = fopen("test.txt", "r");
	if (!fp) {
		perror("File opening failed");
		return EXIT_FAILURE;
	}
	//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
	while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
	{
		putchar(c);
	}
	//判断是什么原因结束的
	if (ferror(fp))
		puts("I/O error when reading");
	else if (feof(fp))
		puts("End of file reached successfully");
	fclose(fp);
	return 0;
}

2.判断二进制文件是否正常结束。
通过判断fread返回值与预期读入元素个数是否相等来判断程序是否出现异常。

#include <stdio.h>
enum { SIZE = 5 };
int main(void) {
	double a[SIZE] = { 1.,2.,3.,4.,5. };
	FILE* fp = fopen("test.bin", "wb"); // 必须用二进制模式
	fwrite(a, sizeof * a, SIZE, fp); // 写 double 的数组
	fclose(fp);
	double b[SIZE];
	fp = fopen("test.bin", "rb");
	size_t ret_code = fread(b, sizeof * b, SIZE, fp); // 读 double 的数组
	if (ret_code == SIZE) {
		puts("Array read successfully, contents: ");
		for (int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
		putchar('\n');
	}
	else { // error handling
		if (feof(fp))
			printf("Error reading test.bin: unexpected end of file\n");
		else if (ferror(fp)) {
			perror("Error reading test.bin");
		}
	}
	fclose(fp);
	return 0;
}

🌟3.2文件缓冲区

ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序
中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装
满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓
冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根
据C编译系统决定的。

12345

因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。