[linux仓库]透视文件IO:从C库函数的‘表象’到系统调用的‘本质’

举报
egoist2023 发表于 2025/09/15 18:39:51 2025/09/15
【摘要】 本文介绍了Linux基础IO知识,重点讲解了文件操作和系统调用。内容涵盖:1. 文件=内容+属性,操作系统通过"先描述再组织"管理打开的文件;2. C语言文件接口(fopen/fwrite等)的使用和底层原理;3. 系统调用open的用法,包括O_CREAT/O_APPEND等标志位;4. 进程与文件的关系,解释了为何需要工作目录(cwd)

文件的引入
#include<stdio.h>
#include<time.h>
#include<stdlib.h>
#include<unistd.h>
#include<sys/wait.h>

//父子进程会写时拷贝,通过fork,让子进程对父进程数据进行并发备份的代码
int grray[100];

pid_t backup(const char *filename)
{
pid_t id =fork();
if(id==0)
{
//子进程完成对数据的备份
FILE *fp = fopen(filename,“w”);
for(int i=0;i<100;i++)
{
fprintf(fp,“%d”,grray[i]);
}
fclose(fp);
exit(0);
}
return id;
}

int main()
{
srand(time(NULL)^getpid());
//父进程未来的数据
for(int i=0;i<100;i++)
{
grray[i]=rand()%10;
}
//要求父进程对自己每一轮数据进行保存
pid_t sub1 = backup(“log1.txt”);

for(int i=0;i<100;i++)
{
    grray[i]=rand()%10;
}
pid_t sub2 = backup("log2.txt");

for(int i=0;i<100;i++)
{
    grray[i]=rand()%10;
}
pid_t sub3 = backup("log3.txt");

waitpid(sub1,NULL,0);
waitpid(sub2,NULL,0);
waitpid(sub3,NULL,0);

return 0;

}

父进程创建子进程,让子进程执行一个全新的程序:子进程执行父进程代码的一部分。若父进程要修改数据,此时会发生写时拷贝。通过fork让子进程对父进程数据进行并发备份,完成了把数据备份到文件内容的要求。

基础IO – 理解文件内容
背景补充
文件 = 内容 +属性
访问一个文件,都必须先把对应文件打开–>为什么呢?本质上是把文件加载到内存中
如果一个文件没有被打开,那么它就在磁盘中
我的文件被谁打开的? -->用户通过bash,创建子进程,让这个进程通过操作系统打开这个文件的。

被打开的文件,该如何处理?
未被打开的文件,又是怎样做的?
那么os内,一定同时存在大量的被打开的文件!!! --> 操作系统要不要管理这些被打开的文件呢?(文件是属于哪个进程的,文件权限是什么,是只可读还是都可以) --> 先描述,在组织!!!
进程有task_struct,未来进程也有要打开的文件,因此平时研究打开文件,本质是研究:进程与文件的关系!!!

狭义理解
文件在磁盘里
磁盘是永久性存储介质,因此⽂件在磁盘上的存储是永久性的(相对内存是临时性存储介质)
磁盘是外设(即是输出设备也是输⼊设备)
磁盘上的⽂件 本质是对文件的所有操作,都是对外设的 输入和输出 简称 IO
广义理解
Linux 下⼀切皆文件(键盘、显示器、网卡、磁盘…… 这些都是抽象化的过程)(后⾯会讲如何去

理解)

文件操作的归类认知
对于 0KB内容 的空⽂件是占⽤磁盘空间的
⽂件是⽂件属性(元数据)和⽂件内容的集合(⽂件 = 属性(元数据)+ 内容)
所有的⽂件操作本质是⽂件内容操作和⽂件属性操
系统角度
对⽂件的操作本质是进程对⽂件的操作
磁盘的管理者是操作系统
文件的读写本质不是通过 C 语⾔ / C++ 的库函数来操作的(这些库函数只是为用户提供⽅便),⽽是通过⽂件相关的系统调⽤接⼝来实现的
回顾C文件接口
//默认往当前路径创建文件并进行写入
FILE *fp = fopen(“log.txt”,“w”);
if(!fp)
{
perror(“fopen”);
return 1;
}
const char *str = “hello linux\n”;
//如果我们要想文件中写入一个字符串,strlen()+1? 不要!!!
fwrite(str,strlen(str),1,fp);
fclose(fp);
fopen默认从当前路径下新建文件,那么当前路径从哪来呢?有了前面学习,我们清楚是从cwd来的。那我的cwd又如何被拿到的呢?进程记录了cwd

如何查看当前正在运行进程的信息:

要打开文件,就需要知道文件路径+文件名,那么意味着我们只要更改工作路径,就可以把文件创建到其他路径并进行写入。

fopen接口

可以看到打开一个文件,既可以只进行读取,也可以只进行写入,又或者是读写,C语言库函数给我提供了诸多选项,接下来进行一一介绍。

“w”
不存在该文件进行创建,若存在该文件会将内容做清空再进行写入。

#include <stdio.h>
#include <string.h>

int main()
{
FILE *fp = fopen(“log.txt”, “w”);
if (!fp)
{
perror(“fopen”);
exit(1);
}
const char *str = “hello linux!\n”;
size_t n = fwrite(str, strlen(str), 1, fp);
fclose(fp);
return 0;
}

这个功能和我们之前学的 > 重定向是类似的,又或者说 > 的底层不就是"w"吗?

“a”
不存在该文件进行创建,若存在该文件不会将内容做清空,进行追加内容。

这个功能和我们之前学的 >> 重定向是类似的,又或者说 >> 的底层不就是"a"吗?

“r” 
对文件内容进行读取。

输出信息到显示器的方法
引入

方法
putc
fwrite
size_t fwrite(const void ptr[restrict .size * .nmemb], size_t size, size_t nmemb, FILE*restrict stream); // 第一个参数表示是与类型无关的
fputs
fwrite
fprintf

易用性:让程序无需复杂配置即可实现基本的输入输出。
规范性:统一所有程序的 IO 接口,便于系统管理和用户操作。
灵活性:通过重定向和分离错误流,适应多样化的应用场景(交互、批处理、日志记录等)。

向显示器上打印,本质就是向stdout上写入,也是一个文件,因此是向一个文件写入,因为stdout也是FILE*。

int main()
{
const char *s1 = “hello printf\n”;
printf(s1);

const char *s2 = “hello fprintf\n”;
fprintf(stdout,s2);

const char *s3 = “hello fputs\n”;
fputs(s3,stdout);

//fwrite不区分文本和二进制
const char *s4 = “hello fwrite\n”;
fwrite(s4,strlen(s4),1,stdout);

return 0;
}
系统文件IO
开⽂件的⽅式不仅仅是fopen,ifstream等流式,语⾔层的⽅案,其实系统才是打开⽂件最底层的方案。

传递标志位
学习系统⽂件IO之前,先要了解下如何给函数传递标志位,该⽅法在系统⽂件IO接⼝中会使⽤:

//位图传递标记位置
#define VERSION1 (1<<0) //1
#define VERSION2 (1<<1) //2
#define VERSION3 (1<<2) //4
#define VERSION4 (1<<3) //8
#define VERSION5 (1<<4) //16

void ShowVersion(int flags)
{
if(flags & VERSION1)
printf(“Version1\n”);
if(flags & VERSION2)
printf(“Version2\n”);
if(flags & VERSION3)
printf(“Version3\n”);
if(flags & VERSION4)
printf(“Version4\n”);
if(flags & VERSION5)
printf(“Version5\n”);
}

int main()
{
ShowVersion(VERSION1); //显示版本
printf(“---------------\n”);
ShowVersion(VERSION1 | VERSION2 ); //显示版本
printf(“---------------\n”);
ShowVersion(VERSION1 | VERSION5); //显示版本
printf(“---------------\n”);
ShowVersion(VERSION1 | VERSION2 | VERSION5); //显示版本
printf(“---------------\n”);
ShowVersion(VERSION1 | VERSION2 | VERSION3 | VERSION4 | VERSION5); //显示版本
printf(“---------------\n”);
return 0;
}
open系统调用

pathname: 文件路径+文件名 
flags:打开⽂件时,可以传⼊多个参数选项,⽤下⾯的⼀个或者多个常量进⾏“或”运算,构成flags。(32个比特位,一个比特位,一个标志位)
参数:就是宏,一个数字,只有一个比特位是1
O_RDONLY: 只读打开
O_WRONLY: 只写打开
O_RDWR : 读,写打开(这三个常量,必须指定⼀个且只能指定⼀个)
O_CREAT : 若⽂件不存在,则创建它。需要使⽤mode选项,来指明新⽂件的访问权限
O_APPEND: 追加写
… :如果文件不存在时。创建文件时可以给它设置权限(如果打开的文件本身存在,用两个参数的open即可)

成功:新打开的⽂件描述符
失败:-1
O_RONLY

O_CREAT

我们也可以给一个文件加上权限:

int fd = open(“log.txt”,O_CREAT | O_RONLY,0666);

O_TRUNC
作用:清空文件内容

C语言库函数的底层一定是这样做的。

O_APPEND 
作用:对文件内容进行追加

C语言库函数的底层一定也是这样做的。

扩展
问题1:为什么C语言要封装文件操作接口?为什么大部分的语言,都要对系统调用做封装?

系统调用麻烦不是主要原因;
支持跨平台性、可移植性。

问题2:为什么要学习系统调用?

总结
本文介绍了Linux基础IO相关知识,重点讲解了文件操作和系统调用。主要内容包括:

通过fork实现父子进程的数据备份;
文件的基本概念(内容+属性)和访问原理;
C语言文件操作接口(fopen、fwrite等)的使用和原理;
系统调用open的使用方法及其参数标志位的传递方式。文章还探讨了C语言封装系统调用的原因(跨平台性)和学习系统调用的重要性(理解底层机制)。通过实例代码和概念解析,帮助读者深入理解文件IO操作的本质。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。