【MIT6.S081/6.828】Lab util: Unix utilities
哈喽,大家好,我是仲一。本篇文章是从零实现操作系统的第一个实验,主要是让我们熟悉 xv6 及其系统调用。做实验以前,建议先阅读下xv6 书籍的第一章。另外,在官网的实验手册中,给出了一些提示,会一步一步引导你完成实验。
1. sleep
1.1 实验要求
实现 UNIX 程序 的sleep,使进程睡眠若干个滴答周期(滴答是 xv6 内核定义的时间概念,即来自定时器芯片的两次中断之间的时间。)。代码在 user/sleep.c
中实现。
提示:
- 查看
user/
中的其他一些程序,了解如何获取传递给程序的命令行参数。如果用户忘记传递参数, sleep 应该打印一条错误消息。 - 命令行参数作为字符串传递;可以使用
atoi
将其转换为整数(参考 user/ulib.c)。 - 使用系统调用
sleep
(参考 user/usys.S 和 kernel/sysproc.c)。 - 确保
main
调用exit()
以退出程序。 - 将程序添加到Makefile 中的
UPROGS
并通过键入make fs.img
编译用户程序。
预期:
$ make qemu
...
init: starting sh
$ sleep 10
(nothing happens for a little while)
$
- 1
- 2
- 3
- 4
- 5
- 6
1.2 代码实现
直接调用系统的sleep函数即可。
int main(int argc, char *argv[]){
if(argc != 2){
fprintf(2, "usage: sleep time\n");
exit(1);
} else {
int time = atoi(argv[1]);
sleep(time);
exit(0);
}
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
1.3 测试
2. pingpong
2.1 实验要求
使用 UNIX 系统调用在两个进程之间通过一对管道“pingpong”一个字节,每个管道一个。父级通过向parent_fd[1]
写入一个字节发送,子级通过从parent_fd[0]
读取来接收它。从父级收到一个字节后,子级通过写入child_fd[1]
以自己的字节进行响应,然后父级读取该字节。代码在文件user/pingpong.c
中实现。
提示:
- 使用
pipe
创建管道。 - 使用
fork
创建一个孩子。 - 使用
read
从管道读取,并使用write
写入管道。
效果:
$ make qemu
...
init: starting sh
$ pingpong
4: received ping
3: received pong
$
- 1
- 2
- 3
- 4
- 5
- 6
- 7
2.2 分析
要解决这个问题,首先要理解管道是什么。下面看下,xv6 book中对管道的定义。
管道是一个小的内核缓冲区,它以文件描述符对的形式提供给进程,一个用于写操作,一个用于读操作。从管道的一端写的数据可以从管道的另一端读取。管道提供了一种进程间交互的方式。
以下这段代码运行了程序 wc
,并把它的标准输出绑定到了一个管道的读端口。
int p[2];
char *argv[2];
argv[0] = "wc";
argv[1] = 0;
pipe(p); //创建一个新的管道并且将读写描述符记录在数组 p 中
if(fork() == 0) {
//unix里面,一切皆文件,所以stdin stdout都可以看成是文件
close(0); //关闭stdin, 对应文件描述符0,这样0就空出来了
dup(p[0]); // 把p[0]拷贝到0,因为0已经关闭了(或者说0号位置空缺),这样wc就从管道的p[0]读取数据,而不是stdin
close(p[0]);
close(p[1]);
exec("/bin/wc", argv);
} else {
write(p[1], "hello world\n", 12);
close(p[0]);
close(p[1]);
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
这段程序调用 pipe
,创建一个新的管道并且将读写描述符记录在数组 p
中。在 fork
之后,父进程和子进程都有了指向管道的文件描述符。子进程将管道的读端口拷贝在描述符0上,关闭 p
中的描述符,然后执行 wc
。当 wc
从标准输入读取时,它实际上是从管道读取的。父进程向管道的写端口写入然后关闭它的两个文件描述符。
2.3 代码实现
#include "kernel/types.h"
#include "kernel/stat.h"
#include "user/user.h"
int main(int argc, char *argv[]){
int parent_fd[2], child_fd[2];
pipe(parent_fd);
pipe(child_fd);
char buf[1];
if(fork() == 0){
close(parent_fd[1]);// 关闭管道parent_fd[1] 因为我们要读取parent_fd[0],管道是单工的,读写端口不能被同时开启。
close(child_fd[0]);// 为什么要关掉child_fd[0] 我的理解是,如果要写入到child_fd[1],避免一写入就被读取,那么我们就要关闭child_fd[0],读写不能被同时开启。
if(read(parent_fd[0],buf,1))//读取父进程发过来的消息,而父进程是通过write(parent_fd[1])来写入到parent_fd缓冲区的,然后在读端口被子进程读到
fprintf(1,"%d: received ping\n",getpid());
//子进程写入
write(child_fd[1],"B",1);
close(child_fd[1]);
} else {
close(parent_fd[0]);
close(child_fd[1]);
//父进程写入
write(parent_fd[1],"A",1);
//父进程接收
if(read(child_fd[0],buf,1))
fprintf(1,"%d: received pong\n",getpid());
close(parent_fd[1]);
}
exit(0);
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
2.4 测试
3. primes
3.1 实验要求
primes的功能是输出2~35之间的素数。这道题比较有意思,具体如下图。
每个框代表一个进程,进程之间管道通信,对于每个进程,输出收到的第一个数记为p,这个数必定为素数,之后收到的每个数如果是第一个数p的倍数,丢弃,反之发送给下一个进程。就是每个进程输出一个素数。
提示:
- 及时关闭进程不需要的文件描述符,否则将会耗尽系统内存。
- 一旦第一个进程达到 35,您应该安排管道终止,包括所有子进程(提示:当管道的写端关闭时,读取将返回文件结束)。
- 将 32 位
int
写入管道是最简单的,而不是使用格式化的 ASCII I/O。
预期:
$ make qemu
...
init: starting sh
$ primes
prime 2
prime 3
prime 5
prime 7
prime 11
prime 13
prime 17
prime 19
prime 23
prime 29
prime 31
$
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
3.2 代码实现
每个进程收到的第一个数p一定是素数,后续的数如果能被p整除则之间丢弃,如果不能则输出到下一个进程。
#include "kernel/types.h"
#include "user/user.h"
void process(int p[])
{
close(p[1]);
int prime;
if (read(p[0], &prime, 4) > 0) {
fprintf(1, "prime %d\n", prime);
int p2[2];
pipe(p2);
if (fork() > 0) {
close(p2[0]);
int i;
while(read(p[0], &i, 4) > 0) {
if (i % prime != 0) {
write(p2[1], &i, 4);
}
}
close(p2[1]);
wait(0);
} else {
close(p[0]);
process(p2);
}
}
}
int
main(int argc, char* argv[])
{
int p[2];
pipe(p);
int pid = fork();
if (pid > 0) { // parent
close(p[0]);
fprintf(1, "prime 2\n");
for (int i = 3; i <= 35; ++i) {
if (i % 2 != 0) {
write(p[1], &i, 4);
}
}
close(p[1]);
wait(0);
} else {
process(p);
}
exit(0);
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
3.3 测试
4. find
4.1 实验要求
编写一个简单版本的 UNIX 查找程序:在目录树中查找名称与字符串匹配的所有文件。代码在文件user/find.c
中实现。
提示:
- 查看 user/ls.c 以了解如何读取目录。
- 使用递归允许查找下降到子目录。
- 不要递归到“。” 和 ”…”。
预期:
$ make qemu
...
init: starting sh
$ mkdir a
$ echo > a/b
$ find . b
./a/b
$
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
4.2 ls代码分析
#include "kernel/types.h"
#include "kernel/stat.h"
#include "user/user.h"
#include "kernel/fs.h"
char*
fmtname(char *path)
{
static char buf[DIRSIZ+1];
char *p;
// Find first character after last slash.
for(p=path+strlen(path); p >= path && *p != '/'; p--)
;
p++;
// Return blank-padded name.
if(strlen(p) >= DIRSIZ)
return p;
memmove(buf, p, strlen(p));
memset(buf+strlen(p), ' ', DIRSIZ-strlen(p));
return buf;
}
void
ls(char *path)
{
char buf[512], *p;
int fd;
struct dirent de; //这个指的是目录项这一结构体(在kernel/fs.h中定义),其实目录也是一种文件,里面就是存放了一系列的目录项
struct stat st; //这个指的是文件的统计信息(在kernel/stat.h中定义),包含文件类型(目录或文件)/inode/文件引用nlink/文件大小/存放fs的disk dev
if((fd = open(path, 0)) < 0){ //打开文件,第二个参数指示的是打开方式,0代表的是O_RDONLY只读的形式。返回值是file descriptor >=0,<0说明open失败
fprintf(2, "ls: cannot open %s\n", path);
return;
}
if(fstat(fd, &st) < 0){ //fstat的含义同open类似
fprintf(2, "ls: cannot stat %s\n", path);
close(fd);
return;
}
switch(st.type){ //switch 中主要是两个逻辑,一个是文件如何处理,一个是目录怎么处理
case T_FILE: //如果是文件,直接打印信息
printf("%s %d %d %l\n", fmtname(path), st.type, st.ino, st.size);//st.type中三个值分别是({1:目录,2:文件,3:console}) fmtname返回值就是文件名称
break;
case T_DIR:
if(strlen(path) + 1 + DIRSIZ + 1 > sizeof buf){ //检查缓存有没有溢出
printf("ls: path too long\n");
break;
}
strcpy(buf, path);
p = buf+strlen(buf);
*p++ = '/'; //拼接字符串,以路径名访问这个目录里面的内容
while(read(fd, &de, sizeof(de)) == sizeof(de)){ //访问目录内容。每次read只是read一个de的大小(也就是一个目录项),只有read到最后一个目录项的下一次read才会返回0,也就不满足while循环条件退出循环,
if(de.inum == 0) //此文件夹无文件,continue操作后进行下一次read
continue;
memmove(p, de.name, DIRSIZ); //memmove为内存之间的迁移,在ls.c里面的意思就是将de.name的内容移动到p指向的指针中
p[DIRSIZ] = 0;
if(stat(buf, &st) < 0){
printf("ls: cannot stat %s\n", buf);
continue;
}
printf("%s %d %d %d\n", fmtname(buf), st.type, st.ino, st.size);
}
break;
}
close(fd);
}
int
main(int argc, char *argv[])
{
int i;
if(argc < 2){
ls("."); //默认展示当前工作目录的所有文件
exit(0);
}
for(i=1; i<argc; i++)
ls(argv[i]); //ls 和我们熟知的linux的ls是不太相同的,xv6的ls是可以接受多个目录作为参数的
exit(0);
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
//kernel/fs.h
struct dirent {
ushort inum;
char name[DIRSIZ];
};
//kernel/stat.h
#define T_DIR 1 // Directory
#define T_FILE 2 // File
#define T_DEVICE 3 // Device
struct stat {
int dev; // File system's disk device
uint ino; // Inode number
short type; // Type of file
short nlink; // Number of links to file
uint64 size; // Size of file in bytes
};
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
4.3 代码实现
直接参考ls源码修改就好,注意控制buf结束符’\0’的位置。
#include "kernel/types.h"
#include "kernel/stat.h"
#include "user/user.h"
#include "kernel/fs.h"
char*
fmtname(char *path) //格式化名字,把名字变成前面没有左斜杠/,仅仅保存文件名
{
static char buf[DIRSIZ+1];
char *p;
// Find first character after last slash.
for(p=path+strlen(path); p >= path && *p != '/'; p--)
;
p++;
// Return blank-padded name.
memmove(buf, p, strlen(p) + 1);
return buf;
}
void
find(char *path, char* findName)
{
char buf[512], *p;
int fd;
struct dirent de;
struct stat st;
if((fd = open(path, 0)) < 0){
fprintf(2, "find: cannot open %s\n", path);
return;
}
if(fstat(fd, &st) < 0){
fprintf(2, "find: cannot stat %s\n", path);
close(fd);
return;
}
switch(st.type){
case T_FILE:// 如果是文件类型,那么比较,文件名是否匹配,匹配则输出
if(strcmp(fmtname(path), findName) == 0)
printf("%s\n", path);
break;
case T_DIR://如果是目录则递归去查找
if(strlen(path) + 1 + DIRSIZ + 1 > sizeof buf){
printf("find: path too long\n");
break;
}
strcpy(buf, path);
p = buf+strlen(buf);
*p++ = '/';//buf是一个绝对路径,p是一个文件名,并通过加"/"前缀拼接在buf的后面
while(read(fd, &de, sizeof(de)) == sizeof(de)){
if(de.inum == 0) {
continue;
}
memmove(p, de.name, DIRSIZ);//memmove, 把de.name信息复制p,其中de.name是char name[255],代表文件名
p[strlen(de.name)] = 0; // 设置文件名结束符
if(strcmp(de.name, ".") == 0 || strcmp(de.name, "..") == 0) {
continue;
}
find(buf, findName);
}
break;
}
close(fd);
}
int
main(int argc, char *argv[])
{
if(argc < 3){
printf("error argc num");
exit(0);
}
find(argv[1], argv[2]);
exit(0);
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
4.4 测试
5. xargs
5.1 实验要求
编写一个简单版本的 UNIX xargs 程序:从标准输入中读取行并为每一行运行一个命令,将该行作为命令的参数提供。代码在文件user/xargs.c
中实现。
提示:
- 使用
fork
和exec
系统调用在每一行输入上调用命令。在 parent 中使用wait
等待 child 完成运行命令。 - 从 stdin 读取一个字符,直到换行符 (’\n’)。
- kernel/param.h 声明了 MAXARG,声明一个 argv 时会用到。
预期:
$ xargs echo byehello toobye hello tooctrl-d$
- 1
5.2 代码实现
#include "kernel/types.h"
#include "kernel/stat.h"
#include "user/user.h"
#include "kernel/param.h"
#define MAXN 1024
int main(int argc, char *argv[])
{
if (argc < 2)
{
fprintf(2, "usage: xargs command\n");
exit(1);
}
char *_argv[MAXARG]; // 存放子进程exec的参数
for (int i = 1; i < argc; i++) // 略去xargs,第一个参数必须是该命令本身
_argv[i - 1] = argv[i];
char buf[MAXN]; // 存放从标准输入转化而来的参数
char c = 0;
int stat = 1; // 从标准输入read返回的状态
while (stat) // 标准输入中还有数据
{
int buf_cnt = 0; // buf尾指针
int arg_begin = 0; // 当前这个参数在buf中开始的位置
int argv_cnt = argc - 1;
while (1) // 读取一行
{
stat = read(0, &c, 1); //从标准输入中读取
if (stat == 0) // 标准输入中没有数据,exit
exit(0);
if (c == ' ' || c == '\n')
{
buf[buf_cnt++] = 0; //最后一个参数必需为0,否则会执行失败
_argv[argv_cnt++] = &buf[arg_begin];
arg_begin = buf_cnt;
if (c == '\n')
break;
}
else
{
buf[buf_cnt++] = c;
}
}
_argv[argv_cnt] = 0; //结束标志
if (fork() == 0)
{
exec(_argv[0], _argv);
}
else
{
wait(0);
}
}
exit(0);
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
5.3 测试
https://blog.csdn.net/laplacebh/article/details/117518581
https://blog.csdn.net/newbaby2012/article/details/118880546
https://blog.csdn.net/zhayujie5200/article/details/106600925/
https://blog.csdn.net/u013577996/article/details/108680888
https://www.zhihu.com/people/wei-rainclear/posts
文章来源: blog.csdn.net,作者:嵌入式与Linux那些事,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/qq_16933601/article/details/120480887
- 点赞
- 收藏
- 关注作者
评论(0)