【Linux课程学习】:《简易版shell实现和原理》 《哪些命令可以让子进程执行,哪些命令让shell执行(内键命令)?为什么
1.我们让子进程执行cd ..命令的时候,为什么我们执行pwd命令的时候,还是和之前一样,路径没有变化?
本质就是,我们更改的是子进程的环境变量pwd,没有改变父进程的。当执行pwd时,这个进程的环境变量还是由父进程来的。而父进程的环境变量没有改变,所以pwd出来的结果也没有改变。
2.环境变量是由shell自己维护的。
3.在这个简易版shell中,我们没有维护这个环境变量,还是依靠系统的环境变量。当环境没有修改,用的还是系统的环境变量,更改时才写时拷贝。
4.echo命令也是内键命令,因为子进程不会继承父进程的本地环境变量。所以要打印本地变量,只有由shell来做。
打印命令行提示符(PrintCommandLine):
启动shell程序,就是创建-bash进程,本质就是一个进程。
首先看到命令行的提示符是这样的:
[kym@hcss-ecs-32c9 2024-11-26]$
包括:
1.用户名。2.主机名。3.当前的路径。4.命令行提示符。($)
1.USER和LOGNAME(用户名):
LOGNAME:
USER和LOGNAME都与当前用户有关,但LOGNAME是POSIX标准的一部分,更加标准化和一致,所以更推荐用LOHNAME确定当前的用户的登录身份。
USER:
USER的环境变量可能在某些系统中与LOGNAME有相同的值,但因为其行为不一致,在精确用户身份的时候应该慎用。
2.HOSTNAME和PWD:
通过环境变量获取这些信息。
三个函数获得用户信息(GetLOGNAME),主机信息(GetHOSTNAME),当前路径信息(GetPWD)。
通过string进行传递,如果要谁用c语言的字符串,就通过c_str()进行获得底层char。
头文件:
#include <stdio.h>
函数原型:
int sprintf(char *str, const char *format, ...);
int snprintf(char *str, size_t size, const char *format, ...);
将这些输入到一个字符串中。
const size_t basesize=1024;
//获取用户名信息
string GetLOGNAME()
{
string log_name=getenv("LOGNAME");
return log_name.empty()?"None":log_name;
}
//获取当前主机信息
string GetHSOTNAME()
{
string host_name=getenv("HOSTNAME");
return host_name.empty()?"None":host_name;
}
//获取当前路径信息
string GetPWD()
{
string pwd=getenv("PWD");
if(pwd.empty())
return "None";
string separator="/";
string sub_str=pwd.substr(pwd.find_last_of(separator)+1);
return sub_str;
}
//生成command_line字符串
string MakeCommandLine()
{
//[kym@hcss-ecs-32c9 2024-11-26]$
char command_line[basesize];
snprintf(command_line,basesize,"[%s@%s %s]@",\
GetLOGNAME().c_str(),\
GetHSOTNAME().c_str(),\
GetPWD().c_str());
return command_line;
}
// //1.打印命令行提示符
void PrintCommandLine()
{
printf("%s",MakeCommandLine().c_str());
fflush(stdout);
}
获取命令行信息(GetCommadLine)
bool GetCommandLine(char command_buff[],size_t size)
{
char* result=fgets(command_buff,size,stdin);
if(result==NULL)
return false;
result[strlen(result)-1]=0;
return true;
}
读取失败返回false,读取成功把换行符覆盖。
读取时,处理换行符:
如果我们以一行来读取字符串,那么最会就有换行符,换行符也会读取进来。所以打印的时候,我们没有加换行,也是来到了新的一行。
解决办法:
在返回前,把\n置为0。
result[strlen(result)-1]=0;
解析命令行(ParseCommandLine)
通过strtok函数进行分解字符串。
#include <string.h>
char *strtok(char *str, const char *delim);
bool ParseCommandLine(char command_buff[],int len)
{
(void)len;
argc=0; //初始化
memset(argv,0,sizeof(argv));
const char* sep=" ";
argv[argc++]=strtok(command_buff,sep);
while((bool)(argv[argc++]=strtok(nullptr,sep)));
argc--;
return false;
}
sep表示分隔符,用来把字符串进行分解。但是在分解之前,我们需要把argc和argv进行初始化。每次执行新的命令。
strtok函数第一次调用的时候,str指向要分割的字符串。在后续的调用中传NULL。因为strtok函数内部有静态变量维护当前字符串的位置。
执行命令(ExecuteCommand)
通过子进程发生程序替换。当id==0,表示子进程。如果发生了程序替换,还执行了原来的exit,就表示发生错误。然后就是父进程子进程。
bool ExecuteCommand()
{
pid_t id=fork();
if(id<0)
return false;
if(id==0)
{
execvp(argv[0],argv);
exit(1);
}
int status=0;
pid_t rid=waitpid(id,&status,0);
if(rid<0)
{
//等待失败
}
else
{
return true;
}
return false;
}
哪些命令可以让子进程执行,哪些命令不能让子进程执行?为什么?
让shell去执行的命令,叫做内键命令。
当执行cd命令时,为什么pwd没有改变?
我们写的超简易版shell中,让子进程去执行cd .. 。但是其他的进程不是由子进程产生的,不会继承子进程的环境变量,还是去继承父进程的环境变量。虽然在子进程中改了环境变量,但是没有得到进程,所以不起作用。在真正的shell中,就是要去改变shell的环境变量。因为其他的进程都是bash的子进程。
通过getcwd获取实时的cwd,通过putenv导入环境变量:
//获取当前路径信息
string GetPWD()
{
if(nullptr==getcwd(cwd,sizeof(cwd)))
return "None";
snprintf(pwdenv,sizeof(pwdenv),"PWD=%s",cwd);
//更新env
putenv(pwdenv);
return cwd;
}
myshell维护自己的环境变量:
环境变量和本地变量是存在于shell中的一个表。这两张表就是全局的char*数组。指向很多的字符串。后序我们碰见要导入环境变量的命令,我们直接在shell中的genv数组指向一个堆空间,然后把第一个为空的数组指向这个字符串。
为什么要新申请空间,然后拷贝,再指向?
因为我们每执行一个命令,argv都是会变化的。如果我们直接让genv的元素指向argv的元素,以后会发生变化。这样环境变量就找不到了。
————————————————
- 点赞
- 收藏
- 关注作者
评论(0)