Linux进程概念

举报
卖寂寞的小男孩 发表于 2022/10/03 09:09:47 2022/10/03
【摘要】 本文主要介绍进程的基本概念

@[toc]

零.前言

本文为介绍进程的第一篇,将介绍操作系统对进程管理过程中的先描述,在组织的过程,并介绍PCB中的基本内容及作用。

1.什么是进程

进程是一个执行的实例,即正在被执行的程序。
我们可以打开win下的进程管理器,里面的内容给就是一个一个的进程。
在这里插入图片描述
由于可能存在大量的进程,操作系统需要对进程来进行管理,管理的方式就是:先描述,再组织。

2.Linux系统下查看进程

(1)ps axj|grep 进程名

要观察进程,那么这个进程一定是在一个执行的条件下才能进行观察,因此我们可以写一个死循环的程序,使它一直在运行:

 #include<stdio.h>    
  int main()    
  {    
    while(1)    
    {    
      printf("hello process!\n");    
      sleep(1);    
    }    
    return 0;                                                                                                   
  }    

我们来运行一下这个程序,要观察进程还需要再开出一个窗口来输入命令,查看进程。

ps ajx|head -1 && ps axj |grep “mytest”

使用该命令我们就可以查看当前的进程了。
在这里插入图片描述
这一行显示的就是当前进程的各种属性,当然这并不完全。上面一行就是属性的名称(也就是要写入task_struct中的内容),至于下面一行,由于grep指令也会创建一个进程,所以我们可以先不用考虑它。
如果我们将程序Ctrl C结束掉,此时再查看进程,我们发现该进程已经没有了:
在这里插入图片描述

(2)/proc查看

在这里插入图片描述
我们还可以在proc系统文件夹中通过查找进程码来进行进程查看,此时即显示该进程的信息,其中exe表示的是当前正在执行谁,cwd表示的是当前工作目录,其实这也就是为什么我们使用C语言进行创建文件,默认路径就是当前路径的原因,它会通过cwd读取当前路径再创建文件。

3.PCB

从上一节中,我们了解了操作系统的管理方式是:先描述,再组织。其中先描述指的是将信息存入结构体中,再组织指的是将这些
结构体以一定的数据结构进行链接起来。
放到进程上来说,其中存放进程信息的结构体叫做:进程控制块,简称PCB(process control blog),PCB就是操作系统对进程的先描述的体现。
注意,PCB是一个总称,在Linux系统下的PCB是一个名为task_struct的结构体(Linux是使用C语言写的)。也就是说在Linux系统下,每创建一个进程就会建立一个task_struct结构体来存储该进程的基本信息。
这有点类似shell和bash两者之间的关系。

4.进程和程序之间的关系

我们所说的程序通常是指可执行程序,它本质上就是一个文件,当我们要运行这个程序的时候,我们会将其加载到内存中:
在这里插入图片描述
在加载到内存中之后,操作系统会为该程序建立一个PCB来存储该程序中的信息,PCB与程序的总体就称为进程。
进程=程序文件内容+与进程相关的数据结构(PCB)
即用红色部分圈起来的整体。
操作系统对进程的管理不是直接对程序文件进行操作,而是通过PCB(管理者与被管理者不接触的原则)进行管理,因此PCB中一定存在找到该程序文件的信息,程序文件包括程序代码和数据
在内存中不可能只存在一个进程,不同进程的PCB操作系统使用一定的数据结构连接起来,这就是再组织的过程,注意连接的是PCB而不是程序文件。
在这里插入图片描述

5.Linux下(PCB)task_struct中的内容

(1)PID和PPID

PID表示的是当前进程的编号,PPID表示的是当前进程的父进程的编号。
我们可以使用getpid()和getppid()两个函数来打印当前进程的编号,还拿之前的代码进行举例:

#include<stdio.h>    
#include<unistd.h>    
int main()    
{    
  while(1)    
  {    
   printf("pid:%d  ppid:%d\n",getpid(),getppid());    
   sleep(2);                                                   
  }    
  return 0;    
}   

然后运行这个程序,我们可以观察到它的进程和它的父进程的编号:
在这里插入图片描述
分别是900和26326,那么它的父进程到底是谁呢?
我们可以在另一个界面查看一下:
在这里插入图片描述
我们发现父进程就是bash。同时我们还需要知道一个结论。
在命令行执行的命令其实也是进程它们的父进程都是bash。

(2)状态

状态包括:任务状态,退出代码,退出信号等。
这里只对退出码来进行说明,该部分比较重要,需要篇幅较大,在之后的内容再来提及。
我们在写C语言和C++程序的时候,最后是不是都要有一个返回值呢?在大部分情况下,返回值是0,即return 0,其实这个0就是该程序的退出码。
如果让我们的程序返回100呢?那么这个程序的退出码就是100。

int main()      
{      
  return 100;
} 

我们可以通过:

echo $?

指令来查看程序退出码:
该命令查看的退出码是离该命令最近的进程的退出码。
在这里插入图片描述

(3)优先级

CPU的资源是有限的,而进程有多个,这就存在谁先使用CPU谁后使用CPU的问题。
在这里插入图片描述
优先级指的是该进程相对于其他进程的优先级。然后通过优先级队列来按顺序使用CPU资源。注意优先级队列的元素不是程序而是程序的PCB。通过PCB可以找到该程序。
即不同进程执行的顺序,注意优先级决定的先后问题,而之前所说的权限指的是能与不能的问题。

(4)程序计数器

程序中即将被执行的下一条指令的地址。
当程序文件被加载到CPU中之后,程序需要被一条一条的执行,CPU有一个pc寄存器,其中存放的就是下一条指令的地址。
从而使得程序可以一步一步正常运行下去。它也显示在我们的PCB中。

(5)内存指针

可以理解为,根据PCB中的内存指针可以帮我们找到程序的代码和数据,即程序文件在内存的位置。

(6)I/O状态信息

进程可能会对外存进行操作,比如一个C语言程序可以进行文件的读写,I/O状态信息存入的就是该进程可以访问的外部设备的信息。

(7)记账信息

记账信息,即该进程处理时间总和,使用的时钟数总和,时间限制,记账号等等。从而保证各个进程公平地分配CPU的资源。

(8)上下文数据

我们知道,进程在由CPU执行的时候是按一定顺序的,有优先级队列来控制执行的顺序。
在CPU中有一组存放临时数据的存储单元,我们称之为寄存器,当进程加载到CPU中之后,寄存器会保存正在运行的程序的临时数据。
有了寄存器的概念,下面我们来讨论上下文数据这一概念:
我们发现,虽然有优先级队列来规定进程的执行顺序,但是在我们自己的电脑中,为什么可以同时运行多个进程呢?
其本质是通过CPU的快速切换完成的。
在这里插入图片描述
这才是操作系统控制CPU处理进程的方式,让第一个进程(对应PCB1)在CPU中运行一段时间(并没有运行结束),然后将其放在优先级队列的队尾,然后CPU处理第二个进程,处理一段时间后(没执行完),将第二个进程再放到队尾,依次类推。
其中处理的一段时间,我们称之为:时间片。时间片通常很短,因此我们感觉的就是多个进程在同时执行。
那么问题又出现了,当进程1在CPU中每一次执行之后是会产生临时数据的,存放在寄存器中,之后进程二占用CPU,此时由于寄存器只有一套,那么进程二产生的临时数据就会对寄存器中的内容进行刷新。当进程1再来占用CPU的时候之前产生的临时数据没了?那怎么确定进程1执行到哪里了呢?
此时才引出了我们的主角:上下文数据。它会保存进程每一次在CPU执行之后得到的临时数据,存放在PCB中,当又一次轮到该进程使用CPU的时候,上下文数据会直接导入到寄存器中,从而控制进程的执行进度。
同时,通过上下文数据,我们也可以感受到进程是被切换的。

(9)其他信息

还有好多信息这里不一一列举了。

6.总结

通过本文我们了解了,查看进程的两种指令方法,PCB中的信息的含义与作用。以及CPU对多个进程的调度方法。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。