【Linux仓库】进程概念与基本操作【进程·贰】

举报
egoist2023 发表于 2025/09/15 18:25:54 2025/09/15
【摘要】 本文摘要:本文介绍了Linux中进程的基本概念与操作。进程由内核数据结构(PCB)和代码数据组成,操作系统通过链表管理多个进程。讲解了进程属性(PID、状态、优先级等)和进程切换机制(上下文保存与恢复)。通过/proc系统文件夹和ps工具可查看进程信息,包括父进程PPID。重点阐述了fork系统调用创建子进程的过程及其双返回值特性(父进程返回子进程PID,子进程返回0),为后续学习进程管理和虚拟地

目录

粗略理解进程

进程概念

进程操作

fork创建进程

粗略理解进程
我们说过在C/C++中可执行程序需要加载到内存当中,交给CPU进行执行。那么进程是指什么呢?

在下图中,可执行程序加载到内存,此时操作系统会分配一个PCB指向加载的代码和数据,将PCB+代码和数据称为一个进程(实际上是内核数据结构,但虚拟地址空间、页表需后面学习)。

struct PCB
{
//包含进程的所有的属性信息
代码地址
数据地址
int pid
struct PCB *next; //实际是双链表进行连接
};

那么可以有多个程序加载到内存中吗?肯定可以。

势必意味着存在多个进程,那么操作系统要不要管理这些大量的进程呢?该如何管理这些进程呢?

因此操作系统对进程的管理,就转成对链表的增删查改操作!

扩展:

每一个进程会以双链表的形式进行链接
这里的运行队列(runqueue)会链接该进程链表,执行进程
由于有多个进程,那么每一个进程就都要排队。因此进程排队,本质是让PCB结点进行排队。

进程概念
 标示符: 描述本进程的唯⼀标示符,⽤来区别其他进程。
 状态: 任务状态,退出代码,退出信号等。
 优先级: 相对于其他进程的优先级。
 程序计数器: 程序中即将被执⾏的下⼀条指令的地址。
 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
 上下⽂数据: 进程执⾏时处理器的寄存器中的数据。
 I / O状态信息: 包括显⽰的I/O请求,分配给进程的I∕O设备和被进程使⽤的⽂件列表。
 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
 …
代码和数据加载到内存,操作系统创建一个PCB指向加载的代码和数据,将内核数据结构(PCB)+ 代码和数据 称为进程,这个进程需要被执行。而进程的执行会牵扯到进程状态、进程优先级、进程切换的问题,我们在后续章节一一展开。(这里浅浅认识下)

按照我们的理解一个进程不应该执行完再执行下一个进程吗?

而我们日常打开浏览器,wps,微信时,它们却能同时存在,这说明进程被执行的时候,并不是把这个进程执行完再下一个,而是要做切换、调度的!!!

但我由进程1切换到进程2时,后面我又要执行进程1时,就要重新执行,这显然不是我们所期望的。因此,在CPU中有一套寄存器(上下文数据),它会记录当时进程执行到的代码和数据,下一次轮到该进程被执行时,只需要做硬件上下文的保存和恢复,而不需要重新执行该进程!!!

CPU中有一个IR用来获取代码和数据,它通过PC(程序计数器)所指向的代码进行获取。

寄存器里的内容:

进程操作
查看进程
既然每一个进程都有自己的标示符,那么系统是否提供接口供我们查看进程所在标示符呢?

/proc系统文件夹查看
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
while(1)
{
printf(“pid: %d\n”, getpid());
}
return 0;
}

那么id为250128的进程里面的内容有什么呢?

可以看到进程里面的exe和cwd是什么呢?

exe不就是我们的可执行程序吗?这说明进程会记录自己对应的磁盘二进制可执行文件!

cwd为进程启动的时候,默认工作路径是自己可执行程序所处的路径,指向当前进程的工作路径。

而我们之前使用fopen库函数时,是在当前路径下进行打开。那么什么叫做当前路径呢?

ps工具获取

在上图中的PPID又是什么呢?它是当前进程的父进程,那么操作系统又是否提供了查看父进程标示符的系统调用呢?

这里的bash不就是当时王婆婚介所的王婆吗?她通过派出自己婚介所的人员进行执行。

fork创建进程 
Linux系统,增多进程,是通过父进程创建子进程的方式,让Linux系统中的进程变多的!!!

那么该如何创建子进程呢?

fork返回值 
可以看到fork是有返回值的,那么它的返回值是用来做啥的呢?如下所示

问题1:返回值为什么是这样的?成功创建,父进程返回子进程pid,子进程返回0
问题2:一个函数怎么会有两个返回值?
问题3:在我们的印象当中,一个变量不应该只有一个返回值吗?为什么这里一个变量可以返回一个大于0,又能返回等于0?需要学虚拟地址空间才能解惑,先晾在一边。
解惑问题1:

父进程创建子进程可以是1:n的关系,而父进程只能有1个,但子进程可以有多个。

因此父:子 = 1:n的关系。

而子进程要找到父进程的方式很容易,因为它是唯一的。但是父进程要找到子进程是不容易的,它需要拿到子进程的pid。

解惑问题2:

证明确实有两个返回值:

为什么有两个返回值:

在fork的内部在返回值之前就创建了子进程,此时父子分别执行不同的代码区域,从而实现让父子执行不同的任务!即父子可以返回各自有返回值,这是可以理解的。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。