Linux进程学习【基本认知】

举报
北 海 发表于 2023/05/11 13:37:39 2023/05/11
【摘要】 进程 是计算机中的重要概念,每个运行中的程序都有属于自己的 进程 信息,操作系统可以根据这些信息来进行任务管理,比如在我们Windows中的任务管理器中,可以看到各种运行中的任务信息,这些任务就可以称之为 进程,简单的 进程 二字后面包含着许多知识,比如为什么OS需要对任务进行管理、任务信息是如何组成的、如何创建新任务等,下面我将带大家从 冯诺依曼 结构体系开始,理解学习 进程 相关知识

✨个人主页: Yohifo
🎉所属专栏: Linux学习之旅
🎊每篇一句: 图片来源
🎃操作环境: CentOS 7.6

  • Perseverance is not a long race; it is many short races one after another.
    • 毅力不是一场漫长的比赛;是许多短跑一个接一个。

image.png


@[toc]


📘前言

进程 是计算机中的重要概念,每个运行中的程序都有属于自己的 进程 信息,操作系统可以根据这些信息来进行任务管理,比如在我们Windows中的任务管理器中,可以看到各种运行中的任务信息,这些任务就可以称之为 进程,简单的 进程 二字后面包含着许多知识,比如为什么OS需要对任务进行管理、任务信息是如何组成的、如何创建新任务等,下面我将带大家从 冯诺依曼 结构体系开始,理解学习 进程 相关知识

任务管理器


📘正文

📖冯诺依曼体系

我们今天所有的计算机都离不开 冯诺依曼 体系,这位伟大的计算机科学家早在二十世纪四十年代就提出了这种结构,即计算机应由五部分组成:输入设备存储器运算器控制器输出设备

image.png

各组成部分举例:

  • 输入设备:键盘鼠标声卡网卡摄像头
  • 输出设备:显示屏喇叭网卡打印机
  • 存储器:只读存储器随机存取存储器
  • 运算器+控制器:CPU中央处理器

==注意:== 输入、输出设备 称为外围设备,即 外设,而 外设 一般都会比较慢,比如磁盘;CPU中央处理 的速度是最快的,通过与 存储器 的配合,可以做到高效率处理数据;如果没有 存储器 的存在,那么计算机的整体效率就取决于 外设,正是因为 存储器 的存在,可以对数据进行预加载,CPU 计算时,直接向 存储器 要数据就行了,效率很高。

冯诺依曼和奥本海默在第一台计算机前的合影
image.png

冯诺依曼 体系的高明之处在于可以大大提高计算机的运算效率,得益于 存储器 这个关键部件

结论:

  • 在数据层面,一般 CPU 不和 外设 直接沟通,而是直接和 内存(存储器) 打交道
    程序必须先加载到 内存 中,这是由硬件体系决定的
  • 外设 只会和 内存 打交道

📖系统管理

有了计算机体系后,就需要 操作系统(OS) 对计算机进行管理,就像一个庞大的学校中会有各种教职工,当然计算器是否好用是很大程度上取决于 操作系统 是否给力

image.png

回归正文,先说结论:操作系统 是一款进行软硬件资源管理的软件

我们普通用户无法直接与计算机中的硬件打交道,也就是说,在没有 操作系统 的情况下,我们几乎是无法使用计算机的,于是一些计算机大牛就创造出了各种好用的 操作系统

举些栗子:

  • 最经典的 Unix 操作系统
  • 我们学习的 Linux 操作系统
  • 市面上流通最广的 Windows 操作系统
  • 高效精致的 Mac 操作系统,基于 Unix
  • 生态丰富的 Android 操作系统,基于 Linux
  • 还有很多操作系统,这里就不一一列举,或许下一个操作系统就由你创造

image.png

操作系统 管理的本质: ==先描述,再组织==

  • 描述:通过 struct 结构体对各种数据进行描述
  • 组织:通过 链表 等高效的数据结构对数据进行组织管理

比如在 Linux 中是通过 链表 这种数据结构来进行数据组织的

大体逻辑:操作系统 -> 硬件驱动 -> 硬件

具体的逻辑如下图所示:
image.png

我们开发者位于 用户 这一层,开发各种功能,提供给上一层的 用户群体 使用

操作系统的目的:

  • 操作系统 是一个极其庞大的系统,操作系统 通过对下管理好软硬件资源的手段,对上给用户提供良好(安全、稳定、高效、功能丰富等)的执行环境,这是 操作系统 的目的

==注意:==

  • 操作系统 给我们提供非常良好的服务,并不代表 操作系统 会相信我们,反而,操作系统 不相信任何人
  • 举例理解:就好比银行给我们提供良好的服务,但所有服务都是基于一个小小的柜台窗口,因为银行在为我们提供服务时要确保自身的安全,因此银行的服务是基于 窗口 进行的
  • 操作系统 中也有类似的 窗口,不过它被称为 系统调用,也就是 系统接口
    image.png

image.png


📖进程理解

有了 操作系统 相关知识的铺垫后,就可以正式开始介绍 进程

我们可以将 操作系统 的职能分为四大板块

  • 内存管理
  • 进程管理
  • 文件管理
  • 驱动管理

本文探讨的 进程 相关知识属于 进程管理 板块

进程:

  • 我们以前的任何启动并运行程序的行为,都是由 操作系统 帮助我们将程序转换为 进程,然后完成特定任务
  • 一般课本定义:进程 是程序的一个执行实例,是正在执行的程序(这种说法不全面)
  • 正确定义:进程 由两边组成,分别是 相关代码和数据内核关于进程的相关数据结构

也就是说,一个 进程 应该有两部分,数据信息,此处的 信息(进程控制块) 是由 操作系统 对代码和数据进行描述后生成的 信息块 ,原因很简单,方便进行管理,而这就是管理本质的体现: ==先描述,再组织==

我们对 进程 的相关学习是建立在 进程控制块 上的,上面包含了其对应 进程 的各种信息,下面就来学习一下 数据信息 这两部分知识吧

📃代码与数据

==数据生万物==,任何一个进程都有自己的代码和数据,比如我们常见的 C语言 源文件,经过编译后生成的可执行程序中,就包含着二进制代码和其创建修改的时间、所处位置信息

image.png

当可执行程序 myprocess 运行时,各种数据就会被描述,生成相应的进程控制块

📃进程控制块

进程控制块即PCB(process control block)Linux 中的 PCBtask_struct,程序会被描述生成相应的task_struct 装载至 内存
image.png

进程控制块包含内容:

  • 标示符: 描述本进程的唯一标示符,用来区别其他进程
  • 状态: 任务状态,退出代码,退出信号等
  • 优先级: 相对于其他进程的优先级
  • 程序计数器: 程序中即将被执行的下一条指令的地址
  • 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
  • 上下文数据: 进程执行时处理器的寄存器中的数据
  • I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
  • 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等
  • 其他信息

==注:== ./可执行程序 其实就是将可执行程序加载至内存中,再执行描述+组织

📖查看进程

我们可以通过指令来查看正在运行中的进程信息

📃ps 指令

$ ps ajx | head -1 && ps ajx | grep 进程名 | grep -v grep

功能: 查看进程信息,其中利用管道进行了信息筛选,使得进程信息更加清晰

image.png

==注意:== 我们可以通过函数来主动查看进程的 PID

//函数:获取当前进程PID值
#include<unistd.h>
#include<sys/types.h>

pid_t getpid(void);

将程序简单编写下,就可以验证进程块中的进程信息了

#include<stdio.h>
#include<unistd.h>  //Linux中睡眠函数的头文件
#include<sys/types.h>

int main()
{
  int sec = 0;
  while(1)
  {
    printf("这是一个进程,已经运行了%d秒 当前进程的PID为:%zu\n", sec, getpid());
    sleep(1); //单位是秒,睡眠一秒
    sec++;
  }
  return 0;
}

image.png

==注:== 当程序重新运行后,会生成新的 PID

因为查看进程的指令太长了,所以我们可以结合前面学的自动化构建工具 make ,编写一个 Makefile 文件,文件内容如下所示:

myprocess:process.c
        gcc -o myprocess process.c

.PHONY:clean
clean:
        rm -r myprocess

.PHONY:catP
catP:
        ps ajx | head -1 && ps ajx | grep myprocess | grep -v grep

其中的 make catP 指令就是我们刚刚查看 进程 的那一大串指令
image.png

📃top 指令

$ top

这个指令之前有介绍过,相当于Windows中的 ctrl+alt+del 调出任务管理器一样,top 指令能直接调起 Linux 中的任务管理器,显然,任务管理器中包含有进程相关信息

image.png

📃/proc 目录

$ /proc/

注意:通过热键 tab 查看目录内容

除了上面两种指令查看进程信息外,我们还可以直接去 /proc 这个目录下查看所有进程信息

image.png

此时可以看出 PID 存在的重要性

📃父子进程

进程间存在 父子关系

比如在当前 bash 分支下运行程序,那么程序的 父进程 就是当前 bash 分支

其中,PID 是当前进程的ID,PPID 就是当前进程所属 父进程 的ID
我们一样可以通过函数来查看 父进程 的ID值

//函数:获取当前进程PPID值
#include<unistd.h>
#include<sys/types.h>

pid_t getppid(void);	//用法跟上面的函数完全一样

同样对代码进行小修改,执行指令查看进程信息,可以得到如下结果:
image.png

感兴趣的同学可以去看看 bash 进程的目录中有什么内容

📃小结

简单总结一下:

  • 我们可以通过 pstop/proc 查看进程信息
  • 可以利用函数查看当前进程的 PIDPPID
  • 如果指令很长,可以利用 Makefile 文件
  • 进程间存在父子关系,默认进程的父进程为 bash

==注:==

  • 进程可以创建也可以销毁,通过指令 kill -9 PID 可以销毁指定进程,包括 bash,当然这个指令需要在新的窗口中执行
  • 也可以通过热键 ctrl+c 强制终止当前进程的运行

📖fork 创建子进程

/*
* 创建子进程
* 这个函数有两个返回值
* 进程创建成功时,给父进程返回子进程的PID,给子进程返回0
* 创建失败时,返回 -1
*/
int fork(void)

fork 函数是一个非常重要的函数,它能在当前进程下主动创建 子进程 ,用于程序中
编写代码如下:

#include<stdio.h>
#include<unistd.h>
#include<sys/types.h>

/*
 * 测试fork创建子进程
 * 理解fork函数的返回值
 * 通过if语句进行分流
 * 总结:fork创建子进程成功时,给父进程返回子进程PID,给子进程返回0,
 如果失败返回-1;通过两次fork可以发现当父进程执行后,才会去执行子进程,
 父子进程间存在独立性,即父进程被kill后,子进程任然可以运行,父子进程间存在写时拷贝机制,
 当子进程的值发生改变时,只会作用于子进程中
 */

int main()
{
  pid_t ret = fork(); //获取返回值
  int val = 1;  //比较值
  if(ret == 0)
  {
    //在子进程内再创建(孙)子进程
    pid_t rett = fork();
    if(rett > 0)
    {
      while(1)
      {
        val = 2;  //写时拷贝
        printf("二代进程正在执行 PID:%d PPID:%d 比较值为:%d 地址:%p\n\n", getpid(), getppid(), val, &val);
        sleep(1);
      }
    }
    else if(rett == 0)
    {
      while(1)
      {
        val = 3;  //写时拷贝
        printf("三代进程正在执行 PID:%d PPID:%d 比较值为:%d 地址:%p\n\n", getpid(), getppid(), val, &val);
        sleep(1);
      }
    }
    else
      printf("进程创建失败\n");
  }
  else if(ret > 0)
  {
      while(1)
      {
        val = 1;  //写时拷贝
        printf("一代进程正在执行 PID:%d PPID:%d 比较值为:%d 地址:%p\n\n", getpid(), getppid(), val, &val);
        sleep(1);
      }
  }
  else
    printf("进程创建失败\n");

  return 0;
}

程序运行结果如下:
image.png

不难发现,子进程 是否出现取决于在当前进程中是否调用 fork 函数

fork函数工作原理:

  • fork 创建子进程时,会新建一个属于 子进程PCB ,然后把 父进程 PCB 的大部分数据拷贝过来使用,两者共享一份代码和数据

==各进程间是相互独立的,包括父子进程==
这句话的含义是当我们销毁 父进程 后,它所创建的 子进程 并不会跟着被销毁,而是被 init 1号进程接管,成为一个 孤儿进程
具体表现如下:
image.png

fork 创建子进程时还存在 写时拷贝 这种现象,即存在一个全局变量,当父进程的改变值时,不会影响子进程的值,同理子进程也不会影响父进程,再次印证 相互独立 这个现象
image.png

父子进程相互独立的原因:

  • 代码是只读的,两者互不影响
  • 数据:当其中一个执行流尝试修改数据时,OS 会给当前进程触发 写时拷贝 机制

以上只是对 fork 函数的一个简单介绍,关于这个函数底层是如何实现的,是一件较复杂的事,限于篇幅原因,我会在以后对此函数进行补充

简单做个小结
进程小结:

  • bash 命令行解释器本质上也是一个进程,可以被销毁
  • 命令行启动的所有程序,最终都会变成进程,而该进程对应的父进程都是 bash
  • 父进程被销毁后,子进程会变成 孤儿进程
  • 进程间具有独立性,包括父子进程
  • 因为 写时拷贝 机制,父进程不会影响到子进程

📘总结

以上就是本文关于 进程 相关知识的讲解了,我们从 冯诺依曼 体系切入,理解了为什么需要 操作系统 ,以及 操作系统 是如何对计算机进行合理管理的:先描述,再组织;之后引入 进程 概念,清楚 进程 的构成及如何通过多种方式查看 进程 信息,最后学习了 fork 创建子进程,见识了 进程间具有独立性 这个重要概念。进程 的相关知识还有很多,当然这些知识得在下一篇文章一起学习了

如果你觉得本文写的还不错的话,期待留下一个小小的赞👍,你的支持是我分享的最大动力!

如果本文有不足或错误的地方,随时欢迎指出,我会在第一时间改正


正好在大年初一发文,在此祝各位读者新年快乐!🎇🎆🎇

新的一年争取做到

  • 兔飞猛进
  • 大展宏兔
  • 兔步青云

image.png

相关文章推荐
Linux工具学习之【gdb】
Linux工具学习之【git】
Linux工具学习之【gcc/g++】
Linux工具学习之【vim】
Linux 权限理解和学习
听说Linux基础指令很多?这里都帮你总结好了

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。