当前位置:首页 > 文章列表 > 文章 > linux > Linux父子进程fork机制深度解析

Linux父子进程fork机制深度解析

2025-05-04 18:57:27 0浏览 收藏

在Linux系统中,进程是操作系统最重要的执行单元,而父子进程的创建与管理是系统资源分配和任务并行的关键。通过fork函数,Linux能够快速高效地复制一个进程,使得父子进程协同工作成为可能。本文详细解析了Linux父子进程的运行特性、fork的核心机制及其在实际开发中的应用,帮助读者掌握系统编程的核心技能,并为优化资源利用与提高程序性能提供理论基础。

前言

在Linux系统中,进程是操作系统最重要的执行单元,而父子进程的创建与管理更是系统资源分配和任务并行的关键。通过fork函数,Linux能够快速高效地复制一个进程,使得父子进程协同工作成为可能。理解父子进程的运行机制不仅有助于掌握系统编程的核心技能,更能为优化资源利用与提高程序性能提供理论基础。本文将带你从基础原理出发,解析Linux父子进程的运行特性、fork的核心机制及其在实际开发中的应用。


一、进程PID

PID 是用来唯一标识一个进程的属性,我们可以使用 ps 指令查看一个进程的部分属性。进程的属性信息是由操作系统来维护的,这些信息被存储在一个 task_struct 结构体中,属于操作系统内核中的数据。由于操作系统本身是不相信用户的,所以用户无法直接去访问 task_struct 对象中的成员,因此 ps 指令能够显示进程的属性信息,本质上是通过系统调用接口去实现的。

1.1 通过系统调用接口查看进程PID

获取进程的 PID 需要用到系统调用接口 getpid() ,该函数会返回调用该函数的进程的 PID,返回值类型为 pid_t 。如下图我们使用 man getpid 指令去查看 getpid 的基础文档:

父子进程的故事:解读Linux中的fork机制在这里插入图片描述

注意上图中还有一个 getppid 是什么呢?不难猜到,这应该是用来获取父进程 PID 的系统调用接口,接下来我们写段代码来具象化 PID 吧。 注意上图中还有一个 getppid 是什么呢?不难猜到,这应该是用来获取父进程 PID 的系统调用接口,接下来我们写段代码来具象化 PID 吧。

代码语言:javascript代码运行次数:0运行复制
#include     #include     #include     int main()    {        while(1)        {            printf("I am a process, my id is: %d, parent id is: %d\n", getpid(), getppid());                                          sleep(1);        }        return 0;    }

我们可以写一个脚本来实时获取上面这段代码执行起来后的进程信息。

父子进程的故事:解读Linux中的fork机制在这里插入图片描述
父子进程的故事:解读Linux中的fork机制在这里插入图片描述

可以看到,我一个将这段代码执行了两次,每一次的子进程 PID 都在发生变化,但是父进程的 PID 从未更改。

为了保证数据的准确性,我们再使用 ps 指令对比以下获取到的进程 PID 是否真的一样。

代码语言:javascript代码运行次数:0运行复制
while :; do ps axj | head -1 ; ps axj |grep process | grep -v grep ;  sleep 1 ; done
父子进程的故事:解读Linux中的fork机制在这里插入图片描述
父子进程的故事:解读Linux中的fork机制在这里插入图片描述

结论:我们用 getpidgetppid 得到的父子进程的 PIDps 指令获取到的进程 PID 是一样的

二、通过系统调用创建进程-fork初识

之前我们自己创建进程都是通过写一份源代码,然后去编译运行,最终得到一个进程,今天给大家介绍另一种通过系统调用接口 fork 去创建进程的方式。一样的,我们使用 man fork 去查看一下 fork 的相关文档:

父子进程的故事:解读Linux中的fork机制在这里插入图片描述

大致意思就是:fork 函数会以调用该函数的进程作为父进程去创建一个子进程.

父子进程的故事:解读Linux中的fork机制在这里插入图片描述

创建成功时,会在父进程中返回子进程的 PID ,在子进程中返回 0 。否则就在父进程中返回 -1 ,子进程创建失败。

2.1 调用fork函数后的现象代码语言:javascript代码运行次数:0运行复制
#include       #include       #include  int main()                                                           {        printf("before:only one line\n");        fork();        printf("after:only one line\n");            return 0;    }
父子进程的故事:解读Linux中的fork机制在这里插入图片描述

如上图所示,fork 后面的代码执行了两次!这是什么原因呢?我们再写一段代码跑跑。

代码语言:javascript代码运行次数:0运行复制
#include       #include       #include  int main()    {        printf("begin:我是一个进程,pid:%d, ppid:%d\n",getpid(), getppid());            pid_t id = fork();        if(id > 0)        {            while(1)            {                printf("我是父进程,pid:%d,ppid:%d\n",getpid(),getppid());                sleep(1);            }        }        else if(id == 0)        {            while(1)            {                printf("我是子进程,pid:%d,ppid:%d\n",getpid(),getppid());                sleep(1);            }        }        else        {            perror("子进程创建失败!\n");        }         return 0;    }
父子进程的故事:解读Linux中的fork机制在这里插入图片描述

通过结果我们可以得出,在上面的一份代码中 id 大于0和 id 等于0同时存在, ifelse if 同时满足,并且有两个死循环在同时跑。这个现象说明此时一定存在两个进程,即原来的 myprocess 进程和在 myprocess 进程中创建的子进程,因为在一个进程中 ifelse if 是不可能同时满足的。这也符合 fork 函数创建子进程的目的,fork 函数创建子进程后,会从原来的一个执行流变成两个执行流。

2.2 为什么fork要给子进程返回0,给父进程返回子进程 pid?1. fork 返回值的设计目的

fork 是 UNIX 系统中用于创建新进程的核心系统调用。调用一次 fork,系统会“分裂”出两个进程:父进程和子进程。它的返回值有以下特点:

在父进程中:fork 返回新创建的子进程的 PID,使得父进程可以通过该 PID 来管理和操作子进程(如使用 waitkill 等操作)。在子进程中:fork 返回 0,标识自己是子进程,无需再通过 PID 区分。

这种设计的核心目的正如您提到的,用于区分不同执行流,即便父子共享同一套代码,也可以根据返回值选择性地执行不同代码。

2. 现实类比的深入解读父亲喊“儿子”:如果不区分,所有子进程都会响应,导致混乱。通过分配唯一的 PID,每个子进程可以被单独识别。子进程喊“爸爸”:由于每个子进程只能有一个父进程,所以子进程通过调用 getppid() 即可找到其唯一的父进程。3. 为什么子进程返回值为 0简单区分:子进程无需知道自己的 PID 来执行自己的任务,而只需通过返回值 0 知道自己是子进程。效率和逻辑一致性:如果子进程也返回自己的 PID,会引入额外的复杂性,而且父进程需要一个单独机制区分这些值。2.3 一个函数是如何做到返回两次的?如何理解?

在调用 fork 函数之前就只有一个进程,我们先来回顾一下什么是进程?进程 = 内核数据结构 + 代码和数据,其中的内核数据结构就是进程对应的 PCB 对象。

父子进程的故事:解读Linux中的fork机制在这里插入图片描述

进程的 PCB 对象会找到相应的代码和数据,然后 CPU 就要去调度这个进程,也就是找到该进程的代码和数据去执行。调用 fork 函数创建子进程,本质上是操作系统多了一个进程,因此 fork 函数创建出来的子进程,它要先创建自己的 PCB 对象,子进程的 PCB 对象大部分都是以父进程的 PCB 对象为模板创建的,即从父进程的 PCB 对象中拷贝过来,再对部分属性稍作修改,子进程的 PCB 对象就有了。但是它没有自己的代码和数据,所以只能用父进程的,所以 fork 函数之后,父子进程的代码共享,这就解释了为什么上面 fork 函数之后的代码输出了两次,其实就是父子进程各自执行了一次。

创建子进程的目的就是为了帮助父进程做不同的事情,但是父子进程共享一份代码,所以我们应该在代码中对它们加以区分。fork 函数就帮我们完成了这个需求,它会在父子进程中返回不同的值,用户只需要根据返回值的不同让父子进程执行不同的代码。 fork 函数的实现过程:

创建子进程创建子进程的PCB填充PCB对应的内容让子进程和父进程指向同样的代码此时父子进程都有独立的task_struct对象,可以被CPU调度运行了return ret;

由于父子进程会共享一份代码,所以在 fork 函数执行 return 语句之前,子进程的 PCB 对象就已经被创建出来了,CPU 已经可以去同时调度父子进程。由于 fork 函数中的 return 语句也是被共享的,所以 fork 函数有两个返回值。

2.4 一个变量怎么会有不同的内容?1. fork 的返回值如何写入不同的变量空间

当调用 fork 时,父进程与子进程会各自接收一个返回值,并且写入同名变量 id。但这并不意味着他们共享同一块内存,而是因为:

独立的进程地址空间 每个进程都有自己独立的虚拟地址空间。在 fork 之后,父进程与子进程的地址空间是彼此独立的。尽管子进程初始时看起来与父进程完全相同,但实际上它们的数据是分离的。写时拷贝(COW)机制 操作系统为提高效率并节省资源,采用了写时拷贝技术。在 fork 之后: 父子进程共享同一份内存数据,直到有一方尝试修改这些数据。当某个进程试图修改数据时,操作系统会为该进程分配新的物理内存空间,并将被修改的数据复制到新分配的空间中。2. fork 中变量 id 的本质

在代码中,变量 id 是存储 fork 返回值的地方。以下几点解释了为什么同名变量可以存储不同的值:

父子独立运行 fork 返回后,父子进程的执行路径分开。父进程的 id 变量存储的是子进程的 PID,而子进程的 id 变量存储的是 0。不同的内存空间 由于父子进程的地址空间独立,id 实际上存在于两块不同的内存区域,即父进程的 id 和子进程的 id 是完全独立的变量。赋值过程 fork 的返回值通过操作系统写入到父子进程各自的 id 变量中: 父进程在 return 时向 id 写入子进程的 PID。子进程在 return 时向 id 写入 0

结语

Linux父子进程的运行机制展示了操作系统设计的高效性与灵活性。从fork的返回值设计到写时拷贝(COW)的优化方案,这一切都体现了Linux在性能与资源利用上的巧妙平衡。通过深入理解父子进程的特性,不仅能够提升系统编程的能力,还能为并发和并行程序设计提供坚实的理论支持。希望本文能为你的学习和实践带来启发,在Linux系统的探索中迈向更高的层次。

父子进程的故事:解读Linux中的fork机制在这里插入图片描述

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,17的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是17前进的动力!

终于介绍完啦!小伙伴们,这篇关于《Linux父子进程fork机制深度解析》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

Java开发工具中文界面设置教程Java开发工具中文界面设置教程
上一篇
Java开发工具中文界面设置教程
PHP数组自然排序技巧全攻略
下一篇
PHP数组自然排序技巧全攻略
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    1346次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    1283次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    1230次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    1404次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    1410次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码