【精通底层】全面了解程序链接

举报
小明的混沌之路 发表于 2022/07/31 13:36:54 2022/07/31
【摘要】 代码引用、函数库、API怎么连接在一起呢?


前言:📫 作者简介:小明java问道之路,专注于研究计算机底层,就职于金融公司后端高级工程师,擅长交易领域的高安全/可用/并发/性能的设计和架构📫 

🏆 Java 领域优质创作者、阿里云专家博主、华为云享专家🏆

🔥 如果此文还不错的话,还请👍关注、点赞、收藏三连支持👍一下博主哦


本文导读

链接是将各种代码和数据片段收集并组合成为一个单一文件的过程,这个文件可被加载到内存并执行。链接可以执行于编译时、加载时或者运行时。链接是由链接器自动执行的。

大多数编译器提供编译器驱动程序(compiler driver),他代表用户在需要时调用语言预处理器、编译器、汇编器和链接器

一、静态链接

使用编译器驱动程序进行程序的翻译和链接linux> gcc -Og -o prog main.c sum.clinux> ./prog下图静态链接结构图。请看图解


为了构造可执行文件,链接器必须完成两个主要任务:符号解析(我们在代码中会声明变量及函数,之后会调用变量及函数,所有的符号声明都会被保存在符号表(symbol table)中,而符号表会保存在由汇编器生成的 object 文件中(也就是 .o 文件)。符号表实际上是一个结构体数组,每一个元素包含名称、大小和符号的位置。)重定位(这一步所做的工作是把原先分开的代码和数据片段汇总成一个文件,会把原先在 .o 文件中的相对位置转换成在可执行程序的绝对位置,并且据此更新对应的引用符号(才能找到新的位置))

二、动态连接

目标文件有三种形式:一、可重定位目标文件:包含二进制代码和数据。其形式可以在编译时与其他可重定位目标文件合并起来,创建一个可执行目标文件。二、可执行目标文件:包含二进制代码和数据。其形式可以被直接复制到内存并执行。三、共享目标文件:一种特殊类型的可重定位目标文件,可以在加载或者运行时被动态地加载进内存并链接。请看图解


目标文件纯粹是字节块的集合。这些块中,有些包含程序代码,有些包含程序数据,而其他的则包含引导链接器和加载器的数据结构。

三、编译系统

编译系统的过程图解:




四、可重定位目标文件

上面提到的三种对象文件有统一的格式,即 ELF,下图展示了一个典型的ELF可重定位目标文件的格式。


ELF头:以16字节的序列表述了生成该文件的系统的字大小和字节顺序。剩下的部分包括文件类型、机器类型、节头表位置等。(可以用readelf -l main查看).text:代码。.rodata:只读数据,如printf的格式串、swich的跳转表。.data:已初始化的全局和静态变量。.bss:未初始化/初始化为0的全局和静态变量。仅有节头,节本身不占用磁盘空间,仅仅是一个占位符。.symtab:符号表,函数和全局/静态变量的信息。.rel.text:.text节中的可重定位信息。包括在合并后的可执行文件中需要修改的指令地址。.rel.data:.data节中的可重定位信息。包括在合并后的可执行文件中需要修改的指针数据的地址。.debug:调试符号表。(gcc -g)节头部表:每个节的偏移量、大小。

注:

当汇编器遇到对最终位置未知的目标引用,它就会生成一个重定位条目,告诉链接器在将目标文件合并成可执行文件时如何修改这个引用。代码的重定位条目放在.rel.text中,已初始化数据的重定位条目放在.rel.data中。

ELF重定位条目的格式:

小结

本文讲述链接,说白了就是代码引用的部分,函数库等等怎么连接在一起,他是将各种代码和数据片段收集并组合成为一个单一文件的过程,这个文件可被加载到内存并执行。链接可以执行于编译时、加载时或者运行时。链接是由链接器自动执行的。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。