热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

LinuxGCC常用命令和ELF文件格式

目录一、LinuxGCC常用命令1、简介2、简单编译2.1预处理2.2编译为汇编代码(Compilation)2.3汇编(Assembly)2.4连接(Linking)3、多个程序


目录

  • 一、Linux GCC常用命令
    • 1、简介
    • 2、简单编译
      • 2.1 预处理
      • 2.2 编译为汇编代码(Compilation)
      • 2.3 汇编(Assembly)
      • 2.4 连接(Linking)
    • 3、多个程序文件的编译
    • 4、检错
    • 5、库文件连接
      • 5.1 编译成可执行文件
      • 5.2 链接
  • 二、ELF文件格式
    • 1.ELF 文件的段
    • 2.反汇编
  • 三、总结
  • 参考资料


一、Linux GCC常用命令


1、简介


  • GCC: GCC(GNU C Compiler)是编译工具。本文所要介绍的将 C/C++语言编写的程序转换成为处理器能够执行的二进制代码的过程即由编译器完成。
  • Binutils: 一组二进制程序处理工具,包括:addr2line、ar、objcopy、objdump、as、ld、 ldd、readelf、 size 等。这 一组工具 是开发和 调试不可缺少的工具 ,分别简 介 如下:

(1) addr2line:用来将程序地址转换成其所对应的程序源文件及所对 应的代码行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对应的源代码位置。
(2) as:主要用于汇编。
(3) ld:主要用于链接。
(4) ar:主要用于创建静态库。
(5) ldd:可以用于查看一个可执行程序依赖的共享库。
(6) objcopy:将一种对象文件翻译成另一种格式,譬如将.bin 转换成.elf、或 者将.elf 转换成.bin 等。
(7) objdump:主要的作用是反汇编。
(8) readelf:显示有关 ELF 文件的信息。
(9)size :列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小 等。



  • C 运行库
    C 语言标准主要由两部分组成:一部分描述 C 的语法,另一部分描述 C 标准库。 C 标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类 型声明和宏定义,譬如常见的 printf 函数便是一个 C 标准库函数,其原型定义 在 stdio 头文件中。 C 语言标准仅仅定义了 C 标准库函数原型,并没有提供实现。因此,C 语言编译 器通常需要一个 C 运行时库(C Run Time Libray,CRT)的支持。C 运行时库又 常简称为 C 运行库。与 C 语言类似,C++也定义了自己的标准,同时提供相关支持库,称为 C++运行时库。

2、简单编译

示例程序如下:
helloworld.c

#include int main(void) { printf("Hello World!\n");return 0; }

这个程序,一步到位的编译指令是: gcc helloworld.c -o helloworld
在这里插入图片描述
实质上,上述编译过程是分为四个阶段进行的,即预处理(也称预编译,Preprocessing)、编译 (Compilation)、汇编 (Assembly)和连接(Linking)。


2.1 预处理

预处理的过程主要包括以下过程:


(1) 将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编 译指令,比如#if #ifdef #elif #else #endif 等。
(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“//”和“/* */”。
(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。


gcc -E helloworld.c -o helloworld.i 可以输出 helloworld.i 文件中存放着 helloworld.c 经预处理之后的代码。打开helloworld.i 文件,看一看,就明白了。
在这里插入图片描述
gcc -E helloworld.c
在这里插入图片描述
直接在命令行窗口中输出预处理后的代码. gcc 的-E 选项,可以让编译器在预处理后停止,并输出预处理结果。在本例中,预处理结果就是将 stdio.h 文件中的内容插入到 helloworld.c 中了。


2.2 编译为汇编代码(Compilation)

预处理之后,可直接对生成的 test.i 文件编译,生成汇编代码:
gcc -S helloworld.i -o helloworld.s
在这里插入图片描述
gcc的-S 选项,表示在程序编译期间,在生成汇编代码后,停止,-o 输出汇编代码文件。


2.3 汇编(Assembly)

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 的目标文件中。由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相对于编译过程比较简单,通过调用 Binutils 中的汇编器 as 根据汇编指令和处理 器指令的对照表一一翻译即可。
当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o 目标 文件后,才能进入下一步的链接工作。注意:目标文件已经是最终程序的某一部分了,但是在链接之前还不能执行。
使用 gcc 进行汇编的命令如下:
gcc -c hello.s -o hello.o
将编译生成的 hello.s 文件汇编生成目标文件 hello.o,GCC 的选项-c 使 GCC 在执行完汇编后停止,生成目标文件。
或者直接调用 as 进行汇编
as -c hello.s -o hello.o
使用 Binutils 中的 as 将 hello.s 文件汇编生成目标文件。
注意:hello.o 目标文件为 ELF(Executable and Linkable Format)格式的可 重定向文件。


2.4 连接(Linking)

gcc 连接器是 gas 提供的,负责将程序的目标文件与所需的所有附加的目标文件连接起来,最终生成可执行文件。附加的目标文件包括静态连接库和动态连接库。 对于上一小节中生成的 helloworld.o,将其与C标准输入输出库进行连接,最终生成程序helloworld
gcc helloworld.o -o helloworld
在命令行窗口中,执行./helloworld:
在这里插入图片描述


3、多个程序文件的编译

通常整个程序是由多个源文件组成的,相应地也就形成了多个编译单元,使用 GCC 能够很好地管理 这些编译单元。假设有一个由 test1.c 和 test2.c 两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序 test,可以使用下面这条命令:
gcc test1.c test2.c -o test
如果同时处理的文件不止一个,GCC 仍然会按照预处理、编译和链接的过程依次进行。如果深究起 来,上面这条命令大致相当于依次执行如下三条命令:
gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o -o test


4、检错

gcc -pedantic illcode.c -o illcode -pedantic 编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容,它仅仅只能用来帮助 Linux 程序员离这个目标越来越近。或者换句话说,-pedantic 选项能够帮助程序员发现一些不符合 ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的 那些情况,才有可能被 GCC 发现并提出警告。
除了-pedantic 之外,GCC 还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W 开头,其中最有价值的当数-Wall 了,使用它能够使 GCC 产生尽可能多的警告信息。
gcc -Wall illcode.c -o illcode
GCC 给出的警告信息虽然从严格意义上说不能算作错误,但却很可能成为错误的栖身之所。一个优秀的 Linux 程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror 选项,那 么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:
gcc -Werror test.c -o test


5、库文件连接

开发软件时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助许多函数库的支 持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(so、
或 lib、dll)
的集合。。虽然 Linux 下的大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib, 以及系统文件夹下。但也有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己 的办法来查找所需要的头文件和库文件。


5.1 编译成可执行文件

首先我们要进行编译 helloworld.c 为目标文件,这个时候需要执行 gcc -c helloworld.c -o helloworld.o


5.2 链接

链接也分为静态链接和动态链接,其要点如下:


(1) 静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行 文件会比较大。链接器将函数的代码从其所在地(不同的目标文件或静态链 接库中)拷贝到最终的可执行程序中。为创建可执行文件,链接器必须要完成的主要任务是:符号解析(把目标文件中符号的定义和引用联系起来)和重定位(把符号定义和内存地址对应起来然后修改所有对符号的引用)。
(2) 动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统 中把相应动态库加载到内存中去。



  • 在 Linux 系 统中,gcc 编译链接时的动态库搜索 路径的顺序通常为:首 先从 gcc 命令的参数-L 指定的路径寻找 ;再从环境变量 LIBRARY_PATH 指定的路径寻址;再从默认路径 /lib、/usr/lib、 /usr/local/lib 寻找 。
  • 在 Linux 系统中,执行二进制文件时的动态库搜索路径的顺序通常为:首 先搜索编译目标代码时指定的动态库搜索路径;再从环境变量LD_LIBRARY_PATH 指定的路径寻址;再从配置文件/etc/ld.so.conf 中指定 的动态库搜索路径 ;再从默认路径/lib、/usr/lib 寻找 。
  • 在 Linux 系统中, 可以用 ldd 命令查看一个可执行程序依赖的共享库。

由于链接动态库和静态库的路径可能有重合,所以如果在路径中有同名的静态库文件和动态库文件,比如 libtest.a 和 libtest.so,gcc 链接时默认优先选择动态库,会链接 libtest.so,如果要让 gcc 选择链接 libtest.a 则可以指定 gcc 选项-static,该选项会强制使用静态库进行链接。以 Hello World 为例:
如果使用命令“gcc helloworld.c -o helloworld”则会使用动态库进行链接,生成的 ELF 可执行文件的大小(使用 Binutils 的 size 命令查看)和链接的动态库 (使用 Binutils 的 ldd 命令查看)如下所示:
gcc helloworld.c -o helloworld
size helloworld
使用 size 查看大小
在这里插入图片描述
ldd helloworld
在这里插入图片描述
可以看出该可执行文件链接了很多其他动态库,主要是 Linux 的 glibc 动态库 linux-vdso.so.1 => (0x00007ffd5cfef000) libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f62f4259000) /lib64/ld-linux-x86-64.so.2 (0x00007f62f484c000)
如果使用命令“ gcc -static helloworld.c -o hello”则会使用静态库进行链接 , 生成的 ELF 可执行文件的大小(使用 Binutils 的 size 命令查看)和链接的 动态库(使用 Binutils 的 ldd 命令查看)如下所示:
gcc -static helloworld.c -o helloworld
size helloworld
使用 size 查看大小
在这里插入图片描述
可以看出 text 的代码尺寸变得极大。
ldd helloworld
在这里插入图片描述
说明没有链接动态库。链接器链接后生成的最终文件为 ELF 格式可执行文件,一个 ELF 可执行文件通常 被链接为不同的段,常见的段譬如.text、.data、.rodata、.bss 等段。


二、ELF文件格式


1.ELF 文件的段

ELF 文件格式如下图所示,位于 ELF Header 和 Section Header Table 之间的都 是段(Section)。
在这里插入图片描述

一个典型的 ELF 文件包含下面几个段:


.text:已编译程序的指令代码段。
.rodata:ro 代表 read only,即只读数据(譬如常数 const)。
.data:已初始化的 C 程序全局变量和静态局部变量。
.bss:未初始化的 C 程序全局变量和静态局部变量。
.debug:调试符号表,调试器用此段的信息帮助调试。


可以使用 readelf -S 查看其各个 section 的信息如下:
readelf -S helloworld
在这里插入图片描述
在这里插入图片描述


2.反汇编

ELF 由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包 含的指令和数据,需要使用反汇编的方法。
使用 objdump -D 对其进行反汇编如下:
objdump -D helloworld
反汇编内容(一部分):

4b4621: 41 0e rex.B (bad)
4b4623: 10 83 02 4d 0e 20 adc %al,0x200e4d02(%rbx)
4b4629: 02 b3 0e 28 41 0e add 0xe41280e(%rbx),%dh
4b462f: 30 5f 0e xor %bl,0xe(%rdi)
4b4632: 28 41 0e sub %al,0xe(%rcx)
4b4635: 20 77 0a and %dh,0xa(%rdi)
4b4638: 0e (bad)
4b4639: 10 41 0e adc %al,0xe(%rcx)
4b463c: 08 46 0b or %al,0xb(%rsi)
4b463f: 00 58 00 add %bl,0x0(%rax)
4b4642: 00 00 add %al,(%rax)
4b4644: 68 92 00 00 e8 pushq $0xffffffffe8000092
4b4649: 0c fd or $0xfd,%al
4b464b: ff 19 lcall *(%rcx)

使用 objdump -S 将其反汇编并且将其 C 语言源代码混合显示出来:
gcc -o helloworld -g helloworld.c
要加上-g 选项
objdump -S helloworld
在这里插入图片描述在这里插入图片描述


三、总结

Linux命令多而繁杂,不可能都记住,使用时到百度搜一下就好了。ELF文件格式在计算机系统中也是一个重点。


参考资料

GCC编译器背后的故事
Linux GCC常用命令


推荐阅读
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 本文介绍了win7系统休眠功能无法启动和关闭的解决方法,包括在控制面板中启用休眠功能、设置系统休眠的时间、通过命令行定时休眠、手动进入休眠状态等方法。 ... [详细]
  • 本文介绍了一种轻巧方便的工具——集算器,通过使用集算器可以将文本日志变成结构化数据,然后可以使用SQL式查询。集算器利用集算语言的优点,将日志内容结构化为数据表结构,SPL支持直接对结构化的文件进行SQL查询,不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]
  • 全面介绍Windows内存管理机制及C++内存分配实例(四):内存映射文件
    本文旨在全面介绍Windows内存管理机制及C++内存分配实例中的内存映射文件。通过对内存映射文件的使用场合和与虚拟内存的区别进行解析,帮助读者更好地理解操作系统的内存管理机制。同时,本文还提供了相关章节的链接,方便读者深入学习Windows内存管理及C++内存分配实例的其他内容。 ... [详细]
  • Python中sys模块的功能及用法详解
    本文详细介绍了Python中sys模块的功能及用法,包括对解释器参数和功能的访问、命令行参数列表、字节顺序指示符、编译模块名称等。同时还介绍了sys模块中的新功能和call_tracing函数的用法。推荐学习《Python教程》以深入了解。 ... [详细]
  • Windows下配置PHP5.6的方法及注意事项
    本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项,包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法,如下载缺失的msvcr110.dll文件等。通过本文的指导,读者可以轻松地在Windows系统下配置PHP5.6,并解决一些常见的配置问题。 ... [详细]
  • d3dx9_26.dll极品飞车9修复工具下载及修复教程
    本文介绍了d3dx9_26.dll文件的修复工具下载和修复教程,解释了该dll文件的作用和安装方法,同时提供了其他dll文件下载安装的方法。文章涵盖了3d、windows、p2p、dll、visual studio等知识点,并由未来可期1212投稿。希望该技术和经验能帮到你解决dll文件相关技术问题。 ... [详细]
  • Android源码深入理解JNI技术的概述和应用
    本文介绍了Android源码中的JNI技术,包括概述和应用。JNI是Java Native Interface的缩写,是一种技术,可以实现Java程序调用Native语言写的函数,以及Native程序调用Java层的函数。在Android平台上,JNI充当了连接Java世界和Native世界的桥梁。本文通过分析Android源码中的相关文件和位置,深入探讨了JNI技术在Android开发中的重要性和应用场景。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 本文介绍了在CentOS上安装Python2.7.2的详细步骤,包括下载、解压、编译和安装等操作。同时提供了一些注意事项,以及测试安装是否成功的方法。 ... [详细]
  • 解决github访问慢的问题的方法集锦
    本文总结了国内用户在访问github网站时可能遇到的加载慢的问题,并提供了解决方法,其中包括修改hosts文件来加速访问。 ... [详细]
  • 如何用JNI技术调用Java接口以及提高Java性能的详解
    本文介绍了如何使用JNI技术调用Java接口,并详细解析了如何通过JNI技术提高Java的性能。同时还讨论了JNI调用Java的private方法、Java开发中使用JNI技术的情况以及使用Java的JNI技术调用C++时的运行效率问题。文章还介绍了JNIEnv类型的使用方法,包括创建Java对象、调用Java对象的方法、获取Java对象的属性等操作。 ... [详细]
  • 通过Anaconda安装tensorflow,并安装运行spyder编译器的完整教程
    本文提供了一个完整的教程,介绍了如何通过Anaconda安装tensorflow,并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统,并提供了相关的网址供参考。通过本教程,读者可以轻松地安装和配置tensorflow环境,以及运行spyder编译器进行开发。 ... [详细]
  • 【Windows】实现微信双开或多开的方法及步骤详解
    本文介绍了在Windows系统下实现微信双开或多开的方法,通过安装微信电脑版、复制微信程序启动路径、修改文本文件为bat文件等步骤,实现同时登录两个或多个微信的效果。相比于使用虚拟机的方法,本方法更简单易行,适用于任何电脑,并且不会消耗过多系统资源。详细步骤和原理解释请参考本文内容。 ... [详细]
  • 手把手教你使用GraphPad Prism和Excel绘制回归分析结果的森林图
    本文介绍了使用GraphPad Prism和Excel绘制回归分析结果的森林图的方法。通过展示森林图,可以更加直观地将回归分析结果可视化。GraphPad Prism是一款专门为医学专业人士设计的绘图软件,同时也兼顾统计分析的功能,操作便捷,可以帮助科研人员轻松绘制出高质量的专业图形。文章以一篇发表在JACC杂志上的研究为例,利用其中的多因素回归分析结果来绘制森林图。通过本文的指导,读者可以学会如何使用GraphPad Prism和Excel绘制回归分析结果的森林图。 ... [详细]
author-avatar
加勒比小洁_149
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有