从零学习开发一个RISC-V操作系统(二)丨GCC编译器和ELF格式

2023-09-20 17:33:28


  本系列是博主参考B站课程学习开发一个RISC-V的操作系统的学习笔记,计划从RISC-V的底层汇编指令学起,结合C语言,在Ubuntu 20.04上开发一个简易的操作系统。一个目的是通过实践操作学习和了解什么是操作系统,第二个目的是为之后学习RISC-V的集成电路设计打下一定基础。本系列持续不定期更新,分享出来和大家一同交流进步。
  博主是微电子科学与工程专业的学生,对软件和操作系统难免有理解不到位的地方。如有谬误敬请不吝告知,不胜感激。

  参考课程及文章:
  【Bilibili】[完结] 循序渐进,学习开发一个RISC-V上的操作系统 - 汪辰 - 2021春


一、GCC(GUN Compiler Collection)

  GCC是一个由GNU(一个自由软件基金会组织)开发的,遵循GPL许可证发行的编译器套件,是一个编译器的集合。支持 C、C++、Objective-C、Fortran、Ada 和 Go 语言等多种语言前端,已被移植到多种计算机体系架构上,如 x86、ARM、RISC-V 等。在之后的课程中使用的也是GCC作为编译工具。GCC 的初衷是为 GNU 操作系统专门编写一款编译器,现已被大多数 “Unix-like”操作系统(如 Linux、BSD、MacOS 等)采纳为标准的编译器。

1.1 GCC的命令格式

  • GCC 操作选项 文件名
常用操作选项含义
-E只做预处理(将包含的宏语言头文件转化为C语言文件)
-c只编译(生成机器指令)不链接(与库文件相连),生成目标文件.o
-S生成汇编代码
-o file将输出的文件生成到由file指定文件名的文件中
-g在输出的文件中加入支持调试的信息
-v显示输出详细的命令执行过程信息

1.2 GCC的主要执行步骤

在这里插入图片描述

  1. 编译

  编译(使用cc1程序,这里针对 C 语言,不同的语言有自己的编译器):编译器完成 “预处理” 和 “编译”,“预处理” 指处理源文件中以 “#” 开头的预处理指令,譬如 #include、#define 等;“编译” 则针对预处理的结果进行一系列的词法分析、语法分析、语义分析,优化后生成汇编指令,存放在 .o 为后缀的目标文件中。

  1. 汇编

  汇编(使用as程序):汇编器将汇编语言代码转换为机器(CPU)可以执行的指令。

  1. 链接

  链接(使用ld程序):链接器将汇编器生成的目标文件和一些标准库(譬如 libc)的.o文件组合,形成最终可执行的应用程序。

在这里插入图片描述

1.3 GCC涉及的文件类型

  • .c:C 源文件
  • .cc/.cxx/.cpp:C++ 源文件
  • .i:经过预处理的 C 源文件
  • .s/.S:汇编语言源文件(.S文件中还包含宏指令,.s`文件中是纯汇编指令)
  • .h:头(header)文件
  • .o:目标(object)文件
  • .a/.so:编译后的静态库(archive)文件和共享库(shared object)文件
  • a.out:可执行文件,常见于Unix系统

二、ELF简介

  ELF(Executable Linkable Format)是一种 Unix-like系统上的二进制文件格式标准。ELF文件格式对于底层的操作系统开发非常重要,当程序需要在底层进行优化,调试,排错等操作时,ELF文件可以更好地帮助程序员完成任务。ELF 标准中定义的采用 ELF 格式的文件分为以下4类:
在这里插入图片描述

2.1 ELF文件格式图

在这里插入图片描述
  ELF格式是在程序编译链接过程中生成的文件采用的通用格式。如果直接用文本编辑器或二进制编辑器打开该文件,无法直接看出文件中包含的信息,因为该文件是用二进制书写的。但是其中每一个字节都有其特定的含义,这些字节的排布遵从ELF文件格式。ELF文件中最主要的部分包括ELF文件头(ELF Header)、程序头表(Program Header Table)和节头表(Section Header Table)
  ELF文件头(ELF Header)中包含了该文件的一些基本信息,例如该文件运行在哪种体系架构上,运行的版本号等。
  ELF文件的主体部分是多个程序节(Section)。如上图所示,.text中一般存放指令(程序的具体操作),.init中一般存放一些初始化操作,.data中存放程序要操作的数据,例如在程序中定义的全局变量等。
  在程序加载到内存前,一般都要对各个节进行对齐操作。例如,当程序按4KB进行分节时,如果.test节中的内容本身很少,且不加任何操作,它就会按4KB的大小独占一部分区域。为了节省内存空间,我们对各个节的内容按属性进行归并,例如.text.init都存放了一些程序运行的指令,所以我们可以对齐进行归并,形成了程序段(Segment)。一个程序段可以由多个程序节构成。
  ELF程序头表(Program Header Table)从运行角度描述了程序的内容,它是程序运行视图的体现。程序头表中包含了该文件中哪几个节要归并成一个段,每一个段占用的大小,入口地址等信息。其中包含的信息只有在运行时才会用到。
  ELF节头表(Section Header Table)中存放的该文件中包含的节的信息,包括节的名称,节的入口地址,节的大小等。节头表从链接的角度描述了程序的内容,它是程序链接视图的体现。其中的信息只有链接时才会用到。

2.2 ELF文件处理的相关工具

  对程序员而言,手动查看和调试ELF文件的过程是十分繁琐的,GNU为程序员提供了相关的处理工具软件,存放在Binutils工具包中。该工具包中的小程序如下:

  • ar:归档文件,将多个文件打包成一个大文件。
  • as:被 gcc 调用,输入汇编文件,输出目标文件供链接器 ld 连接。
  • ld:GNU 链接器。被 gcc 调用,它把目标文件和各种库文件结合在一起,重定位数据,并链接符号引用。
  • objcopy:执行文件格式转换。
  • objdump:显示 ELF 文件的信息。
  • readelf:显示更多 ELF 格式文件的信息(包括DWARF 调试信息)。

2.3 练习

使用gcc编译代码并使用Binutlis工具对生成的目标文件和可执行文件(ELF格式)进行分析,具体要求如下:

  • 编写一个简单的打印“Hello world!”的程序源文件hello.c
  • 对源文件进行本地编译,生成针对支持x86_64指令集架构处理器的目标文件hello.o
  • 查看hello.o的文件的ELF文件头信息
  • 查看hello.o的节头表
  • hello.o进行反汇编,并查看hello.c的程序源码和机器指令的对应关系

  首先,在Vim编辑器中编写一个简单的hello.c程序:
在这里插入图片描述
  如果我们需要hello.o文件,说明只需要编译,不需要链接,所以在终端中输入如下代码:

$ gcc -c hello.c -o hello.o

  查看hello.o文件中ELF文件头信息(-h就表示查看文件头header):

$ readelf -h hello.o

在这里插入图片描述
  查看hello.o的节头表(-SW表示显示节头表,并展宽表示):

$ readelf -SW hello.o

在这里插入图片描述
  要对文件进行反汇编,首先要重新编译程序,并使用gdb使其携带调试信息,之后使用objdump对程序hello.o进行反汇编。可以看到每一条C语句对应的汇编指令,可以利用该工具对程序进行调试和优化。

$ rm hello.o
$ gcc -g -c hello.c
$ objdump -S hello.o

在这里插入图片描述


  原创笔记,码字不易,欢迎点赞,收藏~ 如有谬误敬请在评论区不吝告知,感激不尽!博主将持续更新有关嵌入式开发、机器学习方面的学习笔记。


更多推荐

网卡和智能网卡

文章目录网卡是什么?以太网、无线局域网(Wi-Fi)和蓝牙的区别智能网卡是什么AWS智能网卡Mellanox智能网卡DPU网卡是什么?网卡(NetworkInterfaceCard,NIC)是计算机中用于连接计算机与网络之间的硬件设备。它负责将计算机内部的数据转换为网络可以传输的格式,并将接收到的网络数据转换为计算机可

【MySQL系列】使用C语言连接MySQL

「前言」文章内容大致是使用C语言连接MySQL。「归属专栏」MySQL「主页链接」个人主页「笔者」枫叶先生(fy)目录一、Connector/C使用二、MySQL的C接口介绍2.1连接MySQL2.2发送SQL请求2.3获取结果集一、Connector/C使用按照前面MySQL的安装流程,安装完MySQL,MySQL相

【操作系统笔记】进程和线程

进程的组成进程要读取ELF文件,那么:①要知道文件系统的信息,fs_struct②要知道打开的文件的信息,files_struct一个进程除了需要读取ELF文件外,还可以读取其他的文件中的数据。进程中肯定有一个mm_struct实例,每个进程都有自己的虚拟地址空间,用于进程访问内存的。进程中肯定得知道下一条需要执行指令

【Verilog教程】2.4Verilog表达式

表达式表达式由操作符和操作数构成,其目的是根据操作符的意义得到一个计算结果。表达式可以在出现数值的任何地方使用。例如:a^b;//a与b进行异或操作address[9:0]+10'b1;//地址累加flag1&&flag2;//逻辑与操作操作数操作数可以是任意的数据类型,只是某些特定的语法结构要求使用特定的操作数。操作

Leetcode算法入门与数组丨4. 数组排序

文章目录1冒泡排序2选择排序3插入排序4归并排序5希尔排序6快速排序7堆排序8计数排序9桶排序10基数排序task05task061冒泡排序冒泡排序(BubbleSort)是一种简单的排序算法。它重复地遍历待排序的元素列表,一次比较相邻的两个元素,并按照顺序交换它们,直到整个列表排序完成。基本步骤下面是冒泡排序的基本步

【深度学习】 Python 和 NumPy 系列教程(十一):NumPy详解:3、数组数学(元素、数组、矩阵级别的各种运算)

目录一、前言二、实验环境三、NumPy0、多维数组对象(ndarray)多维数组的属性1、创建数组2、数组操作3、数组数学1.元素级别a.直接运算b.加法:np.add()函数c.减法:np.subtract()函数d.乘法:np.multiply()函数e.除法:np.divide()函数f.幂运算:np.power

WIFI6特性分析

特性介绍wifi6作为全新一代wifi协议,提供了更快速度,信道利用率更高,抗干扰能力更强,更高的频宽,更好的待机表现。下边是对比wifi456三代特性的区别:OFDMA:正交多频分址,提升物理媒介的并发通信能力。MU-MINO:多用户上传下载,提升多用处场景wifi速率160MHZ:拓展频段宽度TWT:休眠唤醒机制,

php外贸代购系统网站,淘宝代购系统,淘宝代购集运系统,海外代购系统

PHP外贸代购系统网站建设需要以下步骤:链接各大热门商城上的商品并自动获取参数,程序集成了淘宝、拍拍等大型热门商城抓取规则,可以直接一键代购上面的任何商品,自动获取相应的参数。确定网站功能,如:产品展示、在线购物、搜索引擎等。选择适合的数据库,例如MySQL、PostgreSQL等,存储网站的数据信息。根据目标用户的需

【leetcode 力扣刷题】栈—波兰式///逆波兰式相关知识和题目

波兰式、逆波兰式相关知识和题目波兰式、逆波兰式介绍常规表达式转换成逆波兰式==编程让常规表达式转换成逆波兰式==逆波兰式运算过程常规表达式转换成波兰式==编程让常规表达式转换成波兰式==波兰式运算过程150.逆波兰式表达式求值224.基本计算器227.基本计算器Ⅱ282.给表达式添加运算符波兰式、逆波兰式介绍我们常看到

计算机毕业设计 基于SpringBoot餐厅点餐系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌🍅文末获取源码联系🍅👇🏻精彩专栏推荐订阅👇🏻不然下次找不到哟————————————————计算机毕业设计题目《10

个人简历内容

简历个人信息专业技能熟悉Java基础,如集合、代理、反射等。了解Java多线程,了解JVM内存模型、常见GC算法、类加载机制。·#熟悉SSM+SpringBoot框架,熟悉AOP、IOC和SpringBoot自动配置原理,了解SpringMVC执行流程。熟悉MySQL数据库,熟悉InnoDB存储引擎、事务、MVCC机制

热文推荐