------改编自正点原子Linux开发手册
我们在学习 STM32 的时候几乎没有用到过汇编,可能在学习 UCOS 、 FreeRTOS 等 RTOS
类操作系统移植的时候可能会接触到一点汇编。但是我们在进行嵌入式 Linux 开发的时候是绝
对要掌握基本的 ARM 汇编,因为 Cortex-A 芯片一上电 SP 指针还没初始化, C 环境还没准备
好,所以肯定不能运行 C 代码,必须先用汇编语言设置好 C 环境,比如初始化 DDR 、设置 SP
指针等等,当汇编把 C 环境设置好了以后才可以运行 C 代码。所以 Cortex-A 一开始肯定是汇
编代码,其实 STM32 也一样的,一开始也是汇编,以 STM32F103 为例,启动文件 startup_stm32f10x_md.s 或 startup_stm32f10x_hd.s 就是汇编文件,只是这个文件 ST 公司已经写好了,我们根本不用去修改,所以大部分学习者都没有深入的去研究。
I.MX6U-ALPHA 使用的是 NXP 的 I.MX6UL 芯片,这是一款 Cortex-A7 内核的芯片,所以
我们主要讲的是 Cortex-A 的汇编指令。为此我们需要参考两份跟 Cortex-A 内核有关的文档:
《 ARM ArchitectureReference Manual ARMv7-A and ARMv7-R edition.pdf 》和《 ARM Cortex
A(armV7) 编程手册 V4.0.pdf 》 ,第一份文档主要讲解 ARMv7-A 和 ARMv7-R 指令集的开发,
Cortex-A7 使用的是 ARMv7-A 指令集,第二份文档主要讲解 Cortex-A(armV7) 编程的,这两份
文档是学习 Cortex-A 不可或缺的文档。在《 ARM ArchitectureReference Manual ARMv7-A and
ARMv7-R edition.pdf 》的 A4 章详细的讲解了 Cortex-A 的汇编指令,要想系统的学习 Cortex-A
的指令就要认真的阅读 A4 章节。
对于 Cortex-A 芯片来讲,大部分芯片在上电以后 C 语言环境还没准备好,所以第一行程序
肯定是汇编的,至于要写多少汇编程序,那就看你能在哪一步把 C 语言环境准备好。所谓的 C
语言环境就是保证 C 语言能够正常运行。 C 语言中的函数调用涉及到出栈入栈,出栈入栈就要
对堆栈进行操作,所谓的堆栈其实就是一段内存,这段内存比较特殊,由 SP 指针访问, SP 指
针指向栈顶。芯片一上电 SP 指针还没有初始化,所以 C 语言没法运行,对于有些芯片还需要
初始化 DDR ,因为芯片本身没有 RAM ,或者内部 RAM 不开放给用户使用,用户代码需要在
DDR 中运行,因此一开始要用汇编来初始化 DDR 控制器。后面学习 Uboot 和 Linux 内核的时
候汇编是必须要会的
GNU 汇编语法
Keil MDK与IAR的编译器不一样,底层的汇编语法也不一样,那一样的c语言由编译器转换成底层汇编语言也是不同的汇编语法,所以启动文件也得不同的汇编语法来编辑
编译器的作用就是根据汇编语法,把C语言 python Java 等等现成简单的编程语言转换成底层汇编语言
我们用的Linux开发,使用gcc编译,转换的底层是GNU汇编语法
如果大家使用过 STM32 的话就会知道 MDK 和 IAR 下的启动文件 startup_stm32f10x_hd.s
其中的汇编语法是有所不同的,将 MDK 下的汇编文件直接复制到 IAR 下去编译就会出错,因
为 MDK 和 IAR 的编译器不同,因此对于汇编的语法就有一些小区别。我们要编写的是 ARM
汇编,编译使用的 GCC 交叉编译器,所以我们的汇编代码要符合 GNU 语法。
GNU 汇编语法适用于所有的架构,并不是 ARM 独享的, GNU 汇编由一系列的语句组成,
每行一条语句,每条语句有三个可选部分,如下:
label : instruction @ comment
label 即标号,表示地址位置,有些指令前面可能会有标号,这样就可以通过这个标号得到
指令的地址,标号也可以用来表示数据地址。注意 label 后面的“:”,任何以“:”结尾的标识
符都会被识别为一个标号。
instruction 即指令,也就是汇编指令或伪指令。
@ 符号,表示后面的是注释,就跟 C 语言里面的“ /* ”和“ */ ”一样,其实在 GNU 汇编文
件中我们也可以使用“ /* ”和“ */ ”来注释。
comment 就是注释内容。
比如如下代码:
add:
MOVS R0, #0X12 @ 设置 R0=0X12
上面代码中“ add: ”就是标号,“ MOVS R0,#0X12 ”就是指令,最后的“ @ 设置 R0=0X12 ”就是
注释。
注意! ARM 中的指令、伪指令、伪操作、寄存器名等可以全部使用大写,也可以全部使用
小写,但是不能大小写混用。
用户可以使用 .section 伪操作来定义一个段,汇编系统预定义了一些段名:
.text 表示代码段。
.data 初始化的数据段。
.bss 未初始化的数据段。
.rodata 只读数据段。
我们当然可以自己使用 .section 来定义一个段,每个段以段名开始,以下一段名或者文件结
尾结束,比如:
.section .testsection @ 定义一个 testsetcion 段
汇编程序的默认入口标号是 _start ,不过我们也可以在链接脚本中使用 ENTRY 来指明其它
的入口点,下面的代码就是使用 _start 作为入口标号:
.global _start
_start:
ldr r0, =0x12 @r0=0x12
上面代码中 .global 是伪操作,表示 _start 是一个全局标号,类似 C 语言里面的全局变量一
样,常见的伪操作有:
.byte
定义单字节数据,比如 .byte 0x12 。
.short
定义双字节数据,比如 .short 0x1234 。
.long
定义一个 4 字节数据,比如 .long 0x12345678 。
.equ
赋值语句,格式为: .equ 变量名,表达式,比如 .equ num, 0x12 ,表示 num=0x12 。
.align 数据字节对齐,比如: .align 4 表示 4 字节对齐。
.end
表示源文件结束。
.global 定义一个全局符号,格式为: .global symbol ,比如: .global _start 。
GNU 汇编还有其它的伪操作,但是最常见的就是上面这些,如果想详细的了解全部的伪操
作,可以参考《 ARM Cortex-A(armV7) 编程手册 V4.0.pdf 》的 57 页。
GNU 汇编同样也支持函数,函数格式如下:
函数名 :
函数体
返回语句
GNU 汇编函数返回语句不是必须的,如下代码就是用汇编写的 Cortex-A7 中断服务函数:
示例代码 7.1.1.1 汇编函数定义
/* 未定义中断 */
Undefined_Handler:
ldr r0, =Undefined_Handler
bx r0
/* SVC 中断 */
SVC_Handler:
ldr r0, =SVC_Handler
bx r0
/* 预取终止中断 */
PrefAbort_Handler:
ldr r0, =PrefAbort_Handler
bx r0
上述代码中定义了三个汇编函数: Undefined_Handler 、 SVC_Handler 和
PrefAbort_Handler 。以函数 Undefined_Handler 为例我们来看一下汇编函数组成,
“ Undefined_Handler ”就是函数名,“ ldr r0, =Undefined_Handler ”是函数体,“ bx r0 ”是函数
返回语句,“ bx ”指令是返回指令,函数返回语句不是必须的。