Dance with Compiler - EP2

ops/2024/10/11 7:32:03/

今天来熟悉汇编指令。

基本指令特点

str: store value to memory
ldr: load value from memory
stp: store register value to stack
ldp: load stack value to register

更新寄存器的操作,一般结果寄存器是左操作数。
写内存的操作(str),一般寄存器是左操作数,结果内存是右操作数。
读内存操作(ldr),一般寄存器是左操作数,源内存是右操作数。

所以:

  • 读写内存操作,寄存器始终在左边,内存地址始终在右边。
  • 读写堆栈操作,寄存器始终在左边,堆栈内存地址始终在右边。
  • 数学运算操作,结果寄存器在左边

约定:对于32位寄存器,用 Rn表示,64位寄存器,用Xn表示

常见指令

  1. CMP w3, 1

    等价于 SUBS XZR, w3, 1

    SUBS XZR, Xn, #
    功能:从寄存器 Xn 的值中减去一个立即数 #,并将结果存储到 XZR 寄存器,同时更新条件标志寄存器(N, Z, C, V)。
    解释:
    SUBS 代表 “subtract with flags”(减法并设置标志)。它执行减法操作,并且会根据结果更新条件标志寄存器。
    XZR 是一个特殊的寄存器,在 ARMv8 中,它被用作只读零寄存器。任何写入到 XZR 的值都被丢弃,因为 XZR 的值总是 0。因此,XZR 用于忽略操作的结果,但仍然允许更新条件标志。
    Xn 是源寄存器,包含要减去的值。
    # 是立即数,用于从 Xn 中减去。
    减法操作的结果不会存储在 XZR 中,因为 XZR 总是 0。操作的主要目的是更新条件标志以供后续的条件分支指令使用。
    条件标志:
    N(Negative):如果结果为负,则设置 N 标志。
    Z(Zero):如果结果为零,则设置 Z 标志。
    C(Carry):如果减法操作的结果没有借位,则设置 C 标志(即,如果 Xn >= #,则 C 标志被设置)。
    V(Overflow):如果减法操作导致溢出,则设置 V 标志(即结果超出了表示范围)。

  2. sub x9, sp, #16384
    功能:计算并更新寄存器 x9 的值。
    解释:将堆栈指针 sp 的值减去 16384 (0x4000),结果存储在寄存器 x9 中。这里 16384 是堆栈分配或调整的字节数。
    例子:
    如果 sp 的值是 0x8000,那么执行后 x9 的值将是 0x8000 - 0x4000 = 0x4000。

  3. str xzr, [x9, 3968]
    功能:将寄存器中的值存储到内存。
    解释:将寄存器 xzr(零寄存器,其值始终为 0)存储到以 x9 为基地址加上偏移 3968 字节处的内存位置。这实际上是在 x9 + 3968 的地址上写入 0。
    例子:
    如果 x9 的值是 0x4000,则会把 0 存储到内存地址 0x4000 + 3968 = 0x7C00。

  4. stp x29, x30, [sp, -128]!
    功能:将两个寄存器的值存储到堆栈,并更新堆栈指针。
    解释:将寄存器 x29 和 x30 的值存储到以 sp 为基地址减去 128 字节的内存位置,并将堆栈指针 sp 更新到 sp - 128 的位置。! 表示更新堆栈指针。
    例子:
    如果原来的 sp 是 0x7000,这条指令将 x29 和 x30 的值存储到 0x7000 - 128 = 0x6F80 地址,然后将 sp 更新为 0x6F80。

  5. mov x29, sp
    功能:将堆栈指针的值复制到寄存器。
    解释:将堆栈指针 sp 的当前值复制到寄存器 x29 中。通常用于设置帧指针,将其指向当前的堆栈位置。
    例子:
    如果 sp 的值是 0x6F80,执行后 x29 的值将被设置为 0x6F80。

这段 ARM 汇编代码负责从堆栈中加载多个寄存器的值,并最终返回到调用者。下面逐条解释这些指令:

  1. ldp x19, x20, [sp, 16]
    功能:从内存中加载两个寄存器的值。
    解释:从堆栈指针 sp 偏移 16 字节的地址开始,加载两个 64 位寄存器的值,分别存入寄存器 x19 和 x20。
    例子:
    如果 sp 的值是 0x5000,这条指令将从 0x5000 + 16 = 0x5010 的内存地址读取两个 64 位值,并将其存储到 x19 和 x20 中。

  2. cmp w24, w25
    功能:比较两个寄存器的值。
    解释:将寄存器 w24 和 w25 的值进行比较。此操作会设置条件标志,用于后续的条件分支指令。
    例子:
    比较 w24 和 w25 的值,结果将影响后续指令的条件跳转。

  3. cset w1, eq
    功能:设置寄存器的值。
    解释:如果条件标志中的 EQ(Equal,等于)被设置,则将寄存器 w1 设为 1;否则,设为 0。此指令用于基于上一个比较操作的结果设置寄存器值。
    例子:
    如果 w24 等于 w25,则 w1 的值将设置为 1;否则,设置为 0。

  4. cbz w0, .L1301
    功能:条件分支指令。
    解释:如果寄存器 w0 的值为零(cbz 代表 “compare and branch if zero”),则跳转到标签 .L1301 处执行。
    例子:
    如果 w0 的值是 0,程序将跳转到 .L1301 标签处。

  5. cbnz w1, .L1308
    功能:条件分支指令。
    解释:如果寄存器 w1 的值不为零(cbnz 代表 “compare and branch if not zero”),则跳转到标签 .L1308 处执行。
    例子:
    如果 w1 的值是 1,程序将跳转到 .L1308 标签处。

  6. blr x1
    功能:分支到寄存器指定的地址。
    解释:将程序执行的控制权转移到寄存器 x1 中存储的地址。这个指令常用于函数调用或跳转到计算得到的地址。
    例子:
    如果 x1 的值是 0x1000,这条指令会跳转到地址 0x1000 处执行。

  7. bne .L1391
    功能:条件分支指令。
    解释:如果条件标志中的 NE(Not Equal,不相等)标志被设置为 1(即上一个比较结果表明不相等),则跳转到标签 .L1391 处执行。
    例子:
    如果上一个比较操作的结果是不相等,程序将跳转到 .L1391 标签处。

  8. bls .L1300
    功能:条件分支指令。
    解释:如果条件标志中的 LS(Less than or Equal,小于或等于)标志被设置为 1(即上一个比较结果表明小于或等于),则跳转到标签 .L1300 处执行。
    例子:
    如果上一个比较操作的结果是小于或等于,程序将跳转到 .L1300 标签处。

  9. ccmp w24, w28, 0, eq
    功能:条件比较操作。
    解释:将寄存器 w24 和 w28 进行比较,但不会设置条件标志。该指令通常用于与条件分支指令配合使用,其中 0 表示不改变标志,eq 表示检查等于条件。
    例子:
    比较 w24 和 w28 的值,并检查它们是否相等,但不直接影响标志寄存器的状态。

  10. bcc .L1389
    功能:条件分支指令。
    解释:如果条件标志中的 CC(Carry Clear,进位标志清除)被设置为 1(即上一个比较结果表明小于),则跳转到标签 .L1389 处执行。
    例子:
    如果上一个比较操作的结果是小于,程序将跳转到 .L1389 标签处。

  11. ubfx x4, x4, 0, 48
    功能:从寄存器中提取无符号位域。
    解释:从寄存器 x4 中提取从位 0 开始的 48 位,并将结果存储回 x4。ubfx 代表 “unsigned bit field extract”。
    例子:
    如果 x4 的值是 0xFFFFF000,提取的结果将是 0xFFF000。

  12. prfm PLDL1KEEP, [x4]
    功能:数据预取。
    解释:预取缓存行以提高数据访问速度。PLDL1KEEP 表示将数据从 L1 数据缓存中保留到 L1 中,并从内存中读取。[x4] 指定了预取的地址。
    例子:
    如果 x4 的值是 0x2000,这条指令将从内存地址 0x2000 预取数据到 L1 数据缓存。

ARM 特色:条件指令

CCMP Xn, #imm, #nzcv, cond

  • 其中,cond 是说是否执行 CCMP 语句的比较操作的条件,cond 的内容来自 NZCV,也就是上一个算术操作的结果(手册里说得很不清晰)。
  • CCMP 输出的 flags = if cond then compare(Xn, #imm) else #nzcv

CCMP
在这里插入图片描述

在这里插入图片描述

所以

	cmp	    x1, 0 (转化成 x1 - 0 操作,会设置 NZCV标记)ccmp	w24, w28, 0, eq   (如果上一个cmp不满足 eq 条件,也就是说没有设置 z 标记,则不执行 w24 和 w28 的比较,但会强制把当前指令的 NZCV 标记设置成 0。否则,比较 w24 和 w28,并按照一般 cmp 规则设置 NZCV 标记)bcc	    .L1389  (根据 NZCV 标记决策跳转,bcc 表示如果 C 位被设置了,则跳转,即w24 >= w28 则跳转)

翻译成 C 语言的理解就是:

if (x1 == 0 && w24 >= w28) {
// jump
}


http://www.ppmy.cn/ops/107250.html

相关文章

华为 HCIP-Datacom H12-821 题库 (11)

有需要题库的可以看主页置顶 1.以下关于路由引入的描述,错误的是哪一项? A、把路由引入到 ISIS 中默认等级为Level-2 B、把某类型的路由引入到BGP 时可以直接指定其 MED 值,不需要使用Route-Policy C、把路由引入到 OSPF 中默认为Metric-Typ…

CSS解析:定位和层叠上下文

许多开发人员对定位的理解很粗略,如果不完全了解定位,就很容易给自己挖坑。有时候可能会把错误的元素放在其他元素前面,要解决这个问题却没有那么简单。 一般的布局方法是用各种操作来控制文档流的行为。定位则不同:它将元素彻底…

匈牙利算法实现(from scipy.optimize import linear_sum_assignment)

linear_sum_assignment 是 SciPy 库中 scipy.optimize 模块提供的一个函数,专门用于解决线性分配问题,也被称为匈牙利算法。这个问题通常出现在任务分配中,例如将一组工人分配给一组任务,以最小化总成本或最大化总收益。 代码解释…

UDP广播、 组播通信

广播接收 #include <netinet/in.h> #include <netinet/ip.h> #include <stdio.h> #include <stdlib.h> #include <sys/socket.h> #include <sys/types.h> /* See NOTES */ #include <unistd.h> #include <arpa/inet.h>// 定义…

内网隧道:端口转发

目录 LCX端口转发 场景一 场景二 SSH的端口转发 一、本地转发&#xff08;正向访问A&#xff09;&#xff1a; 二、远程转发&#xff08;反向访问A&#xff09; 三.NETSH端口转发 端口转发和端口映射 端口转发,有时被称为做隧道,是安全壳( SSH)为网络安全通信使用的一种方…

Python 数据分析— Pandas 基本操作(中)

文章目录 学习内容&#xff1a;一、 创建数据透视表二、表格合并操作三、表格分组操作四、Series 值映射五、替换 DataFrame 或 Series 中的值 学习内容&#xff1a; 一、 创建数据透视表 pivot_table(values需聚合的列名默认所有数值列, index行分组键(数组) [, columns列上…

C++ | Leetcode C++题解之第355题设计推特

题目&#xff1a; 题解&#xff1a; class Twitter {struct Node {// 哈希表存储关注人的 Idunordered_set<int> followee;// 用链表存储 tweetIdlist<int> tweet;};// getNewsFeed 检索的推文的上限以及 tweetId 的时间戳int recentMax, time;// tweetId 对应发送…

SQL进阶技巧:如何取时间序列最新完成状态的前一个状态并将完成状态的过程进行合并?

目录 0 问题描述 1 数据准备 2 问题分析 问题1:取最新完成状态的前一个状态 方法1:分析函数求解 方法2:关联求解 问题2:如何将完成状态的过程合并 方法1:分析函数作为辅助变量 方法2:自关联形式获取全量结果集 3 小结 0 问题描述 表status 字段及内容如下:…