有些指令将字节、半字或字扩展到寄存器大小,可以是 X 或 W。这些指令存在于有符号(SXTB、SXTH、SXTW)和无符号(UXTB、UXTH)变体中,并且是适当的位域操作指令。
这些指令的有符号和无符号变体都将字节、半字或字(尽管只有 SXTW 对字进行操作)扩展到寄存器大小。源始终是 W 寄存器。目标寄存器是 X 或 W 寄存器,但 SXTW 除外,它必须是 X 寄存器。
例如:SXTB X0, W1
—— 通过重复字节的最左边的位,将寄存器 W1 的最低有效字节从 8 位符号扩展为 64 位。
位域指令类似于 ARMv7 中存在的指令,包括位域插入 (BFI) 以及有符号和无符号位域提取 ((S/U)BFX)。还有额外的位域指令,例如 BFXIL(低位域提取和插入)、UBFIZ(无符号位域插入零)和 SBFIZ(有符号位域插入零)。
还有 BFM、UBFM 和 SBFM 指令。 这些是 ARMv8 新增的位域移动指令。但是,不需要明确使用这些指令,因为为所有情况提供了别名。这些别名是已经描述的位域操作:[SU]XT[BHWX]、ASR/LSL/LSR immediate、BFI、BFXIL、SBFIZ、SBFX、UBFIZ 和 UBFX。
CLZ —— 计数寄存器中的前导零位。
RBIT —— 反转所有位。
REV —— 反转寄存器的字节顺序。
REV16 —— 反转寄存器中每个半字的字节顺序。
REV32 —— 反转寄存器中每个字的字节顺序。
REV、REV16、可以在字(32 位)或双字(64 位)大小的寄存器上执行,REV32 仅适用于 64 位寄存器。
1. SXTB
SXTB(Signed Extend Byte)指令从寄存器中提取一个 8 位值,将其符号扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 SBFM 指令的别名。
32-bit (sf == 0 && N == 0)
SXTB <Wd>, <Wn>
等价指令
SBFM <Wd>, <Wn>, #0, #7
64-bit (sf == 1 && N == 1)
SXTB <Xd>, <Wn>
等价指令
SBFM <Xd>, <Xn>, #0, #7
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
下面是使用 SXTB 指令的例子。
long long int x = 0;int y = 0x7080;asm volatile("SXTB %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 SXTB %x[x], %w[y]
将 %w[y]
的最低 8 位符号扩展为 64 位,也就是 0x7080 中的 0x80(0b1000 0000)符号位为 1,扩展到 64 位,即 0xFFFF FFFF FFFF FF80,十进制为 -128,这也是最终 x 的值。
2. SXTH
SXTH(Sign Extend Halfword —— 符号扩展半字)指令提取一个 16 位值,将其符号扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 SBFM 指令的别名。
32-bit (sf == 0 && N == 0)
SXTH <Wd>, <Wn>
等价指令
SBFM <Wd>, <Wn>, #0, #15
64-bit (sf == 1 && N == 1)
SXTH <Xd>, <Wn>
等价指令
SBFM <Xd>, <Xn>, #0, #15
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
下面是使用 SXTH 指令的例子。
long long int x = 0;int y = 0x7080;asm volatile("SXTH %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 SXTH %x[x], %w[y]
将 %w[y]
的最低 16 位符号扩展为 64 位,也就是 0x7080 中的 0x7080(0b0111 0000 1000 0000)符号位为 0,扩展到 64 位,还是 0x7080,十进制为 28800,这也是最终 x 的值。
3. SXTW
SXTW(Sign Extend Word —— 符号扩展字)指令将一个字符号扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 SBFM 指令的别名。
64-bit
SXTW <Xd>, <Wn>
等价指令
SBFM <Xd>, <Xn>, #0, #31
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
下面是使用 SXTW 指令的例子。
long long int x = 0;int y = 0x7080;asm volatile("SXTW %x[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 SXTW %x[x], %w[y]
将 %w[y]
符号扩展为 64 位,也就是 0x7080 中的 0x7080(0b0000 0000 0000 0000 0111 0000 1000 0000)符号位为 0,扩展到 64 位,还是 0x7080,十进制为 28800,这也是最终 x 的值。
4. UXTB
UXTB(Unsigned Extend Byte —— 无符号扩展字节) 从寄存器中提取一个 8 位值,将其零扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 UBFM 指令的别名。
32-bit
UXTB <Wd>, <Wn>
等价指令
UBFM <Wd>, <Wn>, #0, #7
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
下面是使用 UXTB 指令的例子。
int x = 0;int y = 0x7080;asm volatile("UXTB %w[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 UXTB %w[x], %w[y]
将 %w[y]
扩展为 32 位,也就是 0x7080 中的 0x80(0b1000 0000)扩展到 32 位(以零填充扩展位),最终还为 0x80,这也是最终 x 的值。
5. UXTH
UXTH(Unsigned Extend Halfword —— 无符号扩展半字) 从寄存器中提取一个 16 位值,将其零扩展到寄存器的大小,并将结果写入目标寄存器。该指令是 UBFM 指令的别名。
32-bit
UXTH <Wd>, <Wn>
等价指令
UBFM <Wd>, <Wn>, #0, #15
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
下面是使用 UXTH 指令的例子。
int x = 0;int y = 0x77777080;asm volatile("UXTH %w[x], %w[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 UXTH %w[x], %w[y]
将 %w[y]
扩展为 32 位,也就是 0x77777080 的低 16 位,即 0x7080(0b0111 0000 1000 0000)扩展到 32 位(以零填充扩展位),最终还为 0x7080,这也是最终 x 的值。
6. BFI
BFI(Bitfield Insert —— 位域插入)指令将 <width>
位的位域从源寄存器的最低有效位复制到目标寄存器的位位置 <lsb>
,而其他目标位保持不变。该指令是 BFM 指令的别名。
32-bit (sf == 0 && N == 0)
BFI <Wd>, <Wn>, #<lsb>, #<width>
等价指令
BFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)
64-bit (sf == 1 && N == 1)
BFI <Xd>, <Xn>, #<lsb>, #<width>
等价指令
BFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<lsb>
对于 32 位变体:是目标位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是目标位域的 lsb 的位数,范围为 0 到 63。
<width>
对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>
。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>
。
下图是 BFI W0, W0, #9, #6
指令操作示意图:
下面是使用 BFI 指令的例子。
long long int x = -1;long long int y = 0x77777080;asm volatile("BFI %x[x], %x[y], #16, #16\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 BFI %x[x], %x[y], #16, #16
将 %x[y]
最低 16 位复制到 %x[x]
的 16 ~ 31 位,也就是 0x77777080 的低 16 位,即 0x7080(0b0111 0000 1000 0000)复制到 %x[x]
的 16 ~ 31 位,最终的结果就是 0xFFFF FFFF 7080 FFFF,这也是最终 x 的值。
7. BFC
BFC(Bitfield Clear —— 位域清零) 将目标寄存器的位位置 <lsb>
处的 <width>
位的位域设置为零,而其他目标位保持不变。该指令是 BFM 指令的别名。
32-bit (sf == 0 && N == 0)
BFC <Wd>, #<lsb>, #<width>
等价指令
BFM <Wd>, WZR, #(-<lsb> MOD 32), #(<width>-1)
64-bit (sf == 1 && N == 1)
BFC <Xd>, #<lsb>, #<width>
等价指令
BFM <Xd>, XZR, #(-<lsb> MOD 64), #(<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<lsb>
对于 32 位变体:是目标位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是目标位域的 lsb 的位数,范围为 0 到 63。
<width>
对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>
。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>
。
下图是 BFC W1, #3, #4
指令操作示意图:
下面是使用 BFC 指令的例子。
long long int x = -1;asm volatile("BFC %x[x], #8, #8\n":[x] "+r"(x):: "cc", "memory");
执行 BFC %x[x], #8, #8
将 %x[x]
寄存器的 8 ~ 15 位(宽度为 8)清零,即 0xFFFF FFFF FFFF 00FF,这也是最终 x 的值。
8. SBFX
SBFX(Signed Bitfield Extract —— 有符号位域提取) 指令复制一个 <width>
位的位域,从源寄存器中的位位置 <lsb>
开始到目标寄存器的最低有效位,并将位域前面的目标位设置为位域最高有效位的副本。该指令是 SBFM 指令的别名。
32-bit (sf == 0 && N == 0)
SBFX <Wd>, <Wn>, #<lsb>, #<width>
等价指令
SBFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)
64-bit (sf == 1 && N == 1)
SBFX <Xd>, <Xn>, #<lsb>, #<width>
等价指令
SBFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<lsb>
对于 32 位变体:是源位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是源位域的 lsb 的位数,范围为 0 到 63。
<width>
对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>
。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>
。
下面是使用 SBFX 指令的例子。
long long int x = 0;long long int y = 0x87;asm volatile("SBFX %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 SBFX %x[x], %x[y], #4, #4
,首先将 %x[y]
寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x]
寄存器的 0 ~ 3 位,又因为 0x87 的第七位为 1,所以使用 1 扩展 %x[x]
的 4 ~ 63 位(这里体现了符号位),即 0xFFFF FFFF FFFF FF80,这也是最终 x 的值。
9. UBFX
UBFX(Unsigned Bitfield Extract —— 无符号位域提取)指令复制一个 <width>
位的位域,从源寄存器中的位位置 <lsb>
开始到目标寄存器的最低有效位,并将位域前面的目标位设置为零。该指令是 UBFM 指令的别名。
32-bit (sf == 0 && N == 0)
UBFX <Wd>, <Wn>, #<lsb>, #<width>
等价指令
UBFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)
64-bit (sf == 1 && N == 1)
UBFX <Xd>, <Xn>, #<lsb>, #<width>
等价指令
UBFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<lsb>
对于 32 位变体:是源位域的 lsb 的位数,范围为 0 到 31。对于 64 位变体:是源位域的 lsb 的位数,范围为 0 到 63。
<width>
对于 32 位变体:是位域的宽度,范围为 1 到 32-<lsb>
。对于 64 位变体:是位域的宽度,范围为 1 到 64-<lsb>
。
下图是 UBFX W1, W0, #18, #7
指令操作示意图:
下面是使用 UBFX 指令的例子。
long long int x = 0;long long int y = 0x87;asm volatile("UBFX %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 UBFX %x[x], %x[y], #4, #4
,首先将 %x[y]
寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x]
寄存器的 0 ~ 3 位,接着使用 0 扩展 %x[x]
的 4 ~ 63 位,即 0x8,这也是最终 x 的值。
10. BFXIL
位域提取并在低端插入,其他位不变。该指令是 BFM 指令的别名。
32-bit (sf == 0 && N == 0)
BFXIL <Wd>, <Wn>, #<lsb>, #<width>
等价指令
BFM <Wd>, <Wn>, #<lsb>, #(<lsb>+<width>-1)
64-bit (sf == 1 && N == 1)
BFXIL <Xd>, <Xn>, #<lsb>, #<width>
等价指令
BFM <Xd>, <Xn>, #<lsb>, #(<lsb>+<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<lsb>
是源位域的“lsb”的位数。对于 32 位变体:范围为 0 到 31;对于 64 位变体:范围为 0 到 63。
<width>
是位域的宽度。对于 32 位变体:范围为 1 到 32-<lsb>
;对于 64 位变体:范围为 1 到 64-<lsb>
。
下面是使用 BFXIL 指令的例子。
long long int x = 0x4444;long long int y = 0x87;asm volatile("BFXIL %x[x], %x[y], #4, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 BFXIL %x[x], %x[y], #4, #4
,首先将 %x[y]
寄存器内的 0x87 的 4 ~ 7 位复制到 %x[x]
寄存器的 0 ~ 3 位,其它位保持不变,所以最终 %x[x]
的值为 0x4448。
11. UBFIZ
无符号位域插入零,左右为零。该指令是 UBFM 指令的别名。
32-bit (sf == 0 && N == 0)
UBFIZ <Wd>, <Wn>, #<lsb>, #<width>
等价指令
UBFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)
64-bit (sf == 1 && N == 1)
UBFIZ <Xd>, <Xn>, #<lsb>, #<width>
等价指令
UBFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<lsb>
是源位域的“lsb”的位数。对于 32 位变体:范围为 0 到 31;对于 64 位变体:范围为 0 到 63。
<width>
是位域的宽度。对于 32 位变体:范围为 1 到 32-<lsb>
;对于 64 位变体:范围为 1 到 64-<lsb>
。
下面是使用 UBFIZ 指令的例子。
long long int x = 0x444444;long long int y = 0x89;asm volatile("UBFIZ %x[x], %x[y], #8, #8\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 UBFIZ %x[x], %x[y], #8, #8
,首先将 %x[y]
寄存器内的 0x89 低 8 位复制到 %x[x]
寄存器的 8 ~ 15 位,其它位全部清零,所以最终 %x[x]
的值为 0x8900。
12. SBFIZ
带符号的位域插入零,符号复制到左边,零复制到右边。该指令是 SBFM 指令的别名。
32-bit (sf == 0 && N == 0)
SBFIZ <Wd>, <Wn>, #<lsb>, #<width>
等价指令
SBFM <Wd>, <Wn>, #(-<lsb> MOD 32), #(<width>-1)
64-bit (sf == 1 && N == 1)
SBFIZ <Xd>, <Xn>, #<lsb>, #<width>
等价指令
SBFM <Xd>, <Xn>, #(-<lsb> MOD 64), #(<width>-1)
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<lsb>
是源位域的“lsb”的位数。对于 32 位变体:范围为 0 到 31;对于 64 位变体:范围为 0 到 63。
<width>
是位域的宽度。对于 32 位变体:范围为 1 到 32-<lsb>
;对于 64 位变体:范围为 1 到 64-<lsb>
。
下面是使用 SBFIZ 指令的例子。
long long int x = 0x444444;long long int y = 0x89;asm volatile("SBFIZ %x[x], %x[y], #8, #8\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 SBFIZ %x[x], %x[y], #8, #8
,首先将 %x[y]
寄存器内的 0x89 低 8 位复制到 %x[x]
寄存器的 8 ~ 15 位,接着由于 0x89 符号位为 1,所以 16 ~ 63 位全部复制为 1, 0 ~ 7 位则清零,所以最终 %x[x]
的值为 0xFFFF FFFF FFFF 8900。
13. BFM
BFM(Bitfield move —— 位域移动)位域移动,其他位不变。该指令由别名 BFC、BFI 和 BFXIL 使用。
-
如果
<imms>
大于或等于<immr>
,则将从源寄存器中的位位置<immr>
开始的(<imms>
-<immr>
+ 1)位的位域复制到目标寄存器的最低有效位。 -
如果
<imms>
小于<immr>
,则将源寄存器的最低有效位中的(<imms>
+ 1)位的位域复制到目标寄存器的位位置(regsize -<immr>
),其中 regsize 是 32 或 64 位的目标寄存器大小。
在这两种情况下,目的寄存器的其他位保持不变。
32-bit (sf == 0 && N == 0)
BFM <Wd>, <Wn>, #<immr>, #<imms>
64-bit (sf == 1 && N == 1)
BFM <Xd>, <Xn>, #<immr>, #<imms>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<immr>
是循环右移量,在“immr”字段中编码。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:是在 0 到 63 范围内。
<imms>
是要从源移动的最左边的位数(the leftmost bit number to be moved from the source),编码在“imms”字段中。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:范围从 0 到 63。
下面是使用 BFM 指令的例子。
long long int x = 0x444444;long long int y = 0x79;asm volatile("BFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 BFM %x[x], %x[y], #8, #4
,将 0x79(0b01111001) 中的 0 ~ 4 位(4 + 1 = 5 共 5 位)(0b11001)移动到目标寄存器 %x[x]
,也就是将 0x19 移动到 %x[x]
的最左边(从 64 - 8 = 56 位开始复制),其它位保持不变,最终为 0x1900 0000 0044 4444。
14. UBFM
UBFM(Unsigned Bitfield Move —— 无符号位域移动)指令通常通过其别名之一进行访问,该别名始终是反汇编的首选。
-
如果
<imms>
大于或等于<immr>
,则将从源寄存器中的位位置<immr>
开始的(<imms>
-<immr>
+ 1)位的位域复制到目标寄存器的最低有效位。 -
如果
<imms>
小于<immr>
,则将源寄存器的最低有效位中的(<imms>
+ 1)位的位域复制到目标寄存器的位位置(regsize -<immr>
),其中 regsize 是 32 或 64 位的目标寄存器大小。
在这两种情况下,位域前面和后面的目标位都设置为零。
该指令由别名 LSL(立即数)、LSR(立即数)、UBFIZ、UBFX、UXTB 和 UXTH 使用。
32-bit (sf == 0 && N == 0)
UBFM <Wd>, <Wn>, #<immr>, #<imms>
64-bit (sf == 1 && N == 1)
UBFM <Xd>, <Xn>, #<immr>, #<imms>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<immr>
是循环右移量,在“immr”字段中编码。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:是在 0 到 63 范围内。
<imms>
是要从源移动的最左边的位数(the leftmost bit number to be moved from the source),编码在“imms”字段中。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:范围从 0 到 63。
下面是使用 UBFM 指令的例子。
long long int x = 0x444444;long long int y = 0x79;asm volatile("UBFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 UBFM %x[x], %x[y], #8, #4
,将 0x79(0b01111001) 中的 0 ~ 4 位(4 + 1 = 5 共 5 位)(0b11001)移动到目标寄存器 %x[x]
,也就是将 0x19 移动到 %x[x]
的最左边(从 64 - 8 = 56 位开始复制),其它位清零,最终为 0x1900 0000 0000 0000。
15. SBFM
SBFM(Signed Bitfield Move —— 有符号位域移动)指令通常通过其别名之一访问,该别名始终是反汇编的首选。
-
如果
<imms>
大于或等于<immr>
,则将从源寄存器中的位位置<immr>
开始的(<imms>
-<immr>
+ 1)位的位域复制到目标寄存器的最低有效位。 -
如果
<imms>
小于<immr>
,则将源寄存器的最低有效位中的(<imms>
+ 1)位的位域复制到目标寄存器的位位置(regsize -<immr>
),其中 regsize 是 32 或 64 位的目标寄存器大小。
在这两种情况下,位域后面的目的位被设置为零,位域前面的位被设置到位域的最高有效位的拷贝。
该指令由别名 ASR(立即数)、SBFIZ、SBFX、SXTB、SXTH 和 SXTW 使用。
32-bit (sf == 0 && N == 0)
SBFM <Wd>, <Wn>, #<immr>, #<imms>
64-bit (sf == 1 && N == 1)
SBFM <Xd>, <Xn>, #<immr>, #<imms>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
<immr>
是循环右移量,在“immr”字段中编码。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:是在 0 到 63 范围内。
<imms>
是要从源移动的最左边的位数(the leftmost bit number to be moved from the source),编码在“imms”字段中。对于 32 位变体:在 0 到 31 的范围内;对于 64 位变体:范围从 0 到 63。
下面是使用 SBFM 指令的例子。
long long int x = 0x444444;long long int y = 0x79;asm volatile("SBFM %x[x], %x[y], #8, #4\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 SBFM %x[x], %x[y], #8, #4
,将 0x79(0b01111001) 中的 0 ~ 4 位(4 + 1 = 5 共 5 位)(0b11001)移动到目标寄存器 %x[x]
,也就是将 0x19 移动到 %x[x]
的最左边(从 64 - 8 = 56 位开始复制),它的后面的位清零,前面的位由于符号位为 1,因此全部复制为 1,最终为 0xF900 0000 0000 0000。
16. CLZ
计算前导零位数:Rd = CLZ(Rn)。
32-bit (sf = 0)
CLZ <Wd>, <Wn>
64-bit (sf = 1)
CLZ <Xd>, <Xn>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
下面是使用 CLZ 指令的例子。
long long int x = 0;long long int y = 0x79;asm volatile("CLZ %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 CLZ %x[x], %x[y]
,计算 %x[y]
前导零的位数,即 0x79(0b01111001)中前导零的位数,也就是 64 - 7 = 57,最终将 57 写入 %x[x]
。
17. RBIT
RBIT 指令反转所有位(反转位序)。
32-bit (sf = 0)
RBIT <Wd>, <Wn>
64-bit (sf = 1)
RBIT <Xd>, <Xn>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
下面是使用 RBIT 指令的例子。
long long int x = 0;long long int y = 0x79;asm volatile("RBIT %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 RBIT %x[x], %x[y]
,反转 %x[y]
中的所有位(反转位序),即 0x79(0b01111001)反转为 0x9E00 0000 0000 0000,最终将 0x9E00 0000 0000 0000 写入 %x[x]
。
18. REV
REV 指令反转所有字节。
32-bit (sf = 0)
REV <Wd>, <Wn>
64-bit (sf = 1)
REV <Xd>, <Xn>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
下面是使用 REV 指令的例子。
long long int x = 0;long long int y = 0x12436579;asm volatile("REV %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 REV %x[x], %x[y]
,反转 %x[y]
中的所有字节,即 0x12436579 反转为 0x7965 4312 0000 0000,最终将 0x7965 4312 0000 0000 写入 %x[x]
。
19. REV16
REV16 指令反转 16 位半字中的字节。
32-bit (sf = 0)
REV16 <Wd>, <Wn>
64-bit (sf = 1)
REV16 <Xd>, <Xn>
<Wd>
是通用目标寄存器的 32 位名称,在“Rd”字段中编码。
<Wn>
是通用源寄存器的 32 位名称,在“Rn”字段中编码。
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
下面是使用 REV16 指令的例子。
long long int x = 0;long long int y = 0x12436579;asm volatile("REV16 %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 REV16 %x[x], %x[y]
,反转 %x[y]
中 16 位半字中的字节,即 0x12436579 反转为 0x43127965,最终将 0x43127965 写入 %x[x]
。
20. REV32
REV32 指令反转 32 位字中的字节。
64-bit
REV32 <Xd>, <Xn>
<Xd>
是通用目标寄存器的 64 位名称,在“Rd”字段中编码。
<Xn>
是通用源寄存器的 64 位名称,在“Rn”字段中编码。
下面是使用 REV32 指令的例子。
long long int x = 0;long long int y = 0x12436579;asm volatile("REV32 %x[x], %x[y]\n":[x] "+r"(x),[y] "+r"(y):: "cc", "memory");
执行 REV32 %x[x], %x[y]
,反转 %x[y]
中 32 位字中的字节,即 0x12436579 反转为 0x79654312,最终将 0x79654312 写入 %x[x]
。
参考资料
1.《ARMv8-A-Programmer-Guide》
2.《Arm® A64 Instruction Set Architecture Armv8, for Armv8-A architecture profile》