关于Intel处理器架构中AVX2里Gather特性的说明

news/2024/10/30 23:22:31/

Intel Haswell 架构里引入了 Gather 特性。它使得CPU可以使用向量索引存储器编址从存储器取非连续的数据元素。这些gather指令引入了一种新的存储器寻址形式,该形式由一个 基地址寄存器(仍然是通用目的寄存器)和通过一个 向量寄存器XMMYMM)所指定的多个索引构成。数据元素大小支持32位与64位,并且数据类型支持浮点型和整型。

我们先回顾一下普通的x86寻址方式:[<base register> + <index register> * <scale> + <offset>]

AT&T 汇编语法的形式下表达为:<offset>(<base register>, <index register>, <scale>)

其中,<base register> 为基地址寄存器;<index register> 为索引寄存器;<scale> 为刻度因子,它是一个立即数,并仅支持 0,1,2,4,8 这几个值;<offset> 表示偏移量,它是一个立即数。

那么下面我们就先来谈谈上面所提到的向量存储器寻址。


向量SIB(VSIB)存储器寻址

在AVX2中,跟在 ModR/M 字节后面的 SIBS 表示 Scale;I 表示 Index;B 表示 Base)字节可以支持对一组线性地址的 VSIB 存储器寻址。VSIB 寻址仅在AVX2指令的子集中支持。VSIB 存储器寻址要求32位或64位的有效寻址。在32位模式下,当地址大小属性被重载为16位时,VSIB 寻址不被支持。在16位保护模式下,VSIB 寻址是被允许的,若地址大小属性被重载为32位的话。此外,VSIB 存储器寻址仅伴随 VEX 前缀而被支持。

VSIB 存储器寻址中,SIB 字节由以下部分组成:

  • 刻度域(位7:6)指定了刻度因子。
  • 索引域(位5:3)指定了向量索引寄存器的寄存器编号,该向量存储器中的每个元素都指定了一个索引。
  • 基地址域(位2:0)指定了基地址寄存器的编号。

比如:

.text
.align 4
.att_syntaxvgatherdpd    %xmm0, 128(%rdi, %xmm2, 4), %xmm3

.text
.align 4
.intel_syntax noprefixvgatherdpd    xmm3, [rdi + xmm2 * 4 + 128], xmm0

上述指令中,基地址寄存器为 RDI,索引寄存器为 XMM2,刻度因子是4,偏移量是128。而指令 vgatherdpd 是将索引寄存器的元素作为双字(即4字节)进行划分,然后乘上刻度因子后加到基地址上。而偏移量则作用于每个基地址元素。

下面我们将提供一个比较完整的示例代码来描述 VGATHERDPD 指令。

先看汇编指令:

.text
.align 4
.att_syntax#ifdef __APPLE__
.globl _InstTest
_InstTest:
#else
.globl InstTest
InstTest:
#endif// 设置索引寄存器的每个元素mov     $4, %eax// 前一个索引为4movd    %eax, %xmm2mov     $8, %eax// 后一个索引为8pinsrd  $1, %eax, %xmm2// 将两个double元素的mask全都置1mov     $0xffffffffffffffff, %rax// xmm0作为mask寄存器movq    %rax, %xmm0punpcklqdq    %xmm0, %xmm0// xmm3作为目的寄存器vgatherdpd    %xmm0, 8(%rdi, %xmm2, 2), %xmm3ret

.text
.align 4
.intel_syntax noprefix#ifdef __APPLE__
.globl _InstTest
_InstTest:
#else
.globl InstTest
InstTest:
#endif// 设置索引寄存器的每个元素mov     eax, 4// 前一个索引为4movd    xmm2, eaxmov     eax, 8// 后一个索引为8pinsrd  xmm2, eax, 1// 将两个double元素的mask全都置1mov     rax, 0xffffffffffffffff// xmm0作为mask寄存器movq    xmm0, raxpunpcklqdq    xmm0, xmm0// xmm3作为目的寄存器vgatherdpd    xmm3, [rdi + xmm2 * 2 + 8], xmm0ret

这里,RDI 寄存器作为第一个输入参数,存放了基地址。

下面是C函数的调用:

#include <stdalign.h>int main(void)
{    extern void InstTest(void *p);alignas(64) unsigned buffer[] = { 0x01020304U, 0x05060708U, 0x090a0b0cU, 0x10121314U, 0x15161718U, 0x191a1b1cU, 0x20212223U, 0x24252627U };InstTest(buffer);return 0;
}

我们通过在 return 0; 这条语句设置断点,然后通过GDB或LLDB调试器可以发现最终目的寄存器 XMM3 的最后内容为:

xmm3 = {0x18 0x17 0x16 0x15 0x1c 0x1b 0x1a 0x19 0x23 0x22 0x21 0x20 0x27 0x26 0x25 0x24}

以上代码的编译环境为:macOS 10.9.3, Xcode 5.1, Apple LLVM 5.1。

运行环境为:MacBook Air 2013版,Intel Core i7 4650U, 8GB DDR3。


http://www.ppmy.cn/news/62561.html

相关文章

【今天聊聊生产力】提升研发生产力的神器推荐

1、Free Mybatis Tool、MybatisX 用于DAO层和Mapper层之间跳转 Mapper和DAO层跳转&#xff0c;可以用的插件比较多&#xff0c;比较推荐如下两款&#xff0c;功能基本一致&#xff0c;只是样式小有差别。 Free Mybatis Tool&#xff0c;样式为一个绿色箭头&#xff0c;简洁明了…

(4)Qt——基本组件

目录 1. Designer 设计师** 2. Layout 布局*** 3. 基本组件 3.1 QWidget** 3.2 ui指针 3.3 QLabel 标签** 3.4 QAbstractButton 按钮类** 3.5 QLineEdit 单行文本输入框** 3.6 QComboBox 组合框** 3.7 一组与数值相关的组件* 1. Designer 设计师** Designer是一款独立的用于设计…

yolov8 浅记

目录 Pre: 1. YOLOv8 概述 2. 模型结构设计 3. Loss 计算 4.训练数据增强 5. 训练策略 6、部署推理 End Pre: yolo系列发布时间&#xff1a; 先贴一下yolo各系列的发布时间&#xff08;说出来很丢人&#xff0c;我以为 yolox是 最新的&#xff09;&#xff1a; yoloX 2…

从供应链角度看进销存:区别与联系

供应链和进销存是两个紧密相关的概念&#xff0c;它们都涉及到企业在商品贸易中的运作过程。虽然它们有一些相似之处&#xff0c;但是它们也有一些显著的区别。本文将从几个方面探讨供应链和进销存的区别。 一、概念定义 供应链的定义&#xff1a;供应链是一系列的活动&#…

搭建本地仓库源

一、如何搭建仓库源 之前讲了定制ISO的方法&#xff1a;使用chroot定制系统&#xff0c;但有时候我们想自定义的安装包不在上游的仓库源中&#xff0c;在我们本地应该怎么办呢&#xff1f;如果我们将deb包拷贝到iso目录再安装有点过于麻烦了&#xff0c;而且还可能需要手动处理…

什么是UN38.3/UN38.3/MSDS+货物运输鉴定报告是什么?怎么做?

一&#xff1a;什么是UN38.3? UN38.3是指在联合国针对危险品运输专门制定的《联合国危险物品运输试验和标准手册》的第3部分38.3款&#xff0c;简称UN38.3。 据国际航协《危险物品规则》的相关规定&#xff0c;对适用于包括但不限于单独或与设备一起运输的属可充电型锂电池的手…

SpringBoot Starter 作用及原理,你真的清楚吗?

本文会以 mybatis 为例&#xff0c;通过对比 mybatis-spring 和 mybatis-spring-boot-starter 代码示例&#xff0c;了解 Starter 的作用。并对 mybatis-spring-boot-starter 进行简单剖析&#xff0c;了解 Starter 原理。 什么是 Starter 大家都知道基于 SpringBoot 开发项目…

SpringBoot的yml多环境配置3种方法

目录 方式一&#xff1a;多个yml文件 步骤一、创建多个配置文件 步骤二、applicaiton.yml中指定配置 方式二&#xff1a; 单个yml文件 方式三&#xff1a;在pom.xml中指定环境配置 步骤一、创建多个配置文件 步骤二、在application.yml中添加多环境配置属性 步骤三、在po…