RISC-V汇编学习(一)—— 基础认识

devtools/2025/3/3 15:04:04/

最近这三年的工作时间大部分的工作,都是基于riscv的cpu和接口ip开发适配驱动,时不时的就要debug测试代码,面对很多都是汇编,所以也是整理下积累的一点点笔记,系列博客将总结下riscv相关的内容,一是给有需要的人一点点帮助,另外给自己梳理下方便日后查阅。

虽然现在大部分的程序都不在使用汇编,但是在一些特殊场景下:底层驱动、引导程序、高性能算法库等等,汇编还是扮演着重要作用。对于嵌入式驱动开发,虽然可能不要求熟练的coding汇编,但是至少做到能够看懂理解和编写一些简单的汇编程序。

先从汇编最基础的概念以及相关的知识开始简单了解,后续慢慢会继续更新完善。

1 riscv简介

1.1 ISA

ISA (Instruction Set Architecture) 指令集架构,可以说是CPU的灵魂,是软硬件之间的桥梁;定义了指令集(指令类型和编码、寻址方式)、数据类型、存储模型、系统模型(中断、异常、特权等级等)、软件可见的处理器状态(通用寄存器、PC、处理器状态等)。

1.2 CISC和RISC

指令集架构主要分为:

  • 复杂指令集(Complex Instruction Set Computer)
  • 精简指令集( Reduced Instruction Set Computer, RISC )

CISC与RISC的区别如下:

VS复杂指令集(CISC)精简指令集(RISC)
指令数量
指令系统复杂度复杂简单
指令长度变长,不固定等长,固定
寻址方式
指令格式少且规整
各指令使用频率相差很大相差不大
指令执行时间相差很大相差不大
指令周期多周期为主单周期为主(流水线技术,大部分指令在一个机器周期完成)
cpu寄存器数量多(增加寄存器,以减少访存)
指令并行性
可访存指令不加限制只有load/store等访存指令才能访问内存(减少了访存周期)
优化编译实现很难较容易(依靠编译程序的优化来更有效的支持高级语言)
代表架构x86ARM,MIPS,PowerPC,LoongArch,RISC-V等

目前主流的CISC就是x86,而RISC的代表则是ARM。

这里介绍的RISC-V是第5代精简指令集,也时属于RISC阵营一员,RISC-V架构主要由美国加州大学伯克利分校(简称伯克利)的Krste Asanovic 教授、Andrew Waterman 和Yunsup Lee等开发人员于2010年发明,并且得到了计算机体系结构领域的泰斗David Patterson 的大力支持。

另外,RISC-V(英文读作“ risk-five"),是一种全新的指令集架构。“V”包含两层意思, 一是这是Berkeley 从RISC I开始设计的第五代指令集架构: 二是它代表了变化( Variation )和向量( Vectors ) 。

关于RISC-V更多的介绍以及其他ISA的介绍,感兴趣自行搜索学习了解。

这里有一点主观观点要说一下——未来RISC-V一定会越来越好(可以学习了来评论区讨论下,就不具体展开啦)。

1.3 march

1.3.1 RISC-V指令架构有以下特点:

  • 完全开放
  • 指令简单
  • 模块化设计,易于扩展

RISC-V 的指令集使用模块化的方式进行组织,每一个模块使用一个英文字母来表示。正是由于RISC-V模块化特点,RISC-V架构也有一套命名标准来描述当前CPU所支持指令集;比如:RV32I、RV64G、RV32IMA这样。

1.3.2通用的命名格式

如下:

RV[n][I/F/D/Q/M/C/A/B/E/H/K/V/P/J/T/N]

其中:

  • RV代表这是RISC-V指令集
  • n代表当前指令集是几位的,32位还是64位
  • 后面的是指令集模块,模块含义如下表格
module nameclassdescription
RV32I基础指令整数指令:包含算法、分支、逻辑、访存指令,有32个32位寄存器。能寻址32位地址空间
RV64I基础指令整数指令:包含算法、分支、逻辑、访存指令,有32个64位寄存器。能寻址64位地址空间
RV128I基础指令整数指令:包含算法、分支、逻辑、访存指令,有32个128位寄存器。能寻址128位地址空间
RV32E基础指令与RV32I一样,只不过只使用前16个(0~15)32位寄存器
M扩展指令包含乘法、除法、取模求余指令
F扩展指令单精度浮点指令
D扩展指令双精度浮点指令
Q扩展指令四倍精度浮点指令
A扩展指令原子操作指令:比如比较并交换,读改写等指令
C扩展指令压缩指令:单指令长度为16位,主要用于改善程序大小
P扩展指令单指令多数据(Packed-SIMD)指令
B扩展指令位操作指令
K扩展指令密码运算扩展指令集(Key)
V扩展指令可伸缩矢量扩展指令集(Vector)
T扩展指令事务内存指令集(Transactional Memory)
H扩展指令支持(Hypervisor)管理指令
J扩展指令支持动态翻译语言指令
L扩展指令十进制浮点指令
N扩展指令用户中断指令
G通用指令包含I、M、A、F、D 指令

以上模块的一个特定组合“ IMAFD ”,也被称为“通用”组合,用英文字母G 表示。因此RV32G 表示RV32IMAFD ,同理RV64G 表示RV64IMAFD 。通过以上的模块化指令集,能够选择不同的组合来满足不同的应用。例如,追求小面积、低功耗的嵌入式场景可以选择使用RV32EC 架构;而大型的64 位架构则可以选择RV64G

2 RISC-V寄存器

在RISC-V 架构中,寄存器组主要包括通用寄存器(General Purpose Registers )和控制状态寄存器( Control and Status Register, CSR)。

2.1 通用寄存器组

RISC-V架构通用寄存器设计规范包括:

  1. 基础整数指令集寄存器配置
  • a、标准配置(I扩展集):
    RISC-V基础指令集架构默认配置32个整数寄存器组,编号为x0至x31。其中x0寄存器具有硬连线常数0特性(写入操作无效,读取始终返回0值),其余31个寄存器(x1-x31)为全功能通用寄存器。

  • b、寄存器位宽定义:
    架构通过XLEN参数声明寄存器物理位宽:
    RV32I架构:XLEN=32,寄存器采用32位存储单元
    RV64I架构:XLEN=64,寄存器扩展为64位存储空间

  1. 嵌入式场景优化配置
  • 精简配置(E扩展集):
    面向资源敏感型嵌入式场景,架构提供寄存器组精简方案:
    • 寄存器数量缩减至16个(x0-x15)
    • x0寄存器仍保持零值特性
    • 仅支持RV32E架构(强制限定XLEN=32)
  1. 浮点运算扩展配置
  • 浮点寄存器组,当系统启用单精度(F扩展)或双精度(D扩展)浮点指令时:
    • 新增独立浮点寄存器组(f0-f31)
    • 32个浮点寄存器支持标量运算操作
    • 寄存器位宽随浮点标准动态调整(F扩展对应32位,D扩展对应64位)

另外为提升代码可读性,汇编器支持寄存器功能别名映射。寄存器别名系统:
例如:x0 → zero(零值寄存器)x1 → ra(返回地址寄存器)x2 → sp(栈指针寄存器) 等,整体汇总如下:

registerABI namedescriptionSaver
x0zeroHard-wired zero,常数0
x1raReturn addresscaller
x2spStack pointercallee
x3gpGlobal pointer-
x4tpThread pointer-
x5t0Temporary/alternate link registercaller
x6-7t1-2Temporariescaller
x8s0/fpSaved register/frame pointercallee
x9s1Saved registercallee
x10-11a0-1Function arguments/return valuescaller
x12-17a2-7Function argumentscaller
x18-27s2-11Saved registerscallee
x28-31t3-6Temporariescaller
f0-7ft0-7FP temporariescaller
f8-9fs0-1FP saved temporariescaller
f10-11fa0-1FP arguments/return temporariescaller
f12-17fa2-7FP arguments temporariescaller
f18-27fs2-11FP saved temporariescaller
f28-31ft0-11FP temporariescaller

其中:

  • ABI(Application Binary Interface)
  • Caller :调用者
  • Callee : 被调用函数【这里可以视为在 Caller (函数)中调用 Callee (函数)】

Caller 维护的寄存器,在运行被调函数前不会被保存,函数返回时这些寄存器可能会被改变,所以在调用前由 Caller 保存维护。Callee 维护的寄存器,在运行被调函数前会被保存,函数返回后这些寄存器与运行被调函数前相同。

2.2 CSR寄存器

RISC-V 的架构中定义了一些控制和状态寄存器( Control and Status Register, CSR )

  1. 基础特性:

    • 专用地址空间:独立编址的12位地址域(0x000-0xFFF),通过csrrw/csrrs等专用指令访问
    • 特权级关联:寄存器访问权限与特权模式(Machine/Supervisor/User)强关联,部分CSR需特定权限操作
    • 功能范畴:系统配置、异常处理、性能监控、调试支持
  2. 主要寄存器分类:

    • 机器模式核心CSR

      • mstatus (0x300):全局状态控制(中断开关、特权模式栈)
      • mtvec (0x305):异常处理入口基址寄存器
      • mepc/mcause (0x341/0x342):异常返回地址与原因编码
      • mip/mie (0x344/0x304):中断状态与使能位图
    • 计时与计数单元

      • mcycle/minstret (0xB00/0xB02):时钟周期与指令执行计数器
      • mcountinhibit (0x320):性能计数器启停控制
    • 调试支持单元

      • dcsr/dpc (0x7B0/0x7B1):调试模式控制与断点PC存储
    • 扩展功能关联

      • 浮点扩展:fcsr (0x003) 聚合浮点状态
      • 向量扩展:vcsr (0x008) 配置向量参数
      • 用户级只读:cycle/time (0xC00系列)
  3. 访问控制机制:

    • 权限隔离:用户模式仅可访问非特权CSR(如ustatus)
    • 原子操作:提供csrrw(写后读)、csrrc(位清除)等原子指令
    • 影子寄存器:部分CSR(如stvec)在不同特权级拥有独立副本

参考

  • 指令集架构知识汇总
  • riscv-spec-20240411.pdf
  • 胡振波 手把手教你设计CPU
  • 跟我学RISC-V】(一)认识RISC-V指令集并搭建实验环境

http://www.ppmy.cn/devtools/164211.html

相关文章

【Unity精品源码】Ultimate Character Controller:高级角色控制器完整解决方案

📂 Unity 开发资源汇总 | 插件 | 模型 | 源码 💓 欢迎访问 Unity 打怪升级大本营 在Unity游戏开发的世界中,角色控制器是构建游戏互动性的核心组件之一。Ultimate Character Controller是一款专为Unity引擎设计的高级角色控制器,它…

python中单例模式介绍(含线程安全的单例模式)

理解单例模式之前,确实需要先掌握 __init__、__new__ 和 __call__ 这三个方法的作用和调用顺序。如有需要,读者可跳转下方链接学习: python中的__init__、__new__、__call__-CSDN博客 正文开始: 在Python中,单例模式&…

Qt 文件操作+多线程+网络

文章目录 1. 文件操作1.1 API1.2 例子1,简单记事本1.3 例子2,输出文件的属性 2. Qt 多线程2.1 常用API2.2 例子1,自定义定时器 3. 线程安全3.1 互斥锁3.2 条件变量 4. 网络编程4.1 UDP Socket4.2 UDP Server4.3 UDP Client4.4 TCP Socket4.5 …

EMO模型详解及代码复现

EMO定义 EMO(Efficient Mobile Networks)是一种 面向移动端的轻量化网络模型 ,旨在 在参数、FLOPs和性能之间实现平衡 ,特别适用于 密集预测任务 。EMO的设计理念源于对CNN和Transformer架构的深入理解,通过整合两者的优势,实现了高效的模型性能。 EMO的核心是 反向残差…

【北京迅为】itop-3568 开发板openharmony鸿蒙烧写及测试-第2章OpenHarmony v3.2-Beta4版本测试

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

playwright 自动化登录验证码,测试Iframe

还记得之前的文章吗,我们之前有说过,实现自动登录,详细分析了Playwright实战中登录状态问题。下面聚焦到storageState从原理到实战实现登录状态管理,从而一劳永逸解决验证码问题。 简介:在自动化测试中,频…

C++ ++++++++++

初始C 注释 变量 常量 关键字 标识符命名规则 数据类型 C规定在创建一个变量或者常量时,必须要指定出相应的数据类型,否则无法给变量分配内存 整型 sizeof关键字 浮点型(实型) 有效位数保留七位,带小数点。 这个是保…

webstorm的Live Edit插件配合chrome扩展程序JetBrains IDE Support实现实时预览html效果

前言 我们平时在前端网页修改好代码要点击刷新再去看修改的效果,这样比较麻烦,那么很多软件都提供了实时预览的功能,我们一边编辑代码一边可以看到效果。下面说的是webstorm。 1 Live Edit 首先我们需要在webstorm的settings里安装插件Live …