RISC-V开发 linux下GCC编译自定义指令流程笔记

news/2024/12/21 20:30:02/

第一步:利用GCC提供了内嵌汇编的功能可以在C代码中直接内嵌汇编语言

第二步:利用RSIC-V的中的.insn模板进行自定义指令的插入

第三步:RISC-V开发环境的搭建

C语言插入汇编

        GCC提供了内嵌汇编的功能可以在C代码中直接内嵌汇编语言语句方便了程序设计。使用内嵌汇编,要先编写汇编指令模板,然后将C语言表达式与指令的操作数相关联,并告诉GCC对这些操作有哪些限制条件。

void test(void){input= 1;__asm__ __volatile__ ("movl %1,%0" :"=r" (result) : "r" (input));return 1;}对应的汇编代码如下;
行号   代码 解释
1
7
8  movl    $1, input                     对应C语言语句input = 1;
9  movl    input, %eax	隐式处理
10 #APP                                  GCC插入的注释,表示内嵌汇编开始
11 movl    %eax,%eax                     我们的内嵌汇编语句
12 #NO_APP                               GCC  插入的注释,表示内嵌汇编结束
13 movl    %eax, result                  将结果存入result变量,隐式处理

        “movl %1,%0”是指令模板;“%0”和“%1”代表指令的操作数,称为占位符,内嵌汇编靠它们将C语言表达式与指令操作数相对应。“result”和“input”为C语言中的两个变量名。其中result对应着%0,input对应着%1。即movl input result。

        在每个操作数前面有一个用引号括起来的字符串,字符串的内容是对该操作数的限制或者说要求。“result”前面的限制字符串是“=r”,其中“=”表示“result”是输出操作数,“r”表示需要将“result”与某个通用寄存器相关联,先将操作数的值读入寄存器,然后在指令中使用相应寄存器,而不是“result”本身,当然指令执行完后需要将寄存器中的值存入变量“result”,从表面上看好像是指令直接对“result”进行操作,实际上GCC做了隐式处理,这样我们可以少写一些指令。“input”前面的“r”表示该表达式需要先放入某个寄存器,然后在指令中使用该寄存器参加运算。

RSIC-V支持自定义指令

核心思想:利用Kito Cheng提供的.insn模板进行开发

第一步:确定opcode RV32指令架构中定义了4种custom指令类型,opcode需使用表格custom-0/custom-1/custom-2/custom-3中的一种:

第二步: 确定指令类型 需要结合指令的功能来进行选择,有6种指令指令格式,分别为R/I/S/B/U/J类型

R型用于寄存器-寄存器间的操作

I型用于短立即数和访存(Load)

操作 S型用于访存Store操作

B型用于条件跳转

U型用于长立即数

J型用于无条件跳转

第三步: 确定指令编码 根据opcode以及指令类型,还需要确定其它字段的编码,比如R-type中,需要确定func3/func7字段的编码。并且编译器不会限制这两个字段的类型,支持我们自定义不同的类型来区分指令

第四步:在C语言中插入该指令

例:自定义一条指令,功能是算术运算,有两个源操作数,所以指令类型为可以选择R-type

对应的.insn模板为: .insn r opcode, func3, func7, rd, rs1, rs2

其中.insn为模板前缀 r代表该指令为R型指令 opcode使用custom-0/custom-1/custom-2/custom-3中的一种,代表这是自定义的指令 func3/func7字段可以自定义

C测试函数:

C代码
#include <stdio.h>
int main() {int a = 0;int b = 0;asm volatile (".insn r 0x7b, 6, 6, %0, %1, x0":"=r"(a):"r"(b));	return 0;
}
汇编文件
main:addi	sp,sp,-32sw	s0,28(sp)addi	s0,sp,32sw	zero,-20(s0)sw	zero,-24(s0)lw	a5,-24(s0)#APP
# 9 "test.c" 1.insn r 0x7b, 6, 6, a5, a5, x0 生成的新指令
# 0 "" 2#NO_APPsw	a5,-20(s0)li	a5,0mv	a0,a5lw	s0,28(sp)addi	sp,sp,32jr	ra反汇编文件00000000 <main>:0:	1101                	addi	sp,sp,-322:	ce22                	sw	s0,28(sp)4:	1000                	addi	s0,sp,326:	fe042623          	sw	zero,-20(s0)a:	fe042423          	sw	zero,-24(s0)e:	fe842783          	lw	a5,-24(s0)12:	0c07e7fb          	.insn	4, 0x0c07e7fb 生成的新指令机器码16:	fef42623          	sw	a5,-20(s0)1a:	4781                	li	a5,01c:	853e                	mv	a0,a51e:	4472                	lw	s0,28(sp)20:	6105                	addi	sp,sp,3222:	8082                	ret

insn支持的所有模板如下

R type: .insn r opcode, func3, func7, rd, rs1, rs2+-------+-----+-----+-------+----+-------------+| func7 | rs2 | rs1 | func3 | rd |      opcode |+-------+-----+-----+-------+----+-------------+31      25    20    15      12   7             0R type with 4 register operands: .insn r opcode, func3, func2, rd, rs1, rs2, rs3+-----+-------+-----+-----+-------+----+-------------+| rs3 | func2 | rs2 | rs1 | func3 | rd |      opcode |+-----+-------+-----+-----+-------+----+-------------+31    27      25    20    15      12   7             0I type: .insn i opcode, func3, rd, rs1, simm12+-------------+-----+-------+----+-------------+|      simm12 | rs1 | func3 | rd |      opcode |+-------------+-----+-------+----+-------------+31            20    15      12   7             0S type: .insn s opcode, func3, rd, rs1, simm12+--------------+-----+-----+-------+-------------+-------------+| simm12[11:5] | rs2 | rs1 | func3 | simm12[4:0] |      opcode |+--------------+-----+-----+-------+-------------+-------------+31             25    20    15      12            7             0SB type: .insn sb opcode, func3, rd, rs1, symbol
SB type: .insn sb opcode, func3, rd, simm12(rs1)+--------------+-----+-----+-------+-------------+-------------+| simm21[11:5] | rs2 | rs1 | func3 | simm12[4:0] |      opcode |+--------------+-----+-----+-------+-------------+-------------+31             25    20    15      12            7             0U type: .insn u opcode, rd, simm20+---------------------------+----+-------------+|                    simm20 | rd |      opcode |+---------------------------+----+-------------+31                          12   7             0UJ type: .insn uj opcode, rd, symbol+------------+--------------+------------+---------------+----+-------------+| simm20[20] | simm20[10:1] | simm20[11] | simm20[19:12] | rd |      opcode |+------------+--------------+------------+---------------+----+-------------+31           30             21           20              12   7             0CR type: .insn cr opcode2, func4, rd, rs2+---------+--------+-----+---------+|   func4 | rd/rs1 | rs2 | opcode2 |+---------+--------+-----+---------+15        12       7     2        0

理论知识如上所示

下面为RISC-V开发环境的搭建
拉取码云上的riscv-gnu-toolchain镜像
git clone  https://gitee.com/mirrors/riscv-gnu-toolchain
cd riscv-gnu-toolchain
git clone https://gitee.com/mirrors/riscv-dejagnu
git clone -b riscv-gcc-10.2.0 https://gitee.com/mirrors/riscv-gcc
git clone -b riscv-glibc-2.29 https://gitee.com/mirrors/riscv-glibc
git clone https://gitee.com/mirrors/riscv-newlib
git clone -b riscv-binutils-2.35 https://gitee.com/mirrors/riscv-binutils-gdb  riscv-binutils
git clone -b fsf-gdb-10.1-with-sim https://gitee.com/mirrors/riscv-binutils-gdb  riscv-gdb编译工具链
sudo apt-get install autoconf automake autotools-dev curl libmpc-dev libmpfr-dev libgmp-dev \
gawk build-essential bison flex texinfo gperf libtool patchutils bc zlib1g-dev libexpat-dev
pwd #获取当前路径 src
vi ~/.bashrci
export RISCV="把上面的src放到这里"
export PATH=$PATH:$RISCV/bin
:wqsource ~/.bashrc编译riscv-gnu-toolchainmkdir build
cd build
../configure --prefix=$RISCV --with-arch=rv32gc --with-abi=ilp32d
sudo apt install libncurses5-dev
sudo make -j4
make install

至此,C语言文件可以正常编译,但无法执行。

安装QEMU
cdsudo apt-get install libglib2.0-dev ninja-build  build-essential zlib1g-dev pkg-config libglib2.0-dev  \
binutils-dev libboost-all-dev autoconf libtool libssl-dev  libpixman-1-dev libpython-dev  \virtualenv libmount-dev   libpixman-1-dev
wget https://download.qemu.org/qemu-6.2.0.tar.xz
tar xvJf qemu-6.2.0.tar.xz
cd qemu-6.2.0
mkdir build
cd build
../configure
make -j4   #wait...
之后是获取新指令机器码的一些操作
vi test.c
riscv32-unknown-elf-gcc -S -o test.s test.c #生成汇编文件
riscv32-unknown-elf-gcc -c -o test.o test.c #生成机器码
riscv32-unknown-elf-objdump -d test.o       #反汇编查看机器码
riscv32-unknown-elf-gcc test.c -o test      #生成可执行文件
../qemu-6.2.0/build/qemu-riscv32 test       #在qemu上执行文件


http://www.ppmy.cn/news/1533987.html

相关文章

ansible 配置

目录 1.集群自动化维护工具 ansible 2.ansible管理架构 3.安装ansible 4.Iventory主机模式 5.通过ping验证 6.ansible常用模块 7.命令行模块 7.1command模块 7.2shell模块 7.3scripts模块 7.4file模块 7.5copy模块​ 7.6yum模块 1.集群自动化维护工具 ansibl…

Hive数仓操作(三)

一、Hive 数据库操作 1. 创建数据库 基本创建数据库命令&#xff1a; CREATE DATABASE bigdata;说明&#xff1a; 数据库会在 HDFS 中以目录的形式创建和保存&#xff0c;数据库名称会存储在 Hive 的元数据中。如果不指定目录&#xff0c;数据库将在 /user/hive/warehouse 下…

从原理到代码:如何通过 FGSM 生成对抗样本并进行攻击

从原理到代码&#xff1a;如何通过 FGSM 生成对抗样本并进行攻击 简介 在机器学习领域&#xff0c;深度神经网络的强大表现令人印象深刻&#xff0c;尤其是在图像分类等任务上。然而&#xff0c;随着对深度学习的深入研究&#xff0c;研究人员发现了神经网络的一个脆弱性&…

react 状态管理

Redux Redux是React中常用的状态管理组件&#xff0c;类似于Vue中的Pinia(Vuex)&#xff0c;可以独立于框架运行 作用&#xff1a; 通过集中管理的方式管理应用的状态 配套工具 在react中使用redux&#xff0c;官方要求按照两个插件&#xff0c;Redux Toolkit 和 react-red…

some 蓝桥杯题

12.反异或01串 - 蓝桥云课 (lanqiao.cn) #include "bits/stdc.h" #define int long long using namespace std; char c[10000000]; char s[10000000]; int cnt,Ans,mr,mid; int maxi; int p[10000000],pre[10000000]; signed main() {ios::sync_with_stdio(0);cin.t…

Python 封装 socket 为 [TCP/UDP/MULTICAST] 客户端

发送 TCP/UDP/MULTICAST 数据并接收响应。 #!/usr/bin/env python # -*- coding: utf-8 -*- import socketclass ClientSocket:def __init__(self, *, protocol: str, ip: str, port: int, recv_timeout: float 1.5):"""客户端套接字发送 TCP/UDP/MULTICAST 数…

【嵌入式裸机开发】智能家居入门3(MQTT服务器、MQTT协议、微信小程序、STM32)

前面已经写了两篇博客关于智能家居的&#xff0c;服务器全都是使用ONENET中国移动&#xff0c;他最大的优点就是作为数据收发的中转站是免费的。本篇使用专门适配MQTT协议的MQTT服务器&#xff0c;有公用的&#xff0c;也可以自己搭建 前言一、项目总览二、总体流程分析1、了解…

python 实现md5算法

md5算法介绍 MD5&#xff08;Message-Digest Algorithm 5&#xff09;是一种广泛使用的加密散列函数&#xff0c;由Ronald Rivest于1991年设计&#xff0c;并在1992年正式发布。MD5可以将任意长度的“消息”&#xff08;也可以是文件&#xff09;计算出一个固定长度的“摘要”…