【汇编】思考汇编中的两个基本问题

news/2024/12/15 7:27:52/

1. 若干年前的疑问

几年前还在大学学习汇编时,不管是考试还是课程设计,其实都很顺利。但是心里一直对什么时候使用哪个寄存器存在疑惑,编写汇编时,没有十足的把握,都是抱着试一试的心态去完成了课程任务。

工作八年有余,已走在向linux内核进发的路上。在学习linux内核之前,心里存有一些侥幸,认为汇编可以跳过去。别人封装好,只管使用即可,反正自己又不一定写。在学习过程中,涉及到汇编的部分都是大致看一下设计思路。但是逐渐地,跳过的细节越来越多,导致书慢慢的越来越看不懂了。问题积少成多,窟窿越来越大,量变产生了质变。

汇编中的指令还是挺好理解的,就是一些功能函数,我相信大多数人理解起来问题都不大。

我认为汇编中最大的问题在于寄存器和内存的使用。CPU中寄存器的数量有限,引发了两个问题:

  1. 何时该用哪个寄存器
  2. 哪些数据存在寄存器哪些放在内存

这两个问题一直困扰着我,由于工作中用汇编比较少,所以这个问题一直没有得到深入地思考和解决。今天我们就尝试解决这两个汇编问题。

2. 汇编指令与高级语言中函数的相同点和不同点

我们直入主题,汇编指令与高级语言中函数的相同点是:

  • 汇编指令和函数一样,都是为了完成某个操作的功能单元,他们都有输入和输出,说白了,你可以把汇编指令也看成是一种函数。

不同点是:

  • 单个汇编指令不能嵌套调用,可以组合调用;成对搭配的汇编指令,可以嵌套调用,比如CALL和RET。
  • 单个函数可以嵌套调用,也可以组合调用

3. 单个指令的“独占性原理”

寄存器的个数是很有限的,但是指令确有很多很多,寄存器够用吗?

答案是,对单个指令来说,肯定是够用的。因为单个指令不能嵌套,所以我们可以确定,一个指令在被CPU核执行的时候,是“独占”所有它可以操作的寄存器的,因为此刻一个CPU核中不会有其他指令执行。这样一来,我们可以确定,对一条指令来说,寄存器虽然很少,但肯定是足够的。CPU厂家在设计指令时,不会设计使用超额寄存器数量的指令。

单条指令的“独占性原理”,保证了CPU中即使只有有限数量的寄存器,也能正确执行任何单个指令。

4. 多指令协同与优化

从单个指令执行过程看,单个指令执行有“独占性原理”。

从多个指令执行过程看,寄存器还能够用吗?设想一下,如果前一个指令执行后,有很多重要的数据存在于寄存器中保存,而当前的指令又需要独占寄存器,很有可能会把存在于寄存器中重要的数据给“覆盖”、“破坏”了,从而导致重要数据丢失。这种情形下,程序将无法正确执行。出现这种问题的根本原因还是在于寄存器数量有限,如果寄存器数量很多很多,那么只要合理分配和释放,数据就不会被覆盖。

所以,在多指令角度,因为寄存器数量有限,又出现了新的问题。怎么解决这个问题呢?

通过将下一条指令需要的数据留在寄存器中,将下一条指令不需要的数据放到内存中,这个问题迎刃而解。下一条指令需要的数据,其实就是指令的输入参数。前后指令配合的过程,我起个名字,叫“多指令协同”。

其实把下一条指令的输入参数留下,不需要的数据放入内存,是一种简单粗暴的做法。细想之下,如果寄存器数量还有空余,其实可以多留一些数据在寄存器中,给下下条指令,下n条指令传参,这样可以减少内存的访问,提高执行效率。但是这种预留是不确定的,是动态的,是具体的,必须根据具体的指令,使用的参数个数,返回值个数,进行专门优化。这个过程,我称之为“多指令协同优化”。

在编译高级语言的过程中,编译器会在生成汇编语言时,根据编译参数,自动进行优化。在编译程序时,不同的编译优化等级,优化的算法和力度是不同的。如果考虑上CPU的多级缓存,其实优化过程还是很复杂的。这里我们暂时不做深入研究。

5. 汇编编程套路

工作做到最后,都是套路。套路换一个词,就是经验。如何能够把汇编程序写得又快又好,那就需要学习套路。

我们上面说了,当写多条指令的时候需要注意优化寄存器和内存的使用。这个优化太自由了,你可以这么优化,我可以那么优化,自由的东西一定程度上,是没有标准没有把握的东西。我们平时写代码,如何更多的关注于业务呢?这里讲一种方法。

程序都是由一小块一小块功能模块的代码组成的,汇编也是一样。汇编程序是由很多汇编代码段组成的。这里用代码段来讲,而不是用函数来讲,是因为函数也有可能是由几个代码段组成。所以代码段是比函数更小的代码模块。

有了代码段的概念之后,我们可以把“指令独占性原理”,扩展到代码段,变成“汇编代码段独占性原理”。我们可以认为一个代码段执行过程中,独占所有寄存器,代码段执行完成后,可以通过某几个寄存器向接下来的代码段传递参数,剩下的寄存器,默认将成为空闲寄存器,里面的数据可以被覆盖。如果有的寄存器需要延长生命期,可以把寄存器中的数据保存到内存中,从而将寄存器释放出来。

这样,下一个代码段也将独占所有寄存器。这样就不用时刻担心,这个寄存器能不能用,会不会覆盖已有的数据了。

本质上,这是通过控制作用域与生命期,来调整软件架构的方法,这个方法在编程中很常用。

6. 结论

通过一步步推导“单指令独占性”原理,“多指令协同”,“多指令协同优化”,“汇编编程套路-代码段独占性原理”,可以很好的解答本文开始提出来的疑问。寄存器,内存的使用是有章可循的,大致的原则和方法要心中有数,才能算是对汇编有一定的掌握,编写或者阅读代码时,才能更有信心。

我的学习习惯就是这样,基本的思路逻辑必须先梳理清晰,而不是一头扎进细节里。重要的细节,我在后面的文章中会进行专门探讨。


http://www.ppmy.cn/news/1555237.html

相关文章

ThinkPHP开发的原生微信小程序二手物品回收小程序管理系统源码

二手物品回收小程序 一款基于ThinkPHP开发的原生微信小程序二手物品回收小程序管理系统。支持线上下单、免费上门取件、评估价格等功能。提供全部无加密源码,支持私有化部署。

专题一:斐波那契数列模型算法

> 作者:დ旧言~ > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:了解什么是记忆化搜索,并且掌握记忆化搜索算法。 > 毒鸡汤:有些事情,总是不明白,所以我不会坚持。早…

vue中打包dist文件内assets 和 static 的区别

背景 在Vue.js项目中,assets 和 static 是两个用于存放静态资源的文件夹,但它们在使用方式和处理机制上有所不同 用途 assets: assets 文件夹通常用于存放那些需要在构建过程中被Webpack处理的静态资源。这些资源可以包括图片、字体、样式文件&#…

Python实现银杏树绘制与效果展示

银杏树,因其形态优美、叶片独特而被人们喜爱。银杏的叶子呈扇形,秋天时叶片呈现出金黄的色彩,成为秋季的代表之一。今天,我们将使用Python的turtle库来绘制一棵具有银杏树🍂特色的树。 通过编写Python代码,…

总结与提升

今天学习了ai,对今天学习的内容进行总结。 本文参考chat gpt-4的训练文献。 模型架构基础 Transformer 架构:ChatGPT 采用了 Transformer 架构,这是一种基于自注意力机制的深度学习模型架构。它能够并行计算文本中的长期依赖关系&#xff…

量化分析:股票的筹码分布和获利比例

筹码分布 筹码分布是股票分析里面的一个比较简单的部分,通过查看筹码的分布图形,判断当前的股票的压力的指数,通过查看获利的比例来计算有多少人愿意出,有多少人愿意保持价格 目前的很多工具也是可以直接去查看的,但…

02-51单片机的C语言基础与最小系统

C语言基础 一个简单的单片机C程序要有什么 #include<reg51.h> void main() {while(1){} }C语言中常用语句略&#xff0c;if,while,do…while,for,switch…case 函数略 C&#xff0d;51的数据类型扩充定义 sfr:特殊功能寄存器声明sfr 变量名地址值&#xff1b;*特殊功…

从万维网到人工智能:改变生活的11项技术里程碑

1984 年 1 月 24 日&#xff0c;苹果公司推出了 Macintosh 128K&#xff0c;从此永远改变了个人电脑的面貌。 史蒂夫・乔布斯&#xff08;Steve Jobs&#xff09;这款小巧且用户友好的电脑向全世界引入了图形用户界面&#xff0c;标志着个人技术发展历程中的一个关键时刻。 从…