8086汇编(16位汇编)学习笔记05.asm基础语法和串操作-C/C++基础-断点社区-专业的老牌游戏安全技术交流社区 - BpSend.net
asm基础语法
1. 环境配置
xp环境配置
1.拷贝masm615到指定目录
2.将masm615目录添加进环境变量
3.在cmd中输入ml,可以识别即配置成功
dosbox环境配置
1.拷贝masm611到指定目录
2.将masm611所在目录添挂载进dosbox
3.将masm611目录在dosbox中添加进环境变量
4.在cmd中输入ml,可以识别即配置成功
window10 环境配置
masm615 是 32位程序的(可以在xp系统上用) 因此要用 masm611
1.把文件复制到 dosbox-x 挂载的文件目录下
这样比较麻烦,所以可以把路径放入环境变量,在放入配置文件 set path=%path%;c:\masm611\
2. 入口和段
入口
CODE segment START: mov ax, ax CODE ends //表示标号 START 的第一行代码就是程序起点 end START
段
- 一个程序必须至少有一个段
- 一个程序中可以定义多个段
- 段不能嵌套
- 段可以重名,重名的段会被编译到同一块内存中
- 一般代码和数据是放在不同段内,一般有个代码段,一个数据段,一个栈段
格式:
段名 segment
ends 段名
TEST0 segmentmov cx, cx
TEST0 endsCODE segmentmov dx, dx
CODE endsCODE segmentmov bx, bx
CODE endsCODE segmentSTART:mov ax, ax
CODE endsend START
注释
汇编中使用分号( ; )来标注行注释,只有行注释,没有块注释
;这里是注释mov ax, bx ;这里是注释
常量
整数
1.整数可以支持多个进制
2.数值必须以数字开头,如果非数字,前面必须加0 (如 abcH 必须写成 0abcH)
3.负数前面可以加减号(-)
字符
- 字符可以用单引号(‘)或双引号(””)
mov byte ptr [bx], '$'
5. 变量
整形
1.整数可以支持多个类型
2.整数可以有多个初值,未初始化的值用问号(?)表示
3.变量一般定义在一个单独的段中
变量名 类型 初始值
val dd 5566h
字符串
1.字符串都可以用单引号(‘)或双引号(””),单引号和双引号作用一样
2.字符串一般以美元符$结尾
g_sz db "hello world$"; 16位汇编中以美元符结尾
数组
;这里是数据
data segment ;变量不允许重名 g_ary dw 12,13,14,15,16,17 ;长度等于你定义的个数g_ary1 dw 16 dup(55h) ;表示定义了一个长度16,初始值都是55的数组 g_ary2 dw 66h,4 dup(8888h),9999h,3 dup(7777h)g_bt db 12H ;一个字节g_w dw ? ;未初始化g_w1 dw 1213h ;双字g_w2 dw ? ;未初始化g_dd1 dd 1234h ;四个字节g_sz db "hello world $" ;汇编不会自动帮你加'\0'data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov al,g_bt ;将变量 g_bt 的值给almov ax,g_w1 ;将变量 g_w1 的值给bxmov g_w,1234h ;给未初数化变量 g_w 赋值mov g_w2,bx ;将bx的值,赋值给 g_w2code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
格式:
名字 类型 值1[,值2][,值2][,值2][,值2]
名字 类型 数量 dup (初值)[,数量 dup (初值)][,值]
示例
g_db db 78h, 96h, 43h;后面跟初始化的值
g_ary db 256 dup(0), 128 dup(11h);重复256个0,再跟重复128个1
dup中如果不想给初值,可以直接写 ?
赋值
g_ary dw 12 dup(0) ;给数组元素赋值
lea bx , g_ary ;获取 g_ary 的偏移地址,即第一个元素的地址
mov word ptr [bx + 2 * 2],10h ; word是数组元素类型 2*2 是 元素下标 * 元素大小 ; 计算元素偏移值 , 10H 是要赋值的值
取值
g_ary dw 12 dup(0) ;取出数组指定元素的值
lea bx , g_ary ;获取 g_ary 的偏移地址,即第一个元素的地址
mov ax,word ptr [bx + 2 * 2] ; word是数组元素类型 2 * 2 是 元素下标 * 元素大小 ; 计算元素偏移值
属性
masm提供了很多伪指令,可以获取变量的大小和地址,称之为变量的属性。
;这里是数据
data segment ;变量不允许重名 g_ary dw 12 dup(0) ; 如果 g_ary dw 888h,12 dup(0) 那么属性就是以g_ary dw 888h来算g_bt db 11hdata ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax, set g_bt ;把变量g_bt的段基址给 axmov ax, size g_bt ;将变量g_bt的大小给 axmov ax, type g_bt ;将变量g_bt的元素类型大小给 axmov ax, length g_bt ;将变量g_bt的元素个数给 axmov ax, size g_ary ;将变量g_ary的大小给 axmov ax, type g_ary ;将变量g_ary的元素类型大小给 axmov ax, length g_ary ;将变量g_ary的元素个数给 ax;给数组元素赋值lea bx , g_ary ;获取 g_ary 的偏移地址,即第一个元素的地址mov word ptr [bx + 2 * 2],10h ; word是数组元素类型 2*2 是 元素下标 * 元素大小 ; 计算元素偏移值 , 10H 是要赋值的值code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
堆栈
stack关键字让程序在被加载的时候指定ss、bp和sp 。
使用数组为栈设置大小
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_ary dw 12 dup(0)g_bt db 11hdata ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax, seg g_bt ;把变量g_bt的段基址给 axmov ax, size g_bt ;将变量g_bt的大小给 axmov ax, type g_bt ;将变量g_bt的元素类型大小给 axmov ax, length g_bt ;将变量g_bt的元素个数给 axmov ax, size g_ary ;将变量g_ary的大小给 axmov ax, type g_ary ;将变量g_ary的元素类型大小给 axmov ax, length g_ary ;将变量g_ary的元素个数给 axcode ends ;段结束end START ;代表从该标号第一行代码作为运行起点
6. 调用dos功能号
功能号
1.dos系统提供的功能(API),通过21号中断来调用
2.每个功能都有一个编号,通过AH指定功能号
3.每个功能的参数查看手册
📎指令字典2005II.zip
用的最多的是21号 中断
程序结束
使用方法: 将功能编号 给 al 在 调用 int 21
;mov ah,4CH ;程序结束;mov al,00 ;返回值 类似于 return 0 mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断
6输出一个字符串
DS:减一串地址
显示字符串
60
$'结束字符串
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" ;用于输出的字符串 0dh \r 0ah \n
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器lea dx,g_sz ;获取字符串 g_sz 的首地址;mov dx, offset g_sz ;获取字符串 g_sz 的段偏移值,即首地址跟上面效果一样mov ah,9 ; 将功能编号给ahint 21H ;调用21号中断;mov ah,4CH ;程序结束;mov al,00 ;返回值 类似于 return 0 mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
输入字符串
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db 32 dup(0) ;用于输入的字符串
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器lea dx,g_sz ;获取字符串 g_sz 的首地址;mov dx, offset g_sz ;获取字符串 g_sz 的段偏移值,即首地址跟上面效果一样mov byte ptr [bx],size g_sz ;把字符串大小给 byte ptr [bx]mov dx,bx ;把地址给 dx mov ah,0aH ; 将功能编号给ahint 21H ;调用21号中断;mov ah,4CH ;程序结束;mov al,00 ;返回值 类似于 return 0 mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
中断
1.中断是由cpu提供的流程跳转指令,类似函数调用
2.在00:00位置存储着一个双字数组,大小为256,称作中断向量表
3.数组元素为逻辑地址**段基址****:**段偏移
4.int n的意思是从第n个元素获取地址,然后跳转执行
总结
每一个文件 以 end 作结尾,每个文件至少有一个段,程序的入口点用标号 ,标号名放在end后面.多个文件只能有一个标号放在end后面,一个段里面可以定义变量,可以写代码,但是一般我们会把,代码,数据,栈分开,放在不同段里面
示例:
code segment ;段开始START: ;标号mov ax,ax mov ax,ax mov ax,ax code ends ;段结束end START ;代表从标号 START 的第一行代码作为运行起点
注意文件要放在挂在的文件中
编译
链接
调试
编译链接脚本
● 编译+调试 脚本ml/c %1.asmlink %1.objdebug %1.exe文件后缀要改成 .bat ,而且要跟文件同目录
串操作
• 串传送MOVS(move string)
• 串存储STOS(store string)
• 串读取LODS(load string)
• 串比较CMPS
• 串扫描SCAS(scan string)
串传送MOVS(move string)
把字节或字操作数从主存的源地址传送至目的地址
(1)MOVSB
作用:字节 串传送:ES:[DI]←DS:[SI] ( SI←SI±1,DI←DI±1 )
从 DS:[SI] 取一个字节 存到 ES:[DI]
(2)MOVSW
作用:字 串传送:ES:[DI]←DS:[SI](SI←SI±2,DI←DI±2)
从 DS:[SI] 取一个字 存到 ES:[DI]
(3)MOVSD
作用:双字串 传送:ES:[EDI]←DS:[ESI](SI←SI±4,DI←DI±4)
从 DS:[SI] 取一个双字 存到 ES:[DI]
举例:
memcpy
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器lea si,g_sz ;获取字符串 g_sz 的首地址lea di,g_sz1 ;获取字符串 g_sz1 的首地址mov ax,ds ;因为是从 ES:[DI]←DS:[SI],所以把 es 设成ds mov es,axmovsb ;从DS:[SI]拷贝一个字节数据到ES:[DI]movsb ;从DS:[SI]拷贝一个字节数据到ES:[DI]movsb ;从DS:[SI]拷贝一个字节数据到ES:[DI]movsbmovsbmovsb;mov ah,4CH ;程序结束;mov al,00 ;返回值 类似于 return 0 mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
串存储STOS(store string)
把AL或AX数据传送至目的地址
(1)STOSB
作用:字节串存储 ES:[DI]←AL DI←DI±1
把Al中的值给 ES:[DI]
(2)STOSW
作用:字串存储:ES:[DI]←AX DI←DI±2
把AX 中的值给 ES:[DI]
(3) STOSD
作用:双字串存储:ES:[EDI]←EAX DI←DI±4
把 EAX 中的值给 ES:[EDI]
举例:
memset
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax,ds mov es,axmov al,66hlea di,g_sz1 ;获取字符串 g_sz 的首地址stosb ;将 al (66H),依次赋值给 g_sz1 开始的 各个字节 stosb stosbstosb;mov ah,4CH ;程序结束;mov al,00 ;返回值 类似于 return 0 mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
串读取LODS(load string)
把指定主存单元的数据传送给AL或AX
(1)LODSB
作用:字节串读取 AL←DS:[SI](SI←SI±1)
从 DS:[SI] 读取一个字节 给 al
(2)LODSW
作用:字串读取 AX←DS:[SI] (SI←SI±2)
(3)LODSD
作用:双字串读取 EAX← DS:[ESI] (SI←SI±4)
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串g_sz2 db "hi$"
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax,ds mov es,axmov al,0lea si,g_sz ;获取字符串 g_sz 的首地址lodsblodsblodsbmov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束
end START ;代表从该标号第一行代码作为运行起点
串比较CMPS
将主存中的源操作数减去至目的操作数,以便设置标志,进而比较两操作数之间的关系
(1)CMPSB
作用:字节串比较:DS:[SI]-ES:[DI]( SI←SI±1,DI←DI±1 )
(2)CMPSW
作用:字串比较:DS:[SI]-ES:[DI](SI←SI±2,DI←DI±2)
(3)CMPSD
作用:双字串比较:DS:[ESI]-ES:[EDI] ( SI←SI±4,DI←DI±4 )
举例:
strstr
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串g_sz2 db "hi$"
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax,ds mov es,axlea si,g_sz ;获取字符串 g_sz 的首地址lea di,g_sz2 ;获取字符串 g_sz2 的首地址cmpsbcmpsbmov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束end START ;代表从该标号第一行代码作为运行起点
串扫描SCAS(scan string)
•作用:将AL/AX减去至目的操作数,以便设置标志,进而比较AL/AX与操作数之间的关系
一般用来找某个字符,确定字符串长度 ,例如 16asm 字符串以 "
结束那我们从字符串开始到找到"结束,那我们从字符串开始,到找到′'
Di 的 值 ,就是字符串长度, 或者判断字符串中是否有某个字符,或者字符串中某个字符的下标
(1)SCASB
作用:字节串扫描:AL-ES:[DI](DI←DI±1)
(2)SCASW
作用:字串扫描:AX-ES:[DI](DI←DI±2)
(3) SCASD
作用:字串扫描:EAX-ES:[EDI](DI←DI±4)
举例:strlen
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串g_sz2 db "hi$"
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax,ds mov es,axmov al,'l'lea di,g_sz ;获取字符串 g_sz 的首地址scasbscasbscasbscasbmov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束
end START ;代表从该标号第一行代码作为运行起点
重复前缀指令
只能用于串操作指令
串操作指令执行一次,仅对数据串中的一个字节或字进行操作。
串操作指令前,都可以加一个重复前缀,实现串操作的重复执行。重复次数隐含在CX寄存器中。
重复前缀分2类,3条指令:
配合不影响标志的 MOVS、STOS(和LODS)指令的 REP 前缀
配合影响标志的 CMPS 和 SCAS 指令的 REPZ 和 REPNZ 前缀
无条件重复前缀指令REP
每执行一次串指令,CX减1,直到CX=0,重复执行结束。
理解为:当数据串没有结束(CX≠0),则继续传送。
举例:
REP LODS/LODSB/LODSW/LODSD
REP STOS/STOSB/STOSW/STOSD
REP MOVS/MOVSB/MOVSW/MOVSD
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串g_sz2 db "hi$"
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax,ds mov es,axlea si,g_sz ;获取字符串 g_sz 的首地址lea di,g_sz1 ;获取字符串 g_sz1 的首地址mov cx, offset g_sz1 - offset g_sz ;计算字符串 g_sz 长度rep movsb ;将 字符串g_sz的内容 全部拷贝到 g_sz1 , cx等于 g_sz 长度mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束
end START ;代表从该标号第一行代码作为运行起点
条件重复前缀指令REPZ
每执行一次串指令,CX减1。
并判断ZF是否为0。
只要CX=0或ZF=0,重复执行结束。
•理解:当数据串没有结束(CX≠0),并且串相等(ZF=1),则继续比较。
•举例:
REPE/REPZ SCAS/SCASB/SCASW/SCASD
REPE/REPZ CMPS/CMPSB/CMPSW/CMPSD
作用: 比较2个字符串是否一样 ,如果CF 等于0 就代表一样
;栈段
stack segment stack ; segment 后面跟关键字 stack ,说明这是一个栈段db 256 dup(1)
stack ends;这里是数据
data segment ;变量不允许重名 g_sz db "hello world",0dh,0ah,"$" g_sz1 db 32 dup(0) ;用于输入的字符串g_sz2 db "hello$" g_sz3 db "hello world",0dh,0ah,"$"
data ends;这里是代码
code segment ;段开始START: ;标号assume ds:data ;指定data段 作为 ds 段mov ax,data ;先把data的偏移值给axmov ds,ax ;ax再把data的偏移值给ds;不直接给是因为没有立即数到段寄存器mov ax,ds mov es,axlea si,g_sz ;获取字符串 g_sz 的首地址lea di,g_sz2 ;获取字符串 g_sz2 的首地址mov cx, offset g_sz1 - offset g_sz ;计算字符串 g_sz 长度repz cmpsb ;ZF位是0 或者 CX = 0 结束 lea si,g_sz ;获取字符串 g_sz 的首地址lea di,g_sz3 ;获取字符串 g_sz2 的首地址mov cx, offset g_sz1 - offset g_sz ;计算字符串 g_sz 长度repz cmpsb ;ZF位是0 或者 CX = 0 结束 mov ax,4C00H ; 上面2条指令合成一条 int 21h ;使用21号中断code ends ;段结束
end START ;代表从该标号第一行代码作为运行起点
条件重复前缀指令REPNZ
每执行一次串指令,CX减1。
并判断ZF是否为1。
只要CX=0 或 ZF=1,重复执行结束。
•理解:当数据串没有结束(CX≠0),并且串不相等(ZF=0),则继续比较。
•举例:
REPNE/REPNZ SCAS/SCASB/SCASW/SCASD
REPNE/REPNZ CMPS/CMPSB/CMPSW/CMPSD