【转载】ARM64指令简易手册

本文转载自 tenloy - ARM64指令简易手册,仅为防丢


ARM处理器的指令集可以分为跳转指令、数据处理指令、程序状态寄存器(PSR)处理指令、加载/存储指令、协处理器指令和异常产生指令6大指令。

本文只列举一些常见的基本指令,可以正常阅读汇编代码即可。有几个注意点:

;寻址格式:
[x10, #0x10]      ; signed offset。 意思是从 x10 + 0x10的地址取值
[sp, #-16]!       ; pre-index。  意思是从 sp-16地址取值,取值完后在把 sp-16  writeback 回 sp
                  ; ! 表示寄存器写回,如果没有!,那么只会从 sp-16 地址读写值,而不会修改 sp 的值
[sp], #16         ; post-index。 意思是从 sp 地址取值,取值完后在把 sp+16 writeback 回 sp
; 举例:
ldr x0,  [x1]              ;`x1`指向的地址里面取出一个 64 位大小的数存入 `x0`
ldp x1,  x2, [x10, #0x10]  ; 从 x10 + 0x10 指向的地址里面取出 2个 64位的数,分别存入x1, x2
str x5,  [sp, #24]         ; 把x5的值(64位数值)存到 sp+24 指向的内存地址上
stp x29, x30, [sp, #-16]!  ; 把 x29, x30的值存到 sp-16的地址上,并且把 sp-=16. 
ldp x29, x30, [sp], #16    ; 从sp地址取出 16 byte数据,分别存入x29, x30. 然后 sp+=16;

本文中检索不到,全面的可以查看ARM官网文档。如果想看中文版的资料可以看《汇编器指南》— 第二章、第四章

一、跳转指令

跳转指令用于实现程序流程的跳转,在ARM程序中有以下两种方法可以实现程序流程的跳转:

ARM指令集中的跳转指令可以完成从当前指令向前或向后的32MB的地址空间的跳转,包括以下4条指令:

1. B指令

B指令是最简单的跳转指令。一旦遇到一个B指令,ARM处理器将立即跳转到给定的目标地址,从那里继续执行。

注意存储在跳转指令中的实际值是相对当前PC 值的一个偏移量,而不是一个绝对地址,它的值由汇编器来计算(参考寻址方式中的相对寻址)。它是24位有符号数,左移两位后有符号扩展为32 位,表示的有效偏移为26 位(前后32MB的地址空间)。

格式:

B{条件} 目标地址

示例:

B    Label      ; 程序无条件跳转到标号Label处执行
CMP  R1, #0     ; 当CPSR寄存器中的Z条件码置位时,程序跳转到标号Label处执行
BEQ  Label

补充:BNE与BEQ

TST  R0, #0X8
BNE  SuspendUp  ; BNE指令是“不相等(或不为0)跳转指令”: 
LDR  R1, #0x00000000

; 先进行and运算,如果R0的第四位不为1,则结果为零,则设置zero=1(继续下面的LDR指令);
; 否则,如果R0的第四位为1,zero=0(跳到SuspendUp处执行)。

tst 和 bne 连用:先是用tst进行位与运算,然后将位与的结果与0比较,如果不为0,则跳到bne紧跟着的标记(如bne sleep,则跳到sleep处)。 tst 和 beq 连用:先是用tst进行位与运算,然后将位与的结果与0比较,如果为0,则跳到beq紧跟着的标记(如bne AAAA,则跳到AAAA处)。

2. BL指令

BL是另一个跳转指令,但跳转之前,会在寄存器R14中保存PC的当前内容,因此,可以通过将R14的内容重新加载到PC中,来返回到跳转指令之后的那个 指令处执行。该指令是实现子程序调用的一个基本但常用的手段。

格式:

BL{条件} 目标地址

示例:

BL   Label      ; 当程序无条件跳转到标号Label处执行时,同时将当前的 PC值保存到R14(LR)中

3. BLX指令

BLX指令从ARM指令集跳转到指令中所指定的目标地址,并将处理器的工作状态有ARM状态切换到Thumb状态,该指令同时将PC的当前内容保存到寄存器R14中。因此,当子程序使用Thumb指令集,而调用者使用ARM指令集时,可以通过BLX指令实现子程序的调用和处理器工作状态的切换。同时,子程序的返回可以通过将寄存器R14值复制到PC中来完成。

格式:

BLX 目标地址

4. BX指令

BX指令跳转到指令中所指定的目标地址,目标地址处的指令既可以是ARM指令,也可以是Thumb指令。

格式:

BX{条件} 目标地址

二、数据处理指令

此类指令用于对通用寄存器执行运算。

数据处理指令可分为数据传送指令、比较指令和算术、逻辑运算指令等。

数据处理指令如下:

2.1 数据传送指令

1. MOV指令(传送)

MOV指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。

格式:

MOV{条件}{S} 目的寄存器,源操作数

示例:

MOV R1,R0          ; 将寄存器R0的值传送到寄存器R1
MOV PC,R14         ; 将寄存器R14的值传送到 PC,常用于子程序返回
MOV R1,R0,LSL#3   ; 将寄存器R0的值左移3位后传送到R1

2. MVN指令(取反移动)

MVN指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与MOV指令不同之处是在传送之前按位被取反了,即把一个被取反的值 传送到目的寄存器中。

格式:

MVN{条件}{S} 目的寄存器,源操作数

示例:

MVN R0,#0   ; 将 立即数0取反传送到寄存器R0中,完成后R0=-1

2.2 比较指令

1. CMP指令(比较)

CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,同时更新CPSR中条件标志位的值。

格式:

CMP{条件} 操作数1,操作数2

该指令进行一次减法运算,但不存储结果,只更改条件标志位。 标志位表示的是操作数1与操作数2的关系(大、小、相等),例如,当操作数1大于操作操作数2,则此后的有GT后缀的指令将可以执行。

示例:

CMP   R1,R0     ; 将寄存器R1的值与寄存器R0的值相减,并根据 结果设置CPSR的标志位
CMP   R1,#100   ; 将寄存器R1的值与立即数100相减,并根 据结果设置CPSR的标志位

2. CMN指令(负数比较)

CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较,同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相 加,并根据结果更改条件标志位。

格式:

CMN{条件} 操作数1,操作数2

示例:

CMN   R1,R0    ; 将寄存器R1的值与寄存器R0的值相加,并根据 结果设置CPSR 的标志位
CMN   R1,#100  ; 将寄存器R1的值与立即数100相加,并根据 结果设置CPSR的标志位

3. TST指令(位测试)

TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算,并根据运算结果更新CPSR中条件标志位的值。

格式:

TST{条件} 操作数1,操作数2

示例:

TST   R1,#%1       ; 用于测试在寄存器R1中是否设置了最低位(%表 示二进制数)
TST   R1,#0xffe    ; 将寄存器R1的值与立即数0xffe按位与,并根据 结果设置CPSR的标志位

4. TEQ指令(相等测试)

TEQ指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算,并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。

格式:

TEQ{条件} 操作数1,操作数2

示例:

TEQ  R1,R2   ; 将寄存器R1的值与寄存器R2的值按位异或,并根据结果 设置CPSR的标志位

2.3 算术运算指令

1. ADD指令(相加)

ADD指令用于把两个操作数相加,并将结果存放到目的寄存器中。

格式:

ADD{条件}{S} 目的寄存器,操作数1,操作数2

示例:

ADD     R0,R1,R2              ; R0 = R1 + R2
ADD     R0,R1,#256            ; R0 = R1 + 256
ADD     R0,R2,R3,LSL#1       ; R0 = R2 + (R3 << 1)

2. ADC指令(带进位相加)

ADC指令用于把两个操作数相加,再加上CPSR中的C条件标志位的值,并将结果存放到目的寄存器中。

格式:

ADC{条件}{S} 目的寄存器,操作数1,操作数2

示例:

以下指令序列完成两个128位数的加法,第一个数由高到低存放在寄存器R7~R4,第二个数由高到低存放在寄存器R11~R8,运算结果由高到低存放在寄 存器R3~R0:

ADDS    R0,R4,R8         ;  加低端的字
ADCS    R1,R5,R9         ;  加第二个字,带进位
ADCS    R2,R6,R10        ;  加第三个字,带进位
ADC     R3,R7,R11        ;  加第四个字,带进位

3. SUB指令(相减)

SUB指令用于把操作数1减去操作数2,并将结果存放到目的寄存器中。

格式:

SUB{条件}{S} 目的寄存器,操作数1,操作数2

该指令可用于有符号数或无符号数的减法运算。

示例:

SUB     R0,R1,R2             ;  R0 = R1 - R2
SUB     R0,R1,#256           ;  R0 = R1 - 256
SUB     R0,R2,R3,LSL#1      ;  R0 = R2 - (R3 << 1)

4. SBC指令(带进位减法)

SBC指令用于把操作数1减去操作数2,再减去CPSR中的C条件标志位的反码,并将结果存放到目的寄存器中。

格式:

SBC{条件}{S} 目的寄存器,操作数1,操作数2

该指令使用进位标志来表示借位,这样就可以做大于32位的减法,注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或无符号数的减法运算。

示例:

SUBS    R0,R1,R2    ; R0 = R1 - R2 - !C,并根据结果设置CPSR的进位标志位

5. RSB指令(逆向/反向减法)

RSB指令称为逆向减法指令,用于把操作数2减去操作数1,并将结果存放到目的寄存器中。

格式:

RSB{条件}{S} 目的寄存器,操作数1,操作数2

该指令可用于有符号数或无符号数的减法运算。

示例:

RSB     R0,R1,R2                  ;  R0 = R2 – R1
RSB     R0,R1,#256                ;  R0 = 256 – R1
RSB     R0,R2,R3,LSL#1           ;  R0 = (R3 << 1) - R2

6. RSC指令(反向带进位减)

RSC指令用于把 操作数2减去操作数1,再减去CPSR中的C条件标志位的反码,并将结果存放到目的寄存器中。

格式:

RSC{条件}{S} 目的寄存器,操作数1,操作数2

该指令使用进位标志来表示借位,这样就可以做大于32位的减法,注意不要忘记设置S后缀来更改进位标志。该指令可用于有符号数或 无符号数的减法运算。

示例:

RSC     R0,R1,R2           ; R0 = R2 – R1 - !C

—乘法指令与乘加指令—

1. MUL指令(相乘)

MUL指令完成将操作数1与操作数2的乘法运算,并把结果放置到目的寄存器中,同时可以根据运算结果设置CPSR中相应的条件标志位。

格式:

MUL{条件}{S} 目的寄存器,操作数1,操作数2

示例:

MUL  R0,R1,R2            ; R0 = R1 × R2
MULS R0,R1,R2            ; R0 = R1 × R2,同时设置CPSR中的相关条件标志位

2. MLA指令(带累加的相乘)

MLA指令完成将操作数1与操作数2的乘法运算,再将乘积加上操作数3,并把结果放置到目的寄存器中,同时可以根据运算结果设置CPSR中相应的条件标志位。

格式:

MLA{条件}{S} 目的寄存器,操作数1,操作数2,操作数3

示例:

MLA   R0,R1,R2,R3            ; R0 = R1 × R2 + R3
MLAS  R0,R1,R2,R3            ; R0 = R1 × R2 + R3,同时设置CPSR中的相关条件标志位

3. SMULL指令

SMULL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位放置到目的寄存器Low中,结果的高32位放置到目的寄存器High中,同时可以 根据运算结果设置CPSR中相应的条件标志位。

格式:

SMULL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

示例:

SMULL   R0,R1,R2,R3     ; R0 = (R2 × R3)的低32位
                          ; R1 = (R2 × R3)的高32位

4. SMLAL指令

格式:

SMLAL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

SMLAL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中,结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中,同时可以根据运算结果设置CPSR中相应的条件标志位。

示例:

SMLAL   R0,R1,R2,R3       ; R0 = (R2 × R3)的低32位 + R0
                            ; R1 = (R2 × R3)的高32位 + R1

5. UMULL指令

UMULL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位放置到目的寄存器Low中,结果的高32位放置到目的寄存器High中,同时可以 根据运算结果设置CPSR中相应的条件标志位。

格式:

UMULL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

示例:

UMULL   R0,R1,R2,R3       ; R0 = (R2 × R3)的低32位
                            ; R1 = (R2 × R3)的高32位

6. UMLAL指令

格式:

UMLAL{条件}{S}   目的寄存器Low,目的寄存器High,操作数1,操作数2

UMLAL指令完成将操作数1与操作数2的乘法运算,并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中,结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High 中,同时可以根据运算结果设置CPSR中相应的条件标志位。

示例:

UMLAL   R0,R1,R2,R3            ; R0 = (R2 × R3)的低32位 + R0
                                 ; R1 = (R2 × R3)的高32位 + R1

2.4 逻辑运算指令

1. AND指令(逻辑位 与)

AND指令用于在两个操作数上进行逻辑与运算,并把结果放置到目的寄存器中。

格式:

AND{条件}{S} 目的寄存器,操作数1,操作数2

该指令常用于屏蔽操作数1的某些位。

示例:

AND     R0, R0, #3          ; 该指令保持R0的0、1位,其余位清零。

2. ORR指令(逻辑位 或)

ORR指令用于在两个操作数上进行逻辑或运算,并把结果放置到目的寄存器中。

格式:

ORR{条件}{S} 目的寄存器,操作数1,操作数2

该指令常用于设置操作数1的某些位。

示例:

ORR R0,R0,#3        ; 该指令设置R0的0、1位,其余位保持不变。

3. EOR指令(逻辑位 异或)

EOR指令用于在两个操作数上进行逻辑异或运算,并把结果放置到目的寄存器中。

格式:

EOR{条件}{S} 目的寄存器,操作数1,操作数2

该指令常用于反转操作数1的某些位。

示例:

EOR R0,R0,#3        ; 该指令反转R0的0、1位,其余位保持不变。

4. BIC指令(位清零)

BIC指令用于清除操作数1的某些位,并把结果放置到目的寄存器中。

格式:

BIC{条件}{S} 目的寄存器,操作数1,操作数2

示例:

BIC R0, R0, #%1011    ; 该指令清除R0中的位 0、1、和 3,其余的位保持不变。

5. LSL ASL(LSL逻辑左移、ASL算术左移)

LSL(或ASL)可完成对通用寄存器中的内容进行逻辑(或算术)的左移操作,按操作数所指定的数量向左移位,低位用零来填充。

格式:

通用寄存器,LSL(或ASL) 操作数

示例:

MOV   R0, R1, LSL #2          ; 将R1中的内容左移两位后传送到R0 中。

6. LSR(逻辑右移)

LSR可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用零来填充。

格式:

通用寄存器,LSR 操作数

示例:

MOV   R0, R1, LSR #2         ; 将R1中的内容右移两位后传送到R0 中,左端用零来填充。

7. ASR(算术右移)

ASR可完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用第31位的值来填充。

格式:

通用寄存器,ASR 操作数

示例:

MOV    R0, R1, ASR #2        ; 将R1中的内容右移两位后传送到R0 中,左端用第31位的值来填充。

8. ROR(向右循环移)

ROR可完成对通用寄存器中的内容进行循环右移的操作,按操作数所指定的数量向右循环移位,左端用右端移出的位来填充。

格式:

通用寄存器,ROR 操作数

示例:

MOV    R0, R1, ROR #2       ; 将R1中的内容循环右移两位后传送到R0 中。

9. RRX(带扩展向右循环移)

RRX可完成对通用寄存器中的内容进行带扩展的循环右移的操作,按操作数所指定的数量向右循环移位,左端用进位标志位C来填充。

格式:

通用寄存器,RRX 操作数

示例:

MOV   R0, R1, RRX #2         ; 将R1中的内容进行带扩展的循环右移两位 后传送到R0中。

三、程序状态寄存器访问指令

此类指令向通用寄存器或者从通用寄存器往外移动状态寄存器的内容。

1. MRS指令(从PSR移动到寄存器)

MRS指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下两种情况:

格式:

MRS{条件}  通用寄存器 程序状态寄存器(CPSR或SPSR)

示例:

MRS R0,CPSR      ; 传送CPSR的内容到R0
MRS R0,SPSR      ; 传送 SPSR的内容到R0

2. MSR指令(从寄存器移动到PSR)

MSR指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中,操作数可以为通用寄存器或立即数。

格式:

MSR{条件}    程序状态寄存器(CPSR或SPSR)<域>,操作数

<域>用于设置程序状态寄存器中需要 操作的位,32位的程序状态寄存器可分为4个域:

该指令通常用于恢复或改变程序状态寄存器的内容,在使用时,一般要在MSR指令中指明将要操作的域。

示例:

MSR CPSR,R0        ; 传送R0的内容到CPSR
MSR SPSR,R0        ; 传送R0的内容到SPSR
MSR CPSR_c,R0      ; 传送R0的内容到SPSR,但仅仅修改CPSR中的控制位域

四、加载/存储指令

ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据:

数据在存储器中,都是二进制码,计算机单凭数据本身是无法区分数据格式(有符号、无符号、多少位是一个数据),甚至无法区分数据和代码的区别。这个取决于我们使用的汇编指令(计算机进行某些功能处理时候存在两套指令,分别为有符号和无符号数准备,汇编器会根据我们的源代码语义进行选择使用)。

此类指令用于从内存加载(load)单个寄存器的值,或者在内存中存储(store)单个寄存器的值。 它们可加载或存储 32 位字、16 位半字或 8 位有符号或无符号字节。 可以用符号或零扩展字节和半字加载以填充 32 位寄存器。

ldr = Load Word
ldrh = Load unsigned Half Word
ldrsh = Load signed Half Word
ldrb = Load unsigned Byte
ldrsb = Load signed Bytes

str = Store Word
strh = Store unsigned Half Word
strsh = Store signed Half Word
strb = Store unsigned Byte
strsb = Store signed Byte

上面的指令功能实现,需要依赖状态寄存器(CPSR, current program status register)。CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义。而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息。 也叫标记寄存器

图1 图2

此外,还有多个寄存器加载和存储指令,此类指令可从内存加载通用寄存器的任何子集,或者在内存中存储这样的子集。

常用的加载存储指令如下:

1. LDR指令

LDR指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器,然后对数据进行处理。

格式:

LDR{条件} 目的寄存器,<存储器地址>

该指令在程序设计中比较常用,且寻址方式灵活多样,请读者认真掌握。

示例:

LDR R0,[R1]             ; 将存储器地址为R1的字数据读入寄存器R0。
LDR R0,[R1,R2]         ; 将存储器地址为R1+R2的字数据读入寄存器R0。
LDR R0,[R1,#8]         ; 将存储器地址为R1+8的字数据读入寄存器R0。
LDR R0,[R1,R2] !       ; 将存储器地址为R1+R2的字数据读入寄存器R0,并将新地址R1+R2写入R1。
LDR R0,[R1,#8] !      ; 将存储器地址为R1+8的字数据读入寄存器R0,并将新地址 R1+8写入R1。
LDR R0,[R1],R2          ; 将存储器地址为R1的字数据读入寄存器R0,并将新地址 R1+R2写入R1。
LDR R0,[R1,R2,LSL#2]! ; 将存储器地址为R1+R2×4的字数据读入寄存器R0,并将新地址R1+R2×4写入R1。
LDR R0,[R1],R2,LSL#2   ; 将存储器地址为R1的字数据读入 寄存器R0,并将新地址R1+R2×4写入R1。

2. LDRB指令

LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中,同时将寄存器的高24位清零。 该指令通常用于从存储器中读取8位的字节数据到通用寄存器,然后对数据进行处理。

格式:

LDR{条件}B 目的寄存器,<存储器地址>

示例:

LDRB R0,[R1]           ; 将存储器地址为R1的字节数据读入寄存器R0,并将R0的高24位清零。
LDRB R0,[R1,#8]       ; 将存储器地址为R1+8的字节数据读入寄存器R0,并将R0的高24位清零。

3. LDRH指令

LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中,同时将寄存器的高16位清零。 该指令通常用于从存储器中读取16位的半字数据到通用寄存器,然后对数据进行处理。

格式:

LDR{条件}H 目的寄存器,<存储器地址>

示例:

LDRH   R0,[R1]         ; 将存储器地址为R1的半字数据读入寄存器 R0,并将R0的高16位清零。
LDRH   R0,[R1,#8]     ; 将存储器地址为R1+8的半字数据读入寄存器R0,并将R0 的高16位清零。
LDRH   R0,[R1,R2]     ; 将存储器地址为R1+R2的半字数据读入寄存器R0,并将 R0的高16位清零。

4. STR指令

STR指令用于从源寄存器中将一个32位的字数据传送到存储器中。 该指令在程序设计中比较常用,且寻址方式灵活多样,使用方式可参考指令LDR。

格式:

STR{条件} 源寄存器,<存储器地址>

示例:

STR R0,[R1],#8           ; 将R0中的字数据写入以R1为地址的存储器中,并将新地址R1+8写入R1。
STR R0,[R1,#8]           ; 将R0中的字数据写入以R1+8为地址的存储器中。

5. STRB指令

STRB指令用于从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。

格式:

STR{条件}B 源寄存器,<存储器地址>

示例:

STRB    R0,[R1]             ; 将寄存器R0中的字节数据写入以R1为地 址的存储器中。
STRB    R0,[R1,#8]         ; 将寄存器R0中的字节数据写入以R1+8为地址的存 储器中。

6. STRH指令

STRH指令用于从源寄存器中将一个16位的半字数据传送到存储器中。该半字数据为源寄存器中的低16位。

格式:

STR{条件}H 源寄存器,<存储器地址>

示例:

STRH   R0,[R1]            ; 将寄存器R0中的半字数据写入以R1为地址的 存储器中。
STRH   R0,[R1,#8]        ; 将寄存器R0中的半字数据写入以R1+8 为地址的存储器中。

7. ADR指令

将一个立即值与 pc 值相加,并将结果写入目标寄存器

格式:

ADR{cond}{.W}  Rd,label

8. ADRP指令

以页为单位的大范围的地址读取指令,这里的P就是page的意思。取得page的基地址存入寄存器

格式:

ADRP{cond}  Rd  label

示例:

adrp    x2, .LANCHOR0   ; .LANCHOR0是个<lable>——一个大小为4KB的页的基址,指令的作用就是将该页的基址存到寄存器x2中

; 示例2:
adrp    x0, l_.str@PAGE         ; 将符号l.str所在的page基址读入x0
add     x0, x0, l_.str@PAGEOFF  ; x0 = x0 + l.str所在page中的偏移量

—批量数据加载/存储指令—

ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据,批量加载指令 用于将一片连续的存储器中的数据传送到多个寄存器,批量数据存储指令则完成相反的操作。

常用的加载存储指令如下:

1. LDM(STM)指令(加载、存储多个寄存器)

LDM(或STM)指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据,该指令的常见用途是将多个寄存器的内容入栈或出栈。

格式:

LDM(或STM){条件}{类型} 基址寄存器{},寄存器列表{}

其中:

示例:

STMFD R13!,{R0,R4-R12,LR}        ; 将寄存器列表中的寄存器(R0,R4到R12,LR)存入堆栈。
LDMFD R13!, {R0,R4-R12,PC}       ; 将堆栈内容恢复到寄存器(R0,R4到R12,LR)。

—数据交换指令—

在寄存器和内存之间交换数据

1. SWP指令

格式:

SWP{条件} 目的寄存器,源寄存器1,[源寄存器2]

SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中,同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中。显然,当源寄存器1和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。

示例:

SWP   R0,R1,[R2]     ; 将R2所指向的存储器中的字数据传送到R0,同时将R1 中的字数据传送到R2所指向的存储单元。
SWP   R0,R0,[R1]     ; 该指令完成将R1所指向的存储器中的字数 据与R0中的数据交换。

SWP{B}:B是一个可选的后缀。如果存在 B,则交换一个字节。否则,交换一个32位字。

2. SWPB指令

格式:

SWP{条件}B 目的寄存器,源寄存器1,[源寄存器2]

SWPB指令用于将源寄存器2所指向的存储器中的字节数据传送到目的寄存器中,目的寄存器的高24清零,同时将源寄存器1中的字节数据传送到源寄存器2所指向的存储器中。

显然,当源寄存器1和目的寄存器为同一个寄存器时,指令交换该寄存器和存储器的内容。

示例:

SWPB   R0,R1,[R2]       ; 将R2所指向的存储器中的字节数据传送到 R0,R0的高24位清零,同时将R1中的低8位数据传送到R2所指向的存储单元。
SWPB   R0,R0,[R1]       ; 该指令完成将R1所指向的存储器中的 字节数据与R0中的低8位数据交换。

五、协处理器指令

此类指令支持一种用于扩展 ARM 体系结构的通用方式。

ARM 微处理器可支持多达 16 个协处理器,用于各种协处理操作,在程序执行的过程中,每个协处理器只执行针对自身的协处理指令,忽略 ARM 处理器和其他协处理器的指令。

ARM 的协处理器指令主要用于 ARM 处理器初始化 ARM 协处理器的数据处理操作,以及在ARM 处理器的寄存器和协处理器的寄存器之间传送数据,和在 ARM 协处理器的寄存器和存储器之间传送数据。

1. CDP指令

CDP指令用于ARM处理器通知ARM协处理器执行特定的操作,若协处理器不能成功完成特定的操作,则产生未定义指令异常。

格式:

CDP{条件} 协处理器编码,协处理器操作码1,目的寄存器,源寄存器1,源寄存器2,协处理器操作码2。

其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作,目的寄存器和源寄存器均为协处理器的寄存器,指令不涉及ARM处理器的寄存器和存储器。

示例:

CDP   P3,2,C12,C10,C3,4  ; 该指令完成协处理器P3的初始化 

2. LDC指令

LDC指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。

格式:

LDC{条件}{L} 协处理器编码,目的寄存器,[源寄存器]

其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。

示例:

LDC   P3,C4,[R0]        ; 将ARM处理器的寄存器R0所指向的存储器中的字数 据传送到协处理器P3的寄存器C4中。 

3. STC指令

STC指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中,若协处理器不能成功完成传送操作,则产生未定义指令异常。

格式:

STC{条件}{L} 协处理器编码,源寄存器,[目的寄存器]

其中,{L}选项表示指 令为长读取操作,如用于双精度数据的传输。

示例:

STC   P3,C4,[R0]     ; 将协处理器P3的寄存器C4中的字数据传送到ARM处理 器的寄存器R0所指向的存储器中。 

4. MCR指令

MCR指令用于将ARM处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。

格式:

MCR{条件} 协处理器编码,协处理器操作码1,源寄存器,目的寄存器1,目的寄存器2,协处理器操作码2。

其中协处理器操作码1和协处理 器操作码2为协处理器将要执行的操作,源寄存器为ARM处理器的寄存器,目的寄存器1和目的寄存器2均为协处理器的寄 存器。

示例:

MCR   P3,3,R0,C4,C5,6     ; 将ARM处理器寄存器R0中的数据传送到协处 理器P3的寄存器C4和C5中。 

5. MRC指令

MRC指令用于将协处理器寄存器中的数据传送到ARM处理器寄存器中,若协处理器不能成功完成操作,则产生未定义指令异常。

格式:

MRC{条件} 协处理器编码,协处理器操作码1,目的寄存器,源寄存器1,源寄存器2,协处理器操作码2。

其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作,目的寄存器为ARM处理器的寄存器,源寄存器1和源寄存器2均为协处理器的寄存器。

示例:

MRC   P3,3,R0,C4,C5,6     ; 该指令将协处理器P3的寄存器中的数据传送到 ARM处理器寄存器中。

六、异常产生指令

ARM指令集中提供了两条产生异常的指令,通过这两条指令可以用软件的方法实现异常。

1. SWI指令

SWI指令用于产生软件中断,以便用户程序能调用操作系统的系统例程。操作系统在SWI的异常处理程序中提供相应的系统服务。

格式:

SWI{条件} 24位的立即数

指令中24位的立即数指定用户程序调用系统例程的类型,相关参数通过通用寄存器传递,当指令中24位的立即数被忽略时,用户程序调用系统例程的类型由通用寄存器R0的内容决定,同时,参数通过其他通用寄存器传递。

示例:

SWI   0x02     ; 该指令调用操作系统编号位02的系统例程。

2. BKPT指令

BKPT指令产生软件断点中断,可用于程序的调试。

格式:

BKPT   16位的立即数

ARM汇编伪指令

在ARM汇编语言程序里,有一些特殊指令助记符,这些助记符与指令系统的助记符不同,没有相对应的操作码,通常称这些特殊指令助记符为伪指令,他们所完成的操作称为伪操作。

伪指令在源程序中的作用是为完成汇编程序作各种准备工作的,这些伪指令仅在汇编过程中起作用,一旦汇编结束,伪指令的使命就完成。

在ARM 的汇编程序中,有如下几种伪指令:符号定义伪指令、数据定义伪指令、汇编控制伪指令(包括宏指令)、以及其他伪指令。

一、符号定义(Symbol Definition)伪指令

符号定义伪指令用于定义ARM 汇编程序中的变量、对变量赋值以及定义寄存器的别名等操作。 常见的符号定义伪指令有如下几种:

1. GBLA、GBLL 和GBLS

GBLA 、GBLL 和GBLS 伪指令用于定义一个ARM 程序中的全局变量,并将其初始化。其中:

由于以上三条伪指令用于定义全局变量,因此在整个程序范围内变量名必须唯一。

格式:

GBLA(GBLL或GBLS)全局变量名

示例:

GBLA Test1            ; 定义一个全局的数字变量,变量名为 Test1。    
Test1 SETA 0xaa       ; 将该变量赋值为0xaa。

GBLL Test2            ; 定义一个全局的逻辑变量,变量名为 Test2。    
Test2 SETL {TRUE}     ; 将该变量赋值为真。    

GBLS Test3            ; 定义一个全局的字符串变量,变量名为 Test3。    
Test3 SETS “Testing”  ; 将该变量赋值为"Testing”。  

2. LCLA、LCLL 和LCLS

LCLA 、LCLL 和LCLS 伪指令用于定义一个ARM 程序中的局部变量,并将其初始化。其中:

以上三条伪指令用于声明局部变量,在其作用范围内变量名必须唯一。

格式:

LCLA(LCLL或LCLS) 局部变量名

示例:

LCLA Test4             ; 声明一个局部的数字变 量,变量名为Test4。  
Test3 SETA 0xaa        ; 将该变量赋值为0xaa。 

LCLL Test5             ; 声明一个局部的逻辑变 量,变量名为Test5。    
Test4 SETL {TRUE}      ; 将该变量赋值为真。    

LCLS Test6             ; 定义一个局部的字 符串变量,变量名为Test6。    
Test6 SETS “Testing”   ; 将该变量赋值为 "Testing”。   

3. SETA、SETL 和SETS

伪指令 SETA 、SETL 、SETS 用于给一个已经定义的全局变量或局部变量赋值。

其中,变量名为已经定义过的全局变量或局部变量,表达式为将要赋给变量的值。

格式:

变量名 SETA(SETL或SETS) 表达式

示例:

LCLA Test3              ; 声明一个局部的数字变量,变量名为 Test3。
Test3 SETA 0xaa         ; 将该变量赋值为0xaa。
LCLL Test4              ; 声明一个局部的逻辑变量,变量名为 Test4。
Test4 SETL {TRUE}       ; 将该变量赋值为真。

4. RLIST

RLIST伪指令可用于对一个通用寄存器列表定义名称,使用该伪指令定义的名称可在ARM 指令 LDM/STM中使用。

在LDM/STM指令中,列表中的寄存器访问次序为根据寄存器的编号由低到高,而与列表中的寄存器排列次序无关。

格式:

名称 RLIST { 寄存器列表 }

示例:

RegList RLIST {R0-R5 ,R8 ,R10}  ; 将寄存器列表名称定义为 RegList ,可在ARM指令LDM/STM中通过该名称访问寄存器列表。

二、数据定义(Data Definition)伪指令

数据定义伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。 常见的数据定义伪指令有如下几种:

1. DCB

DCB伪指令用于分配一片连续的字节存储单元并用伪指令中指定的表达式初始化。

格式:

标号 DCB 表达式

示例:

Str DCB “This is a test; 分配一片连续的字节存储单元并初始化。 

2. DCW(或DCWU)

DCW(或DCWU)伪指令用于分配一片连续的半字存储单元并用伪指令中指定的表达式初始化。

格式:

标号 DCW (或DCWU) 表达式

用DCW分配的字存储单元是半字对齐的,而用DCWU分配的字存储单元并不严格半字对齐。

示例:

DataTest DCW 1 ,2 ,3 ; 分配一片连续的半字存储单元并初始化。

3. DCD(或DCDU)

DCD(或DCDU)伪指令用于分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

格式:

标号 DCD(或DCDU) 表达式

用DCD分配的字存储单元是字对齐的,而用DCDU分配的字存储单元并不严格字对齐。

示例:

DataTest DCD 4 , 5 , 6 ; 分配一片连续的字存储单元并初始化。 

4. DCFD(或DCFDU)

DCFD(或DCFDU)伪指令用于为双精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个双精度的浮点数占据两个字单元。

用 DCFD分配的字存储单元是字对齐的,而用DCFDU分配的字存储单元并不严格字对齐。

格式:

标号 DCFD(或DCFDU) 表达式

示例:

FDataTest DCFD 2E115 , -5E7 ; 分配一片连续的字存储单元并初始化 为指定的双精度数。

5. DCFS(或DCFSU)

DCFS(或DCFSU)伪指令用于为单精度的浮点数分配一片连续的字存储单元并用伪指令中指定的表达式初始化。

每个单精度的浮点数占据一个字单元。

用 DCFS分配的字存储单元是字对齐的,而用DCFSU分配的字存储单元并不严格字对齐。

格式:

标号 DCFS(或DCFSU) 表达式

示例:

FDataTest DCFS 2E5 ,-5E -7 ; 分配一片连续的字存储单元并初始化为 指定的单精度数。

6. DCQ(或DCQU)

DCQ(或DCQU)伪指令用于分配一片以8个字节(双字)为单位的连续存储区域并用伪指令中指定的表达式初始化。

用DCQ分配的存储单元是字对齐的,而用DCQU 分配的存储单元并不严格字对齐。

格式:

标号 DCQ(或DCQU) 表达式

示例:

DataTest DCQ 100   ; 分配一片连续的存储单元并初始化为指定的值。 

7. SPACE

SPACE伪指令用于分配一片连续的存储区域并初始化为0。

格式:

标号 SPACE 表达式

示例:

DataSpace SPACE 100 ; 分配连续100字节的存储单元并初始化为0 。

8. MAP

MAP伪指令用于定义一个结构化的内存表的首地址。

格式:

MAP 表达式 { ,基址寄存器 }

MAP伪指令通常与FIELD伪指令配合使用来定义结构化的内存表。

示例:

MAP 0x100 , R0  ; 定义结构化内存表首地址的值为0x100+R0 。 

9. FILED

FIELD伪指令用于定义一个结构化内存表中的数据域。

格式:

标号 FIELD 表达式

FIELD伪指令常与MAP伪指令配合使用来定义结构化的内存表。MAP伪指令定义内存表的首地址,FIELD伪指令定义内存表中的各个数据域,并可以为 每个数据域指定一个标号供其他的指令引用。

注意MAP和FIELD伪指令仅用于定义数据结构,并不实际分配存储单元。

示例:

MAP 0x100    ; 定义结构化内存表首地址的值为0x100。
A FIELD 16   ; 定义A的长度为16字节,位置为0x100。
B FIELD 32   ; 定义B的长度为32字节,位置为0x110。
S FIELD 256  ; 定义S的长度为256字节,位置为0x130。   

三、汇编控制(Assembly Control)伪指令

汇编控制伪指令用于控制汇编程序的执行流程,常用的汇编控制伪指令包括以下几条:

1. IF、ELSE、ENDIF

IF 、ELSE 、ENDIF伪指令能根据条件的成立与否决定是否执行某个指令序列。

格式:

IF 逻辑表达式
指令序列 1
ELSE
指令序列 2
ENDIF

IF 、ELSE 、ENDIF伪指令可以嵌套使用。

示例:

GBLL Test ; 声明一个全局的逻辑变量,变量名为Test   
IF Test = TRUE
指令序列 1
ELSE
指令序列 2
ENDIF

2. WHILE、WEND

WHILE 、WEND伪指令能根据条件的成立与否决定是否循环执行某个指令序列。

格式:

WHILE 逻辑表达式
指令序列
WEND

当WHILE后面的逻辑表达式为真,则执行指令序列,该指令序列执行完毕后,再判断逻辑表达式的值,若为真则继续执行,一直到逻辑表达式的值为假。

WHILE 、WEND伪指令可以嵌套使用。

示例:

GBLA Counter   ; 声明一个全局的数学变量,变量名为Counter
Counter SETA 3 ; 由变量Counter 控制循环次数
……
WHILE Counter < 10
指令序列
WEND

3. MACRO、MEND

MACRO 、MEND伪指令可以将一段代码定义为一个整体,称为宏指令,然后就可以在程序中通过宏指令多次调用该段代码。

格式:

MACRO  ; 标识宏定义的开始.  
       ; 包含在MACRO和MEND之间的指令序列称为宏定义体
       ; 在一个符号前使用$表示程序被汇编时将使用相应的值来替代$后的符号
[$标(label)] 宏名 {$参数1, $参数2, ...}  ; 在宏定义体的第一行应声明宏的原型(包含宏名、所需的参数)
       ; [$标号] 在宏指令被展开时,被替换为用户定义的符号。
         ; $label是一个可选参数。
         ; 当宏定义体中用到多个标号时,可以使用类似$label.$internallabel的标号命名规则使程序易读。
       ; $参数为宏指令的参数。当宏指令被展开时将被替换成相应的值,类似于函数中的形式参数,可以在宏定义时为参数指定相应的默认值。
; ...
指令序列
; ...
MEND   ; 标识宏定义的开始

; 定义后,就可以在汇编程序中通过宏名来 调用该指令序列。宏指令可以使用一个或多个参数,当宏指令被展开时,这些参数被相应的值替换。
; 在源程序被编译时,汇编器将宏调用展开。用宏定义中的指令序列代替程序中的宏调用

[$label] 到底有什么作用?

当宏定义体内部跳转时,这个参数会起到至关重要的作用。要想在宏内部跳转,就必须在宏定义体内部有程序标号如(LOOP),如果不使用参数($label),当在一个程序段内调用两次宏的时候,编译器就会出现错误,因为当汇编时产生了两个相同名字的程序标号。

; 宏的定义体:
MACRO
$PM DELAY $CanShu
$PM  
          LDR    R7,=$CanShu   ;
          ;LDR  R7,[R7] ;此时参数是一个立即数 如果是变量的话 是会用到这一句
$PM.LOOP 
          SUBS R7,R7,#0X01
          BNE  $PM.LOOP
MEND


; 在程序段中的使用:(使用两次)
...
AA    DELAY 0X000005F0  ; 0x00000FF0是一个参数 在此处是一个立即数,用户可自行使用为变量等
...
BB    DELAY 0X00000FF0
...

; 此时调用多次,编译器就不会出现问题,例子中的AA和BB仅仅是一个标号,用户可以自行书写,因为在宏指令被展开时,这个符号在汇编时将使用相应的值替代

宏指令的使用方式和功能与子程序有些相似,子程序可以提供模块化的程序设计、节省存储空间并提高运行速度。但在使用子程序结构时需要保护现场,从而增加了 系统的开销,因此,在代码较短且需要传递的参数较多时,可以使用宏指令代替子程序。

MACRO、MEND伪指令可以嵌套使用。

4. MEXIT

MEXIT用于从宏定义中跳转出去。

格式:

MEXIT

四、其他常用的伪指令

还有一些其他的伪指令,在汇编程序中经常会被使用,包括以下几条:

1. AREA

AREA伪指令用于定义一个代码段或数据段。

格式:

AREA 段名 属性1 ,属性2 ,……

一个汇编语言程序至少要包含一个段,当程序太长时,也可以将程序分为多个代码段和数据段。

示例:

AREA Init ,CODE ,READONLY   ; 该伪指令定义了一个代码段,段 名为Init ,属性为只读。

2. ALIGN

ALIGN伪指令可通过添加填充字节的方式,使当前位置满足一定的对齐方式。

格式:

ALIGN { 表达式 { ,偏移量 }}

示例:

AREA Init ,CODE ,READONLY ,ALIEN=3  ; 指定后面的指令为8字节对齐。
指令序列
END

3. CODE16、CODE32

若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令,CODE32伪指令 通知编译器其后的指令序列为32位的ARM指令。

因此,在使用ARM指令和Thumb指令混合编程的代码里,可用这两条伪指令进行切换,但注意他们只通知 编译器其后指令的类型,并不能对处理器进行状态的切换。

格式:

CODE16(或CODE32)

示例:

AREA Init ,CODE ,READONLY   ……
CODE32 ; 通知编译器其后的指令为32位的 ARM指令
LDR R0 ,=NEXT+1 ; 将跳转地址放入寄存器R0
BX R0 ;  程序跳转到新的位置执行, 并将处理器切换到Thumb工作状态
……
CODE16 ;  通知编译器其后的指令为16位的 Thumb指令
NEXT LDR R3,=0x3FF
……   
END ; 

4. ENTRY

ENTRY伪指令用于指定汇编程序的入口点。在一个完整的汇编程序中至少要有一个ENTRY(也可以有多个,当有多个ENTRY时,程序的真正入口点由链 接器指定),但在一个源文件里最多只能有一个ENTRY(可以没有)。

格式:

ENTRY

示例:

AREA Init ,CODE ,READONLY
ENTRY ;  指定应用程序的入口点
……

5. END

END伪指令用于通知编译器已经到了源程序的结尾。

格式:

END

示例:

AREA Init ,CODE ,READONLY
……  
END ; 指定应用程序的结尾

6. EQU

EQU伪指令用于为程序中的常量、标号等定义一个等效的字符名称,类似于C语言中的#define 。

格式:

名称 EQU 表达式 { ,类型 }

示例:

Test EQU 50            ; 定义标号Test 的值为50。
Addr EQU 0x55 ,CODE32  ; 定义Addr的值为0x55 ,且该处为32位的ARM指令。

7. EXPORT(或GLOBAL)

EXPORT伪指令用于在程序中声明一个全局的标号,该标号可在其他的文件中引用。

格式:

EXPORT 标号 {[WEAK]}

示例:

AREA Init ,CODE ,READONLY
EXPORT Stest ; 声明一个可全局引用的标号Stest   
END

8. IMPORT

IMPORT伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,而且无论当前源文件是否引用该标号,该标号均会被加入到当前源文件的符号表中。

格式:

IMPORT 标号 {[WEAK]}

示例:

AREA Init ,CODE ,READONLY
IMPORT Main ; 通知编译器当前文件要引用标号Main,但Main在其他源文件中定 义。 
END

9. EXTERN

EXTERN伪指令用于通知编译器要使用的标号在其他的源文件中定义,但要在当前源文件中引用,如果当前源文件实际并未引用该标号,该标号就不会被加入到当前源文件的符号表中。

格式:

EXTERN 标号 {[WEAK]}

示例:

AREA Init ,CODE ,READONLY
EXTERN Main   ; 通知编译器当前文件要引用标号Main,但Main在其他源文件中定 义。   
END

10. GET(或INCLUDE)

GET伪指令用于将一个源文件包含到当前的源文件中,并将被包含的源文件在当前位置进行汇编处理。可以使用INCLUDE代替GET。

汇编程序中常用的方法是在某源文件中定义一些宏指令,用EQU定义常量的符号名称,用MAP和FIELD定义结构化的数据类型,然后用GET伪指令将这个 源文件包含到其他的源文件中。使用方法与C 语言中的”include” 相似。

GET伪指令只能用于包含源文件,包含目标文件需要使用INCBIN伪指令。

格式:

GET 文件名

示例:

AREA Init ,CODE ,READONLY
GET a1.s      ; 通知编译器当前源文件包含源文件a1.s
GET C:\a2.s  ; 通知编译器当前源文件包含源文件C:\a2.s 
END

11. INCBIN

INCBIN伪指令用于将一个目标文件或数据文件包含到当前的源文件中,被包含的文件不作任何变动的存放在当前文件中,编译器从其后开始继续处理。

格式:

INCBIN 文件名

示例:

AREA Init ,CODE ,READONLY
INCBIN a1.dat     ; 通知编译器当前源文件包含文件a1.dat
INCBIN C:\a2.txt ; 通知编译器当前源文件包含文件C:\a2.txt  
END

12. RN

RN伪指令用于给一个寄存器定义一个别名。采用这种方式可以方便程序员记忆该寄存器的功能。

格式:

名称 RN 表达式

示例:

Temp RN R0   ; 将R0定义一个别名Temp

13. ROUT

ROUT伪指令用于给一个局部变量定义作用范围。在程序中未使用该伪指令时,局部变量的作用范围为所在的AREA,而使用ROUT后,局部变量的作为范围为当前ROUT和下一个ROUT之间。

格式:

{名称} ROUT

示例:

xxxx