OS假期预习（二）——MIPS知识补充

本文最后更新于：2024年4月22日晚上

OS假期预习（二）——MIPS知识补充

下面将介绍操作系统实验使用的 CPU 与我们计组的课设 CPU 的不同之处，并对 MIPS 汇编相关知识进行补充。

操作系统实验使用 MIPS32 4Kc CPU，这是一款由 MIPS® Technologies 公司开发的使用 MIPS32 指令集的商业处理器核。

而计组中实现的 CPU 使用 MIPS-C 指令集，MIPS-C 指令集是 MIPS32 指令集的精简版本，也就是相当于计组实现的 CPU 指令集和功能是操作系统实验中使用的一个子集。

具体谈及操作系统实验中涉及，而计组 CPU 不完整的功能，主要是有两个部分：访存流程、CP0协处理器相关。

访存流程

在计组中，我们的 CPU 不存在虚拟地址机制，访存指令中的所有地址均是物理地址。物理地址被直接发送到 DM、IM 中，直接获取数据。这简化了 MIPS32 的访存流程，让大家可以更多的关注 CPU 内部计算与控制逻辑。

而在完整的 MIPS32 访存流程中，汇编指令 不直接和物理内存打交道。

访存指令中的地址，被称作虚拟地址，在执行访存操作的时候，虚拟地址会先被送入 MMU 进行地址翻译、权限检查，最终拿到物理地址。

对于 MMU 检查合法的访存操作，通过 MMU 拿到物理地址之后，相应访存操作才会进一步被实际在物理地址上执行。

所有的软件（包括 MIPS 汇编、C 语言编写的软件等）访存的地址都是虚拟地址。

MIPS32 的 MMU 支持基于 TLB 的 页式地址翻译，而操作系统实验使用了 MIPS32 的这个地址翻译功能。这一部分在计组的 CPU 中并没有涉及。

这将牵扯出我们OS中的两个知识点：MIPS32 具体访存流程、TLB 在 MIPS32 地址翻译中扮演的角色。具体内容将在我们 Lab2 内存管理中学到，在 pre 中我们仅介绍到此。

目前，只需要大家牢记，在 MIPS32 指令集中，我们的访存指令不再直接操作物理地址，而是使用虚拟地址以及地址翻译机制，间接管理物理内存。

CP0协处理器

计组课程中 CPU 的协处理器 CP0 基本只负责中断与异常的相关处理。

而 MIPS32 指令集的 CP0 更为复杂，也具有更多功能，整体上 CP0 用于对整个处理器的状态进行维护和控制，包括但不限于对于中断及异常信息的记录、特权管理、地址翻译控制等。

控制地址翻译的功能将在 Lab2 的实验中具体涉及。

中断异常

对于中断及异常的处理，MIPS32 比 MIPS-C 的要复杂一些。实验中使用的部分主要涉及 CP0 的一些寄存器： Cause、EPC、BadVAddr 。

其中 Cause 与 EPC 寄存器在 MIPS32 与 MIPS-C 中均存在，其定义也是相似的，而 BadVAddr 则不存在于 MIPS-C 中。

异常原因寄存器

上图是 MIPS32 中定义的 Cause 寄存器，其中保存着 CPU 中哪一些中断或者异常发生了。 15-8 位指示了哪一些中断等待处理，其中 15-10 位来自硬件，9-8 位可以由软件写入。当中断请求发生时，Cause 寄存器对应位置 1。 6-2 位则记录发生的异常号，供软件进行区别。还需要特别注意的是 31位 BD，当这一位为1时，表明发生异常的指令位于延迟槽，软件在处理其异常时需要特别特殊处理。

EPC 寄存器：存放异常发生的指令对应 PC 地址，软件在完成异常处理之后，可以根据此 PC 返回。

BadVAddr 寄存器：在我们前文的访存流程中有提到，若访存操作合法，具体的操作才会被执行。不合法的访存操作则会触发异常，当访存相关的异常被触发时，这个寄存器将会被用来记录触发异常的访存地址供软件进行处理。

计组课程着重于实现一个简略的硬件 CP0 ，并不关注软件实现的部分，而操作系统课程更多关注配合硬件的软件部分（即操作系统本身）。

特权管理

在 MIPS-C 中，处理器只有一个特权模式，对于所有指令，均一视同仁的在这个特权模式下，所有操作均被允许执行。而 MIPS32 中，则定义了多种特权模式，主要使用的两种状态被叫做用户态、内核态。

在内核态下，CPU 可以执行其架构允许的任何操作；可以执行任何指令、启动任何 I/O 操作、访问任何内存区域等等。在其他特权模式下， CPU 允许执行的操作收到硬件限制限制。通常，某些特殊指令是不被允许的（具体而言，通常是影响计算机控制或者完成 I/O 操作的指令），某些内存区域也无法访问，等等。

内核态即计组实验中所提到的特权态，用户态就是非特权态。操作系统借助 CPU 的这套硬件特权控制机制，实现对并发运行的不同用户程序的隔离，以及对计算机整体安全的保护。

试想若 CPU 不存在这样一种特权控制机制，那么任意用户程序都可视为具有与操作系统同等的地位。这种情况下，用户程序可以完全脱离操作系统的管理与控制，这是不安全的。

与处理器状态相关的寄存器，主要是 Status 寄存器，它控制处理器整体工作模式。在计组的 CP0 中，也存在一个 Status 寄存器，不过当时只使用了其对中断使能控制的功能。

状态寄存器

上图是 MIPS32 中定义的 Status 寄存器，其控制整个处理器状态。其完整定义比较复杂，我们只用关注其中部分位即可。Status 寄存器的第 0 位，是全局中断使能位。只有这一位配置为 1 ，处理器才可以响应中断。第 15-8 为中断使能位，分别控制 8 个中断输入的使能。第 4 位 UM 与第 1 位 EXL 则用于控制处理器的特权模式。当且仅当 UM 为 1 且 EXL 为 0 时，处理器运行在用户态，其它状态下，处理器均运行于内核态。

计组中，我们 CPU 只能一次运行一个我们编写的 MIPS 汇编程序。而在操作系统中，我们可以通过操作系统配合硬件时钟中断给不同进程分配 CPU 时间，使得 CPU 在执行不同进程间切换，实现多个进程的并发执行。

对于 MIPS 体系结构来说，实时中断产生时，就会触发中断，将 PC 指向异常处理程序入口。异常处理程序首先保存现场，此后根据 Cause 寄存器中的情况进行异常分发，转到内核的不同异常处理子程序。

MIPS调用约定

精选自MIPS Calling Conventions Summary

通用寄存器

寄存器编号	助记符	用途
0	zero	值总是为 0
1	at	（汇编暂存寄存器）一般由汇编器作为临时寄存器使用。
2-3	v0-v1	用于存放表达式的值或函数的整形、指针类型返回值。
4-7	a0-a3	用于函数传参。其值在函数调用的过程中不会被保存。若函数参数较多，多出来的参数会采用栈进行传递。
8-15	t0-t7	用于存放表达式的值的临时寄存器; 其值在函数调用的过程中不会被保存。
16-23	s0-s7	保存寄存器; 这些寄存器中的值在经过函数调用后不会被改变。
24-25	t8-t9	用于存放表达式的值的临时寄存器; 其值在函数调用的过程中不会被保存。
26-27	k0-k1	仅在内核态下使用。
28	gp	全局指针和内容指针。
29	sp	栈指针。
30	fp或s8	保存寄存器（同 s0-s7）。也可用作帧指针。
31	ra	函数返回地址。

栈帧

每次调用一个函数时，都会为该函数创建一个唯一的栈帧。

栈帧的结构很重要。它在调用者和被调用者之间形成了一个契约，它定义了参数在调用者和被调用者之间如何传递，一个函数调用的返回值如何从被调用者传递给调用者，并定义了如何共享寄存器。

通常，函数的栈帧可能包含以下几个部分：

用于存储传递给此调用的函数参数的空间。
存储已保存寄存器值的位置（s0 到 s7）。
一个存储子程序返回地址的地方（ra）。
一个用于本地数据存储的地方。

栈帧的结构

栈帧的黄色部分，即参数部分。当前函数 A 调用当前函数的子函数 B 时，会将 B 的参数压入当前函数 A 的栈帧中的参数部分，以实现对函数调用时的传参。此外，还需注意，由于 a0-a3 寄存器也将被用作传参，所以参数部分中的淡黄色部分（arg 0 至 arg 3）只需要保留栈帧空间，并不填入具体参数值。至于参数个数超过的 4 个的子函数，当前函数 A 就需要将多出来的第 4 至第 n-1 个参数压入栈中（arg 4 至 arg n-1），实现对子函数 B 的调用。

栈帧的浅绿部分，即保留寄存器部分，前面提到我们会在当前函数被调用后，在当前函数最开始，复制当前函数要使用的任何规定需要保存的寄存器（s0 到 s7）的值压入栈帧的保留寄存器部分。此后，由于我们已经在栈帧中保存了当前函数被调用时寄存器的最初样貌，在函数执行中，函数可以随意读写已保存寄存器。当函数执行完毕，返回前，我们会复原栈中保留寄存器部分到寄存器中，使得函数的调用者（父函数），可以认为在整个调用过程中，保存的寄存器没有发生变化。

栈帧的深绿部分，即返回地址部分。返回地址部分用于存储 ra 的值。该值在执行当前函数开始时被复制到栈中，并在当前函数返回之前被复制回 ra 寄存器中。

栈帧的灰色部分，即填充部分，其作用在于确保栈帧的总大小总是 8 的倍数。在这里插入它，以确保其上方的局部数据存储部分首地址是双字对齐的。这是为了与 MIPS 64 位体系结构的双字读取指令兼容。

栈帧的蓝色部分，即局部数据存储部分。它用来存储函数的局部变量。函数必须为此区域的所有局部变量保留足够的存储空间，包括需要在函数调用前后保留的任何临时寄存器（t0 到 t9）值的空间。

Leaf & Nonleaf Subroutine

并不是每个函数都需要其栈帧中描述的每个部分。一般的规则是，如果程序不需要其中的一个部分，那么它可以从其栈帧中省略该部分。为了明确这一点，可以区分 3 个不同类别的函数：

简单叶函数（Simple Leaf）

不调用任何其他子例程，不使用栈上的任何内存空间（因为其不需要内存来保存局部变量或寄存器的值）。这样的函数不需要栈帧，也不需要更改 sp。

有局部数据的叶函数（Leaf with Data）

需要栈空间的叶函数（但不需要、不调用任何其他子例程），其栈帧可用于本地变量或寄存器的值的保存。这样的函数被调用后应当压栈（栈帧大小应该是 8 的倍数）。但是，ra 并不用保存在栈帧中。

非叶函数（Nonleaf）

函数内调用了其他函数。一个非叶函数的栈帧包含了上一节所述的大部分结构。

MIPS Directives & Macro

`.byte`、`.half`、`.word`、`.ascii`、`.asciiz`

这类在计组中常见的 directives，别对应着不同数据的类型。

`.align`

.align 的作用是“使下面的数据进行地址对齐”，下面这段代码使得下面大小为一个字的变量 var 按 4 字节进行对齐（参数 �x 代表以 2�2x 字节对齐）

1 2	`.align 2 # align to 4-byte boundary (2^2) var: .word 0`

该指令允许程序员通过指定一个零对齐，来覆盖.half、.word等的自动对齐特性。

1
2
3

.half 3
.align 0 # 关闭自动对齐
.word 100 # 使得 word 紧贴着 half

`.globl`、`.extern`

在计组中的写的汇编程序往往只有一个文件。但在操作系统课中，存在跨文件的情况，例如跨文件调用函数。

.globl：将符号定义为具有对其他模块可见的全局符号
.extern：要对另一个模块中的全局符号的引用（即外部符号），需要注意的是所有对标签引用都会自动被认为是在引用全局符号，所以我们在对另一模块中的全局标签引用时，没有必要添加 .extern（但对另一模块中的全局变量引用时，需要添加.extern）

此后在链接时，链接器要将各个目标文件的内容“合为一体”，通过上述方式标记的符号就可以被跨文件引用。

例如，在未来课程设计的 asm.h 头文件中，我们定义了如下宏：

#define FEXPORT(symbol)         \   # 使symbol代指的函数对其他模块可见
    .globl symbol;              \   # 使标签对链接器可见，使得其它文件中可以调用我们使用宏定义声明的函数。
    .type symbol, @function;    \
    symbol:

在未来内核实验的 genex.S 汇编文件中，我们通过该宏声明了一个全局函数 ret_from_exception（你可以忽略函数中的内容）

1 2	`FEXPORT(ret_from_exception) /* Do Something */`

此时我们可以在未来内核实验的另一文件 env_asm.S 中，直接调用该函数

.text
LEAF(env_pop_tf)
    /* Do Something */
    j       ret_from_exception # 直接调用该函数，默认ret_from_exception为全局标签，无需.extern
END(env_pop_tf)

`.set`

设置汇编器的工作方式。默认情况下，汇编器会尝试通过重新排列指令，来填充分支指令和存取指令造成的空闲时间。了解即可。

.set noreorder 和 .set reorder：告知汇编器是否重新对指令进行顺序进行排序。reorder 模式下汇编器会自动调度指令至延迟槽，noreorder 模式下需要手动填充延迟槽。
.set at 和 .set noat：at 模式下，1 号寄存器（$at）为汇编器保留用于实现扩展指令；noat 模式下，汇编器不会使用 1 号寄存器。

`LEAF`、`NESTED`、`END` 三个宏

在操作系统实验中，我们将常常会遇到三个和函数有关的宏，是我们人为定义的。

`LEAF`

#define LEAF(symbol)                        \
    .globl  symbol;                         \
    .align  2;                              \
    .type   symbol,@function;               \
    .ent    symbol;                         \
    symbol:                                 \
    .frame  sp,0,ra

第一行是对 LEAF 宏的定义，后面括号中的 symbol 类似于函数的参数，在宏定义中的作用类似，编译时在宏中会将 symbol 替换为实际传入的文本，也即我们的函数名。
第二行中，.globl 的作用是“使标签对链接器可见”，这样即使在其它文件中也可以引用到 symbol 标签，从而使得其它文件中可以调用我们使用宏定义声明的函数。
第三行中，.align 2 的作用是“使下面的数据进行地址对齐”，这一行语句使得下面的 symbol 标签按 4 Byte 进行对齐，从而使得我们可以使用 jal 指令跳转到这个函数（末尾拼接两位 0）。
第四行中，.type 的作用是设置 symbol 标签的类别，在这里我们设置了 symbol 标签为函数标签。
第五行中，.ent 的作用是标记每个函数的开头，需要与 .end 配对使用。这些标记使得可以在 Debug 时查看调用链

LEAF宏在使用时, 我们可以这样用，例如：

LEAF(msyscall)
    // Just use 'syscall' instruction and return.
    syscall
    jr      ra
END(msyscall)

`NESTED`

#define NESTED(symbol, framesize, rpc)      \
    .globl  symbol;                         \
    .align  2;                              \
    .type   symbol,@function;               \
    .ent    symbol,0;                       \
    symbol:                                 \
    .frame  sp, framesize, rpc

通过对比，我们可以发现 LEAF 宏和 NESTED 宏的区别就在于 LEAF 宏定义的函数在被调用时没有分配栈帧的空间记录自己的“运行状态”，NESTED 宏在被调用时分配了栈帧的空间用于记录自己的“运行状态”。

NESTED 宏在使用时, 我们可以这样用，例如：

NESTED(handle_int, TF_SIZE, zero)
    mfc0    t0, CP0_CAUSE
    mfc0    t2, CP0_STATUS
    and     t0, t2
    andi    t1, t0, STATUS_IM7
    bnez    t1, timer_irq
timer_irq:
    li      a0, 0
    j       schedule
END(handle_int)

`END`

1
2
3

#define END(function)                       \
    .end    function;                       \
    .size   function,.-function

第一行是对 END 宏的定义，与上面 LEAF 与 NESTED 类似。

第二行的 .end 是为了与先前 LEAF 或 NESTED 声明中的 .ent 配对，标记了 symbol 函数的结束。

第三行的 .size 是标记了 function 符号占用的存储空间大小，将 function 符号占用的空间大小设置为 .-function，. 代表了当前地址，当前位置的地址减去 function 标签处的地址即可计算出符号占用的空间大小。

课内学习

#操作系统

OS假期预习（二）——MIPS知识补充

https://galaxy-jewxw.github.io/2024/02/24/OSPre2/

作者

Traumtänzer aka 'Jew1!5!'

发布于

2024年2月24日

许可协议

递归下降法——处理复杂输入上一篇

OS假期预习（一）——Linux，Git与Shell脚本下一篇

OS假期预习（二）——MIPS知识补充

OS假期预习（二）——MIPS知识补充

访存流程

CP0协处理器

中断异常

特权管理

MIPS调用约定

通用寄存器

栈帧

Leaf & Nonleaf Subroutine

简单叶函数（Simple Leaf）

有局部数据的叶函数（Leaf with Data）

非叶函数（Nonleaf）

MIPS Directives & Macro

.byte、.half、.word、.ascii、.asciiz

.align

.globl、.extern

.set

LEAF、NESTED、END 三个宏

LEAF

NESTED

END

`.byte`、`.half`、`.word`、`.ascii`、`.asciiz`

`.align`

`.globl`、`.extern`

`.set`

`LEAF`、`NESTED`、`END` 三个宏

`LEAF`

`NESTED`

`END`