real mode protected mode and segmentation

分享
real mode protected mode and segmentation

前言

在操作系统启动时,会先进入实模式(Real Mode),然后再转换为保护模式(Protected Mode),为什么需要这么做?两种模式的寻址方式有何不同?本文通过Intel 8086Intel 80286分段寻址的不同来解释这两种模式的区别。

Intel 8086

8086被设计为完全的16位处理器,所有的内部寄存器、内部及外部数据总线都是16位宽,不过它具有20位宽的外部地址总线,这意味着它能够寻址2^20=1,048,576个地址,也就是最大能够支持1MB的寻址空间。这里可能会有疑问,刚才不是说8086是16位处理器吗?怎么能够进行20位地址总线寻址呢?这是由于8086处理器支持分段机制(Segmentation),它能够通过16 * Segment + Offset的方式进行寻址,例如Segment0xf000Offset0xfff0,则进行如下转换:

16 * 0xf000 + 0xfff0   
= 0xf0000 + 0xfff0  
= 0xffff0 

Segment为16位的基地址被存储在段寄存器(Segment Registers)Offset也同样为16位的偏移地址,通过左移位的方式组合得到的结果0xffff0称之为线性地址(Linear Address),可以理解为Segment为一个内存区域,Offset为相对于这个内存区域起始地址的偏移量。这时有的人可能会问了,如果Segment0xffffOffset0xffff,通过上述公式计算:

16 * 0xffff + 0xffff   
= 0xffff0 + 0xffff  
= 0x10ffef

最终结果为0x10ffef,这已经超过20位地址总线的寻址范围(至少得24位地址总线才能够寻址此地址),这时CPU会丢弃最高位,实际访问的地址为0xffef(这也是在使用更大的内存地址空间前启用A20总线的原因,既启用高位地址)。这种直接能够访问内存地址的方式称之为实模式(Real Mode)

Intel 80286

80286问世时,外部地址总线被拓宽到24位,使得它的寻址能力进一步提升,但是它所带来的不仅仅是寻址能力的提升,还有一个新东西:保护模式(Protected Mode)保护模式下的分段机制实模式下的分段机制有些许不同,它通过以下数据结构进行段翻译(Segment Translation)

  • 描述符(Descriptor) 用来存储分段信息
  • 描述符表(Descriptor Table) 有描述符所组成的数组结构
  • 段选择器(Selector) 从描述符表中找到具体的某个描述符

虽然80286段寄存器(Segment Registers)依然是16位,但是它保存的不再是段基地址,而是称之为Selector选择器,这与实模式下的分段机制有所不同。保护模式下每个分段信息是存储在对应的Descriptor中,那么我们要进行地址转换则需要先在Descriptor Table中找到这个Descriptor,这就需要Selector,通过Selector定位到Descriptor,然后翻译Segment成为线性地址(Linear Address)

Descriptor

先看下Descriptor,它是由8-byte组成的数据结构:

  • 段基地址(Base Address)
    • 由三个片段组成占用32位,用来表示地址的开始位置(后续配合Offset来得到一个具体的地址)
  • Segment Limit
    • 由两个片段组成占用20位,这两用来表示地址范围
  • G=Granularity
    • 如果清除,Segment Limit单位为bytes最大能够表示 2^20 bytes
    • 如果设置,表示以4KB(页大小)为单位,最大可表示 2^32 bytes
  • D=Default operand size
    • 如果清除,则为16位代码段
    • 如果设置,则为32位
  • B=Big
    • 如果设置,则数据段的最大偏移量增加到32位0xffffffff
    • 否则为最大16位0x0000ffff,与 D 基本相同
  • L=Long
    • 如果设置,则为64位段(D 必须为零),并且该段中的代码使用64位指令编码
    • 不能将 LDB 同时设置
  • AVL=Available
    • 仅供软件使用,硬件不做处理
  • P=Present
    • 如果清除,则对此段的任何引用都会生成“段不存在”异常
  • DPL=Descriptor privilege level
    • 访问此描述符所需的特权级别
  • Type
    • 如果设置,则为代码段描述符。如果清除,则为数据/堆栈段描述符
  • C=Conforming
    • 可以从特权级别较低的级别调用此段中的代码
  • E=Expand-Down
    • 如果清除,则该段将从基地址扩展到基数+限制
    • 如果设置,它将从最大偏移向下扩展到限制,这是通常用于堆栈的行为
  • R=Readable
    • 如果清除,则该段可以执行但不能读取
  • W=Writable
    • 如果清除,则可以读取但不能写入数据段
  • A=Accessed
    • 当访问该段时,该位由硬件设置为1,并由软件清除

描述符的数据结构可以看出,它包含了段信息以及权限等信息,在程序将Selector加载到段寄存器中时,CPU不仅加载段的基地址,而且加载保护信息,根据这些信息对段内存进行保护,所以称之为保护模式(Protected Mode)

未完待续...

阅读更多

以太坊黑暗森林-抢跑(front running)

以太坊黑暗森林-抢跑(front running)

前言 鸽了很久之后的今天突然心血来潮,准备写一个系列:以太坊黑暗森林,它介绍以太坊生态上的各种奇思妙想和逆天的攻击方式,会从简单的、常见的攻击方式开始介绍。取这个名字是因为我接触以太坊不久后看的一篇文章 Ethereum is a Dark Forest ,让我想起了《三体》小说中刘慈欣描述的黑暗森林,以太坊是一个弱肉强食的、没有规则的世界,猎人们总是躲在背后监听所有的交易,一旦发现猎物,它们会把它的血给吸干。 开盘抢币 相信进入以太坊生态的韭菜们,一定有过在 uniswap 上买刚开盘新币的经历,新开盘的币,一般会上涨几倍甚至十几倍,越早买入则越能低价买入。你守着时间,等着项目方添加流动性后第一时间买入代币,但是你发现,无论你的手速多块,总是看到一开盘,价格已经飚了几倍,你骂骂咧咧,开始不断拉高 gas 费用,尝试继续买入,但是你眼睁睁的看着代币涨到十倍,自己的交易却一直失败,你开始怀疑项目方自己抢跑,怀疑项目方捣鬼:肯定是项目方吃相难看,用老鼠仓提前买了。另一些聪明人,研究了以太坊的基本技术,他们在 ethscan

By FatTiger
C#:IDisposable 和 析构函数

C#:IDisposable 和 析构函数

C# 中有两种释放资源的方式:实现 IDisposable 或使用析构函数。通常,必须在特定时间释放资源的场景中,我们实现 IDisposable,像这样: public class ExampleDispose : IDisposable { // 非托管资源 private IntPtr _handle; // 使用的其它托管资源 private readonly Stream _stream; private bool disposed = false; public ExampleDispose(Stream stream, IntPtr handle) { this._stream = stream; this._handle = handle; } public void Dispose() { if (disposed) { return; } disposed = t

By FatTiger
ThreadLocal引发的灾难

ThreadLocal引发的灾难

在 Java 里有个称之为线程本地变量的类型叫做 ThreadLocal,它与 ThreadLocal 之于 C# 中是一样的作用,可以在线程范围内设置变量,这个变量只会在当前线程可被访问,但是它们有一点不同的是,在 Java 中,当你设置好变量后,在线程使用完毕回到线程池之前,需要手动调用 ThreadLocal.remove() 方法去清除线程本地变量,否则变量随着线程回到线程池,并且在下次使用此线程时此变量继续存在,而在 C# 中,线程回到线程池时会自动清除本地变量,因此无需手动去清除。 我们的业务有这样一个场景:某个业务 UserService 类中,具有多个方法会频繁(甚至循环)调用一个获取用户标签的接口,具体原因是因为某些方法会进行递归,数据结构有个树状结构,因此,为了优化接口响应时间以及看起来不那么蠢,我使用 ThreadLocal 将用户标签接口的返回数据存储到当前线程,因为在单个请求中,多次调用此接口获取数据是不必要的,它看起来像这样: /** * 此静态变量ThreadLocal会为每个线程创建本地副本, 因此USER_TAGS_THREAD_

By FatTiger
我在币安智能链的日子-区块链基础

我在币安智能链的日子-区块链基础

区块和链 无论是比特币还是以太坊,都是具有一个个区块(称之为Block)的链式结构,学过<数据结构>的肯定明白链表,区块链就像一个链表,每个区块都存储上一个区块哈希。 链(称之为Chain),有非常多的链,他们的协议不同,技术也不尽相同,比特币网络是一个链,以太坊网络是另一个链,每个链都有自己的目标(甚至目标只是为了圈钱),每个链也都有自己的代币,比特币网络的代币是比特币,每次交易都需要比特币作为手续费,以太坊网络代币是以太币,每次在以太坊网络的交易都需要以太币作为手续费。所以,链实际上作为基础设施,非常多的团队喜欢创建新的链,但是一个链光有网络光有代币不行,没有生态,很难成功。 币安智能链(Binance Smart Chain:BSC) 我的主要操作都是在BSC上,没有其它原因,只因为一个穷字。在BTC网络交易,需要BTC用作手续费,这个我可用不起,在以太坊(Ethereum)网络交易,需要以太币(ETH)作为用作手续费,按照以太币目前(

By FatTiger