MIT-CS6.828

real mode protected mode and segmentation

前言

在操作系统启动时，会先进入实模式(Real Mode)，然后再转换为保护模式(Protected Mode)，为什么需要这么做？两种模式的寻址方式有何不同？本文通过Intel 8086和Intel 80286分段寻址的不同来解释这两种模式的区别。

`Intel 8086`

8086被设计为完全的16位处理器，所有的内部寄存器、内部及外部数据总线都是16位宽，不过它具有20位宽的外部地址总线，这意味着它能够寻址2^20=1,048,576个地址，也就是最大能够支持1MB的寻址空间。这里可能会有疑问，刚才不是说8086是16位处理器吗？怎么能够进行20位地址总线寻址呢？这是由于8086处理器支持分段机制(Segmentation)，它能够通过16 * Segment + Offset的方式进行寻址，例如Segment为0xf000，Offset为0xfff0，则进行如下转换：

16 * 0xf000 + 0xfff0   
= 0xf0000 + 0xfff0  
= 0xffff0

Segment为16位的基地址被存储在段寄存器(Segment Registers)，Offset也同样为16位的偏移地址，通过左移位的方式组合得到的结果0xffff0称之为线性地址(Linear Address)，可以理解为Segment为一个内存区域，Offset为相对于这个内存区域起始地址的偏移量。这时有的人可能会问了，如果Segment为0xffff且Offset为0xffff，通过上述公式计算:

16 * 0xffff + 0xffff   
= 0xffff0 + 0xffff  
= 0x10ffef

最终结果为0x10ffef，这已经超过20位地址总线的寻址范围(至少得24位地址总线才能够寻址此地址)，这时CPU会丢弃最高位，实际访问的地址为0xffef(这也是在使用更大的内存地址空间前启用A20总线的原因，既启用高位地址)。这种直接能够访问内存地址的方式称之为实模式(Real Mode)。

`Intel 80286`

当80286问世时，外部地址总线被拓宽到24位，使得它的寻址能力进一步提升，但是它所带来的不仅仅是寻址能力的提升，还有一个新东西：保护模式(Protected Mode)。保护模式下的分段机制与实模式下的分段机制有些许不同，它通过以下数据结构进行段翻译(Segment Translation)：

描述符(Descriptor) 用来存储分段信息
描述符表(Descriptor Table) 有描述符所组成的数组结构
段选择器(Selector) 从描述符表中找到具体的某个描述符

虽然80286的段寄存器(Segment Registers)依然是16位，但是它保存的不再是段基地址，而是称之为Selector的选择器，这与实模式下的分段机制有所不同。保护模式下每个分段信息是存储在对应的Descriptor中，那么我们要进行地址转换则需要先在Descriptor Table中找到这个Descriptor，这就需要Selector，通过Selector定位到Descriptor，然后翻译Segment成为线性地址(Linear Address)：

`Descriptor`

先看下Descriptor，它是由8-byte组成的数据结构：

段基地址(Base Address)
- 由三个片段组成占用32位，用来表示地址的开始位置(后续配合Offset来得到一个具体的地址)
Segment Limit
- 由两个片段组成占用20位，这两用来表示地址范围
G=Granularity
- 如果清除，Segment Limit单位为bytes最大能够表示 2^20 bytes
- 如果设置，表示以4KB(页大小)为单位，最大可表示 2^32 bytes
D=Default operand size
- 如果清除，则为16位代码段
- 如果设置，则为32位
B=Big
- 如果设置，则数据段的最大偏移量增加到32位0xffffffff
- 否则为最大16位0x0000ffff，与 D 基本相同
L=Long
- 如果设置，则为64位段（D 必须为零），并且该段中的代码使用64位指令编码
- 不能将 L 与 D 或 B 同时设置
AVL=Available
- 仅供软件使用，硬件不做处理
P=Present
- 如果清除，则对此段的任何引用都会生成“段不存在”异常
DPL=Descriptor privilege level
- 访问此描述符所需的特权级别
Type
- 如果设置，则为代码段描述符。如果清除，则为数据/堆栈段描述符
C=Conforming
- 可以从特权级别较低的级别调用此段中的代码
E=Expand-Down
- 如果清除，则该段将从基地址扩展到基数+限制
- 如果设置，它将从最大偏移向下扩展到限制，这是通常用于堆栈的行为
R=Readable
- 如果清除，则该段可以执行但不能读取
W=Writable
- 如果清除，则可以读取但不能写入数据段
A=Accessed
- 当访问该段时，该位由硬件设置为1，并由软件清除

由描述符的数据结构可以看出，它包含了段信息以及权限等信息，在程序将Selector加载到段寄存器中时，CPU不仅加载段的基地址，而且加载保护信息，根据这些信息对段内存进行保护，所以称之为保护模式(Protected Mode)。

未完待续...

阅读更多

以太坊黑暗森林-抢跑（front running）

前言鸽了很久之后的今天突然心血来潮，准备写一个系列：以太坊黑暗森林，它介绍以太坊生态上的各种奇思妙想和逆天的攻击方式，会从简单的、常见的攻击方式开始介绍。取这个名字是因为我接触以太坊不久后看的一篇文章 Ethereum is a Dark Forest ，让我想起了《三体》小说中刘慈欣描述的黑暗森林，以太坊是一个弱肉强食的、没有规则的世界，猎人们总是躲在背后监听所有的交易，一旦发现猎物，它们会把它的血给吸干。开盘抢币相信进入以太坊生态的韭菜们，一定有过在 uniswap 上买刚开盘新币的经历，新开盘的币，一般会上涨几倍甚至十几倍，越早买入则越能低价买入。你守着时间，等着项目方添加流动性后第一时间买入代币，但是你发现，无论你的手速多块，总是看到一开盘，价格已经飚了几倍，你骂骂咧咧，开始不断拉高 gas 费用，尝试继续买入，但是你眼睁睁的看着代币涨到十倍，自己的交易却一直失败，你开始怀疑项目方自己抢跑，怀疑项目方捣鬼：肯定是项目方吃相难看，用老鼠仓提前买了。另一些聪明人，研究了以太坊的基本技术，他们在 ethscan

C#：IDisposable 和析构函数

C# 中有两种释放资源的方式：实现 IDisposable 或使用析构函数。通常，必须在特定时间释放资源的场景中，我们实现 IDisposable，像这样： public class ExampleDispose : IDisposable { // 非托管资源 private IntPtr _handle; // 使用的其它托管资源 private readonly Stream _stream; private bool disposed = false; public ExampleDispose(Stream stream, IntPtr handle) { this._stream = stream; this._handle = handle; } public void Dispose() { if (disposed) { return; } disposed = t

ThreadLocal引发的灾难

在 Java 里有个称之为线程本地变量的类型叫做 ThreadLocal，它与 ThreadLocal 之于 C# 中是一样的作用，可以在线程范围内设置变量，这个变量只会在当前线程可被访问，但是它们有一点不同的是，在 Java 中，当你设置好变量后，在线程使用完毕回到线程池之前，需要手动调用 ThreadLocal.remove() 方法去清除线程本地变量，否则变量随着线程回到线程池，并且在下次使用此线程时此变量继续存在，而在 C# 中，线程回到线程池时会自动清除本地变量，因此无需手动去清除。我们的业务有这样一个场景：某个业务 UserService 类中，具有多个方法会频繁（甚至循环）调用一个获取用户标签的接口，具体原因是因为某些方法会进行递归，数据结构有个树状结构，因此，为了优化接口响应时间以及看起来不那么蠢，我使用 ThreadLocal 将用户标签接口的返回数据存储到当前线程，因为在单个请求中，多次调用此接口获取数据是不必要的，它看起来像这样： /** * 此静态变量ThreadLocal会为每个线程创建本地副本, 因此USER_TAGS_THREAD_

我在币安智能链的日子-区块链基础

区块和链无论是比特币还是以太坊，都是具有一个个区块（称之为Block）的链式结构，学过<数据结构>的肯定明白链表，区块链就像一个链表，每个区块都存储上一个区块哈希。链（称之为Chain），有非常多的链，他们的协议不同，技术也不尽相同，比特币网络是一个链，以太坊网络是另一个链，每个链都有自己的目标（甚至目标只是为了圈钱），每个链也都有自己的代币，比特币网络的代币是比特币，每次交易都需要比特币作为手续费，以太坊网络代币是以太币，每次在以太坊网络的交易都需要以太币作为手续费。所以，链实际上作为基础设施，非常多的团队喜欢创建新的链，但是一个链光有网络光有代币不行，没有生态，很难成功。币安智能链（Binance Smart Chain：BSC）我的主要操作都是在BSC上，没有其它原因，只因为一个穷字。在BTC网络交易，需要BTC用作手续费，这个我可用不起，在以太坊（Ethereum）网络交易，需要以太币（ETH）作为用作手续费，按照以太币目前（

前言

Intel 8086

Intel 80286

Descriptor