单精度浮点数(Float)与双精度浮点数(Double)

分享
单精度浮点数(Float)与双精度浮点数(Double)

前言

对于十进制的整数使用二进制表示很简单,但是对于十进制小数如何使用二进制进行存储?十进制的小数又何如使用二进制小数表示?此文章描述了如何将十进制小数转换为二进制小数以及浮点数再内存中时如何进行存储。

二进制小数

在计算机中,无论什么数据,最终存储都为二进制,对于整数部分很容易表示,但是对于非整数则比较困难。例如,十进制数0.125可表示为二进制0.001,怎么得来的?简单的计算可以用0.125不断乘2,结果小于1将二进制位记为0,结果大于1时将二进制位记为1

0.125 * 2 = 0.25  二进制位记作 0
0.25  * 2 = 0.5   二进制位记作 0
0.5   * 2 = 1     二进制位记作 1

所以得出结果为0.001

另外可以把可以把十进制数0.125看做1/2/2/2 = 1*2^-3,十进制1换算为二进制还为1,二进制的负指数则相当于二进制数1右移位,用2的指数记为2^-3

上面的例子因为能够用2的指数表示,所以能够被二进制精确的表达,但是有些情况,则无法使用二进制准确表达,例如一个人尽皆知的例子:十进制数0.1如何使用二进制表达?你会发现你无法用2的指数去表达它,即使用我们上面的计算方法:

0.1   * 2 = 0.2  二进制位记作 0
0.2   * 2 = 0.4  二进制位记作 0
0.4   * 2 = 0.8  二进制位记作 0
0.8   * 2 = 1.6  二进制位记作 1 
0.6   * 2 = 1.2  二进制位记作 1
0.2   * 2 = 0.4  二进制位记作 0
0.4   * 2 = 0.8  二进制位记作 0
0.8   * 2 = 1.6  二进制位记作 1
...

你会发现,它会无穷无尽的循环0.0001100110011...,这便是为何无法使用二进制数精确表达十进制小数。类似于使用十进制数也无法精确表达,永远是0.33333333...

浮点数

浮点数是相对于定点数而言的。
十进制数1234用科学计数法可写作:1.234*10^3,类似的,可用二进制表示为‭0.10011010010*2^11‬,我们称10011010010为尾数(mantissa/fraction),2称为基数(Radix),11则称之为指数(Exponent)。如此,小数点的位置根据指数的不同而浮动,称为浮点数。

那么在内存中,是如何使用二进制表示小数?IEEE_754对此进行了标准化。

单精度浮点数(Float)

单精度浮点数的存储使用32位二进制数,最高位31是符号位,用来表示正负数,23-30存储指数,低位0-22存储尾数。
需要注意的是,指数位的存储有两种方式:

  • 一种为有符号整数,意为有1位用来存储是正指数还是负指数。
  • 另外一种情况存储为无符号整数,使用指数偏移量来计算是正指数还是负指数,例如,单进度浮点数的指数偏移量为127,意味着所存储的指数需要减去127,得出的结果便是正确的指数。

另外关于尾数的存储,在正规数(normal numbers)的情况下,二进制小数的表示总是以1.x开头,例如二进制数1001会表示为1.001*2^3而不是0.1001*2^40.01001*2^5。这在存储时则可省略开头的1,上面的1001则可存储为001且指数为3

我们看一个具体的例子:十进制数0.15625

符号(Sign):0
指数(Exponent):偏移量计算方法,实际上我们应当存储的是-3指数,
                用偏移量则为 127 - 3 = 124 转换为二进制为 0111 1100‬
尾数(Fraction):按照上面的十进制小数计算二进制小数得出0.00101 = 1.01 * 2^-3,
                去除前导1和指数得出尾数 = 01

双精度浮点数(Double)

双精度浮点数的计算类似于单精度浮点数,只不过存储大了一倍,它使用64位二进制数进行存储,与单精度浮点数相似,最高位63是符号位,用来表示正负数,52-62存储指数,低位0-51存储尾数,它的指数偏移为1023

其它值

无论是单精度还是双精度浮点数,都存在一些特殊的值,例如次正规数(subnormal numbers)和0以及±无穷大的数,还有无法正确转换的值NaN

结尾

精度越高的存储所需要的存储空间是越大的,当尾数过大无法存储时,根据IEEE_754标准进行丢失精度的舍入。

Reference

阅读更多

以太坊黑暗森林-抢跑(front running)

以太坊黑暗森林-抢跑(front running)

前言 鸽了很久之后的今天突然心血来潮,准备写一个系列:以太坊黑暗森林,它介绍以太坊生态上的各种奇思妙想和逆天的攻击方式,会从简单的、常见的攻击方式开始介绍。取这个名字是因为我接触以太坊不久后看的一篇文章 Ethereum is a Dark Forest ,让我想起了《三体》小说中刘慈欣描述的黑暗森林,以太坊是一个弱肉强食的、没有规则的世界,猎人们总是躲在背后监听所有的交易,一旦发现猎物,它们会把它的血给吸干。 开盘抢币 相信进入以太坊生态的韭菜们,一定有过在 uniswap 上买刚开盘新币的经历,新开盘的币,一般会上涨几倍甚至十几倍,越早买入则越能低价买入。你守着时间,等着项目方添加流动性后第一时间买入代币,但是你发现,无论你的手速多块,总是看到一开盘,价格已经飚了几倍,你骂骂咧咧,开始不断拉高 gas 费用,尝试继续买入,但是你眼睁睁的看着代币涨到十倍,自己的交易却一直失败,你开始怀疑项目方自己抢跑,怀疑项目方捣鬼:肯定是项目方吃相难看,用老鼠仓提前买了。另一些聪明人,研究了以太坊的基本技术,他们在 ethscan

By FatTiger
C#:IDisposable 和 析构函数

C#:IDisposable 和 析构函数

C# 中有两种释放资源的方式:实现 IDisposable 或使用析构函数。通常,必须在特定时间释放资源的场景中,我们实现 IDisposable,像这样: public class ExampleDispose : IDisposable { // 非托管资源 private IntPtr _handle; // 使用的其它托管资源 private readonly Stream _stream; private bool disposed = false; public ExampleDispose(Stream stream, IntPtr handle) { this._stream = stream; this._handle = handle; } public void Dispose() { if (disposed) { return; } disposed = t

By FatTiger
ThreadLocal引发的灾难

ThreadLocal引发的灾难

在 Java 里有个称之为线程本地变量的类型叫做 ThreadLocal,它与 ThreadLocal 之于 C# 中是一样的作用,可以在线程范围内设置变量,这个变量只会在当前线程可被访问,但是它们有一点不同的是,在 Java 中,当你设置好变量后,在线程使用完毕回到线程池之前,需要手动调用 ThreadLocal.remove() 方法去清除线程本地变量,否则变量随着线程回到线程池,并且在下次使用此线程时此变量继续存在,而在 C# 中,线程回到线程池时会自动清除本地变量,因此无需手动去清除。 我们的业务有这样一个场景:某个业务 UserService 类中,具有多个方法会频繁(甚至循环)调用一个获取用户标签的接口,具体原因是因为某些方法会进行递归,数据结构有个树状结构,因此,为了优化接口响应时间以及看起来不那么蠢,我使用 ThreadLocal 将用户标签接口的返回数据存储到当前线程,因为在单个请求中,多次调用此接口获取数据是不必要的,它看起来像这样: /** * 此静态变量ThreadLocal会为每个线程创建本地副本, 因此USER_TAGS_THREAD_

By FatTiger
我在币安智能链的日子-区块链基础

我在币安智能链的日子-区块链基础

区块和链 无论是比特币还是以太坊,都是具有一个个区块(称之为Block)的链式结构,学过<数据结构>的肯定明白链表,区块链就像一个链表,每个区块都存储上一个区块哈希。 链(称之为Chain),有非常多的链,他们的协议不同,技术也不尽相同,比特币网络是一个链,以太坊网络是另一个链,每个链都有自己的目标(甚至目标只是为了圈钱),每个链也都有自己的代币,比特币网络的代币是比特币,每次交易都需要比特币作为手续费,以太坊网络代币是以太币,每次在以太坊网络的交易都需要以太币作为手续费。所以,链实际上作为基础设施,非常多的团队喜欢创建新的链,但是一个链光有网络光有代币不行,没有生态,很难成功。 币安智能链(Binance Smart Chain:BSC) 我的主要操作都是在BSC上,没有其它原因,只因为一个穷字。在BTC网络交易,需要BTC用作手续费,这个我可用不起,在以太坊(Ethereum)网络交易,需要以太币(ETH)作为用作手续费,按照以太币目前(

By FatTiger