Filecoin 与 自然常数 e

2020-07-27 09:51 来源:胡飞瞳 阅读:3949
老子曰:“人法地、地法天、天法道、道法自然”。

老子曰:“人法地、地法天、天法道、道法自然”。在区块链的实践中,由于是建立Code is Law的体系,遵循 In Math We Trust 的法则。在一个不受个体控制的网络,遵循自然的法则尤其重要。我提倡Filecoin的设计从简、自然。也是这个道理。

自然常数 e,是一个神奇的数,在数学中又极为自然。本文讲一讲 Filecoin 的共识机制的实现进化与自然常数 e 的关系。

内容提要

一、自然常数 e

二、初期预期共识空块率过高:1/e

三、预期共识的实现是一个不段发现的过程

四、tipset区块数预期提升(至5),安全性和效率的兼顾

五、让每一个字节都参与投票:优雅的密码抽签 + e

【预警:数学、概率与分布】

数学常数 e

e 被成为自然常数,在数学家的眼里,这个常数非常自然。但是,对于普通人而言,对于 e,由于没有形象化的描述,就很难理解。本文通过 e 在 Filecoin中的应用,希望能够找到一些点,能够帮助大家 1)了解Filecoin的一些设计;2)通过 Filecoin 得到一点 e 的形象化的描述和印象。

常见的比较复杂的有意思的数学常数有两个,一个是 π,一个是 e。大家对π 都非常熟悉,因为它有一个非常形象化的名字,叫圆周率,也就是说是任何一个圆的周长和直径的比值。非常形象,非常容易理解。小学不学的话,初中总会学到了。

其实 e 是与 π 同等重要的一个数学常数,在数学中的使用一点也不比 π 少。比如就在我们今天所讨论的 Filecoin 区块链中,e 在很多地方被使用,而 π 则不然,基本上没有被用到。

π = 3.1415926535897...... 

e = 2.718281828459045......

π 和 e 同为超越数,即不是代数数(有理数方程的解),当然也是无理数,无限不循环小数。

但其实,e 和 π 在数学中有非常紧密的关系。甚至可以说,e 就是 π 的另一种表示方法。为什么呢,请看最优雅数学公式 - 欧拉公式:

微信图片_20200727095552.jpg

为什么优雅,这个一个简单的公式把数学中的5个元素(0, 1, i, π, e)十分简单地统一在一起了。就像物理学家希望统一力场一样,数学家也有把总结简洁规律的偏执。

这个公式也表达了 e 和 π 的简单直接的关系。当然,他们之间还有一些有意思的关系,比如:

微信图片_20200727095601.jpg

但是,这些仿佛把事情更加复杂化了,对于 e 本身的理解并没有帮助。到底 e 是什么呢?数学中会讲,e 是自然对数的底,它的一个总要特点就是 e^x 的导数还是 e^x,同时,e 可以通过下式来表达和计算:

微信图片_20200727095608.jpg

稍微形象一点的表达,就是在复利的计算上,e 表达一个在一段时间内翻倍增长的利率,进行极限的连续复利计算能够达到的极限值。也就是说,如果年利率是100%,你如果无限细分一年到 n 个时间段,那么每个时间段的利率为 1/n,而最终你能得到的连本带利的收入为 e 倍,也就是2.7倍多一些。 

这仍然不够形象,那么下面映射到 Filecoin 的共识机制来看一看。

Filecoin 预期共识与自然常数的关系

先来复习一下Filecoin白皮书里面描述的预期共识。在go-filecoin的早期实现中,采用的是简单的预期共识,也就是说,每一个矿工按照自己的算力与总算力的比来获得出块权的概率。因为所有矿工的算力之和等于总算力,所以系统每一轮的总出块概率的期望值为 1。简单来说,就是每一轮平均出一个块,但是,每个矿工独立计算,因此,每一轮的出块数可能是各种各样的。

那么在这种情况下,我们建立一个简单(也是有效的)模型来进行一个推演。假设系统中的矿工数为 n,每个矿工的算力占比为 1/n,那么,每一轮呢每个矿工的出块概率为 1/n。

这样,一轮中出现空块的概率为: 

微信图片_20200727095616.jpg

如果 n 足够大,那么,可以求得:

微信图片_20200727095623.jpg

也就是空轮的概率超过三分之一,这个就太高了。

那么出块数为 1 的概率有多大呢,可以简单做如下计算:

微信图片_20200727095628.jpg

仍然只有三分之一多一点。剩下的不到三分之一的概率都是多块的轮次。这个结论与开发网当时的测试是完全吻合的。

从这里,我们找到了一个对于自然常数 e 的一个更形象化的解释,那就是:在一个有很多人(大数)参与的独立投票选举中,每个人的赢得选举的概率相同,同时预期赢得选举人数为1的情况下,不能得出选举结果的概率为 e 的倒数,也就是 1/e。

预期共识的实现是一个不断发现的过程

开发网出现的空块率过高的情况,我们做了模拟,并与Filecoin研究开发团队进行了讨论。显然,这么高的空块轮次比例是不好的,这是的区块时间不固定,交易时间预测起来也比较困难。

那么,一个简单的改动是什么呢?那就是增加每一轮的区块预期数量。因为预期共识本来一轮就可能出现多个区块,在实现中采用tipset的方式进行组合,那么增加区块的预期数量,对于设计实现而言非常简单。

在测试网之前,Filecoin实现引入了预期每轮区块数这个概念,这个被定义为 E (ExpectedBlocksPerEpoch)。当前默认:E = 5

既然,预期区块数提高了,最简单的方法就是把每个矿工的出块概率提高5倍。但是,矿工出块的计算采用掷骰子的方式。也就是产生一个 256 位空间中的一个数,来比较自己的算力占比,从而判断是否拥有出块权。这里就有一个数据越界的问题。Filecoin的实现在这个判断上走过三个阶段:

阶段一:每个矿工按照自己的算力再进行切分,分别按照更小的份额进行选举,如果赢得选举就获得一票。相同默认算力都按照每 25 个 sector来进行统一切分(剩余部分单独算)。这个办法的好处是每一个选举人算力都基本一样,进行公平选举。但是,由于每25个sector都要进行单独计算,每一个部分都需要I/O访问,时间消耗较大。Filecoin团队的最初目的是把这个出块权和时空证明放在一起。但是,最后从安全的角度来考虑,由于计算相对复杂,还是放弃了。

阶段二:直接极致简化,不考虑越界的问题,直接乘以5进行比较计算。这个是在时空证明已经通过WindowedPoSt替代 SurprisedPoSt的情况下的一个简化措施。但是,这样做有两个问题:1)对于算力大于 20% 的矿工肯定是吃亏的;2)当矿工算力足够大时,一定能够赢得选举。这第二个问题比较严重。我们慎重提出,这是一个安全问题,应该改。

阶段三:采用密码抽签的方式,借鉴Algorand采用的算法。逐渐走向完善。

让每一个字节都参与投票

Algorand的密码抽签是一个非常好的概率分布在选举上的应用,对于区块链POS网络而言,非常棒。实现起来比较简单直接。其具体算法如下:

微信图片_20200727095839.jpg

这里不做详细解释,需要的人可以查询相关资料。简单地说,就是在POS选举过程中,当你凭借自己产生的可验证随机数进行抽签的时候,可以通过你自己的份额和相应二项式分布来看你落在哪一个区间,从而判断你获得了多少选票。

二项式分布是 n 个相同概率的独立时间单独计算而后相加的一个分布,而且整个分布正好切分整个概率空间。因此只需要看你的可验证随机数在那个空间就可以了(这个部分比较难说清楚,有意者线下探讨)。

那么对于Filecoin而言,参与选举的份额就是你的算力。如果按照前文中说的阶段二的方式,可以再进行细分,那么可以考虑为每一个字节都参与投票。这样一来,参与投票的选举人数量非常大,整个计算不用采用二项式分布,完全可以采用泊松分布来进行计算。泊松分布的计算公式如下:

微信图片_20200727095847.jpg

这里 λ 是自己的份额与预期总选举票数的乘积。在Filecoin中,它就是

 E * mPow/totPow;k 是获得选举权的数量。

看一下上式,是不是很神奇?自然常数 e 再一次用到了 Filecoin 的选举的计算之中。采用泊松分布进行计算是 Filecoin 的一个改进,非常符合Filecoin的特点,同时计算也非常简单。 

采用密码抽签之后,就不能保证每一轮都一定会有矿工拿到出块权了,这很正常,因为每个人都自己掷骰子,出块权的计算是独立的。这样的话,实际上每一轮赢得不同的出块选票的概率有多大呢?简单做一个模拟可以得出下表:

微信图片_20200727095854.jpg

这里空轮的概率是 e^-5。

也就是说,预期大约不到200个高度就会出现一个空轮。看起来还好。而每轮选票数为 3,4,5,6,7分布较多也比较均匀。选票数高达15张的情况也不少,大概万分之1.6。

看到这里(如果你真的有耐心看到这里),您可能会想,e是不是与概率的关系比较大,其实我可以告诉你,π在有些时候也会用到概率计算之中。因为这两个常数就是有牵扯不清的关系。

Filecoin中自然常数不仅仅用于选举

自然常数 e 在选举之中的使用,至此显得非常自然,而且也比较优雅。

同时,Filecoin在Token释放上,也利用 e 进行计算。这个与概率无关,而是与衰减有关。Filecoin 不采用周期性减半的方式进行Token释放,而是模仿放射性衰减,也就是指数衰减。白皮书设计为6年减半。而一般说来,衰减的公式可以写为:

微信图片_20200727095903.jpg

上式可以理解为:初始Token为 N0,随时间推移,系统通过释放,在 t 时间点系统中还应该保留的Token量N(t)的计算公式。

看这里,再一次出现了自然常数 e。当然这里不一定非要用 e 的。但是由于 e 的使用非常广泛了,用起来方便顺手。所以基本上现在这是一种统一的用法。

声明:此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。本网站所提供的信息,只供参考之用。

点击阅读全文