1
为什么需要IPFS?
从根本上讲,IPFS是一个简单而又大胆的目标:通过替换HTTP重新架构整个互联网。
网站上的地址通常以HTTP为前缀。IPFS的目标是完全取代HTTP协议作为Internet的基础层。
实际上,我们当前的Web版本有时称为Web2.0,而IPFS是其自然发展的Web3.0。
为什么要重新架构整个网络?
实际上,您可能已经受到HTTP缺陷的影响,只是不自知。
当前的互联网无法支持即将到来的创新和用户浪潮,因为互联网未来的发展会需要更多带宽。
例如人们开始追求更高画质的视频,为此我们已经需要快速的互联网,8k、16k甚至更高。
当对网络的需求不断增长,成本就会更高。
像Facebook,Google和其他公司这样的公司,花费数十亿美元来支持其Web架构并将其内容提供给您。当然,成本也通过各种方式分摊给用户的,由于这种障碍,许多本来对人类有用的应用程序却无法实现。
但是,大文件并不是影响网络的唯一问题。连接到Internet的设备的激增是另一个重要的原因。
现在不只是电脑和手机等数字设备可以连接网络,甚至家庭电器等一切接通电的机器都能通过互联网连接起来。随着越来越多的设备连接到Internet,为这些设备提供服务所需的开发也随之增加。
连接到互联网的设备数量在未来会继续增加,物联网的新概念开始走入人们的生活中。物联网旨在连接您周围的一切,无论是汽车,房屋的门,电灯,电表还是其他。
物联网的迅猛发展,将是对现有互联网的挑战。
我们需要一种可以成倍扩展,高效且快速发展的替代方案。这便是需要IPFS的原因。
你是否有提出过疑问,我怎么知道我要的内容是我要的内容?假设某个实体篡改了图像怎么办?
乍看之下听起来似乎微不足道,但是随着技术的进步,诸如伪造品之类的问题。
然而,还有比这更多的直接问题。我怎么知道我连接的网站是正确的网站,而不是恶意黑客的网络钓鱼攻击?当前,我们已经建立了一个证书颁发机构系统来防止此类事件的发生,但是它们要求信任第三方。
以Facebook为例,当中心服务器出现BUG的时候,页面便出现404。根本问题是当前的互联网是基于客户端-服务器模型。
即客户端(浏览器)向中央服务器(例如facebook的服务器)请求数据,然后服务器提供数据。
当没有问题发生时,这种方法都非常有效。但是,当大量用户突然涌入,或者自然灾害,黑客入侵,甚至是代码中简单错误时,服务器非常容易崩溃。结果便是没有人可以访问他们的内容了。
通过这一次疫情可以发现,通过互联网的追踪,可以随时知道每一个人的出行轨迹。这样的便利如果被非法使用,将会导致大量隐私的泄漏。
显而易见的是,近些年来暴露出来的隐私泄漏问题非常多。
这就等同于,每个人在互联网上社交,在银行上赚钱,在互联网上玩游戏,在互联网上工作。你会发现,只要连接互联网,将没有隐私可言。
互联网审查可能意味着两个方面:
1、内容可能由大型公司甚至政府审查;
这等同于让其他人通过决定哪些内容是可以允许发布的。
2、从互联网上检测个人能力。
想象一下,一个内容创建者与YouTube,Medium或Twitter截然不同,他可能会失去生计。
想象一下,您已从领英linkedIn中删除,您将无法再联网,假设您无法使用电子邮件。随着互联网变得越来越普遍,与互联网断开连接的后果也越来越大。
IPFS是将各种创新融合在一起的解决方案,它将解决人类许多技术问题。
从这个意义上讲,它类似于比特币,除了它不会彻底改变金融,它会彻底改变互联网,进而改变我们的生活。
2
IPFS的安全性:无需信任任何人
IPFS消除了信任第三方的必要性,也就是说所有IPFS数据都是自认证的。这样的修改,如何保证用户确定他收到的数据是可信任的呢?
这种自我认证的成功秘密来自——哈希函数。
如果输入的数据,将输出一个独特的指纹叫的哈希值。
这些功能以这样的方式进行工程设计,即很难找到两个产生相同结果的数据,以至于在实践中不可能对原始数据进行伪造。
哈希的特别之处,就像用于记录指纹对人类的意义一样重要,它可以准确的找到一个人,并且它是不可复制重置的。这意味着散列是唯一的标识符,不会损害原始数据的隐私性。
它与IPFS有什么关系?
在HTTP中,当用户进入网页时,浏览器将在网页服务器的位置上获取数据。该位置可能被黑客欺骗。也许有人可以拦截请求,而不是发送博客,而是发送一个钓鱼网站,以获取用户密码。
但是使用IPFS,用户将不会输入HTTP的网址,而是要求看起来像这样的哈希:QmTkzDwWqPbnAh5YiV5VwcTLnGdwSNsNTn2aDxdXBFca7D。
假设黑客拦截了对QmTkzDwWqPbnAh5YiV5VwcTLnGdwSNsNTn2aDxdXBFca7D的请求,并试图发送一个恶意网络钓鱼站点,则用户可以通过哈希函数运行接收到的数据,将接收到的数据的哈希值与请求的哈希值进行比较,然后拒绝接收到的数据哈希值不匹配。
可以有效预防黑客攻击。
然而,这种方案并不完善,因为始终保持数据完整性。
如果用户请求法律文件,则该文件的单个字母不会不同。如果用户下载程序,则不会有一个1或一个0。如果用户请求图片,则每个像素都将位于完全相同的位置,这是伪造很深的时候的一个有趣属性,在这些地方很难确定图片的真实性。
与前面提到的LOCATION寻址相反,将重点放在使用散列函数获取数据上被称为CONTENT寻址(因为对内容进行了散列)。
由于用户根据其内容的哈希值而不是其位置来查询数据,我们如何知道该在哪里根本找不到这些数据?数据在哪里?到底在哪个服务器上?
答案是数据可以在任何地方。IPFS是任何人都可以参与的对等网络。您可以将其视为BitTorrent,该协议通常用于分发盗版电影和歌曲。
而且由于任何人都可以分发数据,只需从地理位置附近的其他人那里获取数据,反之亦然。就地理位置而言,如果数据就在用户旁边,将会大大提高效率。
假设有一个房间,里面有100个HTTP用户和100个IPFS用户,他们都想访问同一个网址,他们的经历会有什么不同?
1、HTTP用户
这100个HTTP用户将向该网址的位置发送请求。这些请求中的每一个都会通过互联网,通过一堆路由器反弹,直到最终到达服务器,然后从服务器发送所请求的数据,然后将其反弹再次通过一堆路由器返回,最终到达了用户的手中。
2、IPFS用户
从IPFS用户的角度来看,请求是什么样的?
100个IPFS用户向IPFS网络请求数据散列。如果房间里有人拿着文件怎么办?为什么要麻烦通过路由器并到达可能的远程服务器?地理位置接近的用户可以与另一个用户共享它,并且该用户可以与另一个用户和另一个用户共享它。
在这种情况下,内容寻址显然是效率更高的位置寻址!
3
未来是去中心化网络
俗话说,不要把鸡蛋放在同一个篮子里。可悲的是,这正是现代互联网的组织方式。所有的鸡蛋和数据都存储在这些巨大的篮子(服务器,客户端必须连接到这些篮子)中。
这种安排使系统变得脆弱,因为服务器出现问题意味着客户端根本无法访问任何内容。这也意味着,如果突然有大量的鸡蛋饥饿的鉴赏家涌入,篮子的吞吐量将不足以供所有人食用。我们可以想象有很多人在等待被喂饱,每个人都必须等待前面的人来摘自己的蛋。
因此,IPFS的秘密就是不要将鸡蛋放在同一篮子里。
IPFS是分布式网络,因此,它属于BitTorrent等其他点对点协议的范畴。
由于网络不依赖于单个服务器,因此计算机可以联机和脱机,并且网络仍然可以运行。
例如,当你想连接到一个网页,但是服务器已关闭的情况。你是无法连接,因为连接取决于可用的服务器。
如果这个网页是建立在IPFS的基础上,数据可以使用IPFS上的某种加密方案,其中用户拥有访问其私有数据的密钥,则可以自由访问其他用户的公共数据。
在这种情况下,无法阻止用户连接到该站点并访问其数据。实际上,如果一个对等实体脱机,则还有另一个可以拥有数据。
只有使用IPFS才能实现。
同样,如果大量用户想要访问我们当前版本的Web中的同一文件,则可能会导致大量的需求激增,这可能会使服务器筋疲力尽。但是在IPFS中,该文件可以点对点共享。对等方拥有文件后,便可以将其共享给另一个对等方。
即使在需求很高的情况下,也始终可以访问该文件。
这就像BitTorrent一样,由于在同级之间共享文件的数据,因此可以更轻松地访问流行的文件,而不是更少的文件。
说到BitTorrent,这将使我们引向下一个重点。
由于没有要关闭的中央服务器,因此管理机构没有要攻击的单独实体。因此,如果一个停止,则有另一个对等节点替换它。而且,简单地攻击所有人都是不可行的。
当然,这意味着IPFS可以成为非法活动的避风港。已经提出了一些想法来抑制分布式文件网络(例如黑名单列表)的负面影响。但是这些解决方案是否会有效果,还是有存疑。
例如,如果某人将非法文件的哈希表列入黑名单,那么会阻止某人简单地更改像素并因此而改变哈希表呢?
可能会产生无限数量的非法哈希,这使黑名单列表变得不切实际。
尽管如此,IPFS还是带来了一个重要的好处:审查制度的抗拒性。
由于任何文件都无法删除,所以虚假信息是否会淹没大量信息?是否说谎会掩盖真理?
我个人对此事的信念是,利好的发展有上升的趋势。
某些创新可能会与IPFS结合使用,以验证有关一条数据的真实性。如果我们将重要的IPFS哈希保存到以太坊等区块链系统中怎么办?
这将意味着散列还将与真实且不可更改的时间戳相关联。我们可以在可验证的时间内将无法审查的文件关联起来。
现在网络上虚假消息非常多,不管是个人、或者公司等,都以这种方式修改图片和视频以扭曲现实。面对大量相互矛盾的图像和视频,要确定真相变得越来越困难。
面对大量相互矛盾的图像和视频,要确定真相变得越来越困难。但是,如果我们对原始图片或视频的文件加了时间戳,会怎么样?
我们可以在时间戳记之后证明该文件的任何修改版本。这样可以更多地获得可验证的事实。
完