暴走时评:现在人们的生活越来越离不开数据的分 析,从组织运营,到医疗方案决定,甚至是在确定运动员训练路线中,都会需要依靠数据来进行方案制定。但是,我们如何去了解到我们真的用到了这些数据呢?数 据信赖的问题与技术无关,与学术无关,但它绝非可以忽略的问题。本文将对此进行深入探讨。
翻译:spring_zqy
如今所有人都生存在大数据时代,我这么说不是在吓你。
数据分析和数据驱动下的决策在越来越多领域中都是黄金标准。从组织运营,到医疗方案决定,甚至是在确定运动员训练路线中,数据都越来越占据着生活的核心。
很多人都觉得这是必须的啊,对此我想问一个天真的问题,我们如何去了解到我们真的用到了这些数据呢?
这里我要澄清一点,我没有在质疑使用数据来优化决策这一行为。相反,我认为这恰恰是我们应该做的。我的问题也无关数据维护技术。(可以百度一下“数据完整性”、“数据损失”、“数据毁损”等条目,你可以看到有无数标准和最佳范例来解决这些)。
我的问题其实是很基础的。
假如有一个与需要决定的事件相关的数据集,其技术上没有任何问题,那么我们实际上如何来依靠这些内容呢?
建立信任
如果你仔细想想,你可以很快得出我们不得不依靠数据的愿意:纵向整合以及可靠的第三方。
我用两个最简单的例子给大家解释下。
纵向整合包括任何我们拥有组成数据集的整个价值链的场景。就像Fitbit(或者其他相似的活动追踪器),你拥有感应器来生成数据,然后数据生成的时候你就在现场。
一天的最后,你得到的数据会显示你一天的活动,这样你就可以说,“我今天运动的多一点,跟平时的2000步比,我今天走了3000步。”事实上,活动数据集创建中的每一步都由你持有,所以很容易就能接受这类数据的有效性。
可靠第三方指包括任何我们信任生成或追踪数据的某一方,从而来接受数据的有效性。
当我想知道我的网页有多少人访问时,我就查阅谷歌分析。因为我信任谷歌(尽管我会想是否应该信任),我就接受其数据的有效性。
灰色地带
这些例子都很简单,但是数据依赖的问题存在的范围显然很大。
我上面提到的场景显示了,除非我们拥有数据生成过程,否则在我们应该依赖其他方数据前,我们都是被迫去信任的。而当考虑到对物联网生成的数据的依赖时,这种情况的复杂程度就变得很明显。
2007年的一起悲剧中,I-35W密西西比河大桥倒塌,导致13人死亡。这座大桥之后重建,目前合并了超过500个传感器来检测大桥的拉力情况、载荷分 布、震动、温度等等。表面上看,这似乎解决了问题。如果有任何相关迹象,传感器将提前告知我们,我们可以派遣维护队员,防止灾难发生。
但是为了能够奏效,我们需要完全依赖传感器的数据,那么问题来了——我们为什么不呢?
假设有这样一个场景,其中传感器功能出现了问题,然后还不断传递着信息表示大桥没有出现问题。出于简便,我们就假设传感器生成了两类数据:一类是“好”,说明大桥没有任何状况;另一类是“不好”说明我们需要派遣维修队员。
我们可以再设想一下其中没有“数据纵向整合”技术,也就是说物联网传感器由甲公司拥有,而维修队来自乙公司。
如果在传感器传递“好”的信息的情况下,大桥塌了,那么甲公司就负全责——它的传感器除没有传递出正确的信息。
但是,如果传感器已经发送了“不好”的指示,而没有维修队到现场,那么乙公司就担全责。这样一来,甲公司就有足够的动机来“作弊”,通过更改数据集来显示传感器确实有传送预警,是乙公司忽略了。
我之所以用这个让人悲痛的例子,就是为了显示出问题的严重性,而事实上我说的这种情况很容易就在你家电视、洗碗机或其他物联网下的设备应用中出现。
区块链解决方案
根据大型市场趋势与反映——这个很快就会成为所有人都拥有的技术。我还要提醒一点,那就是数据依赖性的问题完全不是学术问题,也不是我们可以随便打上“以后再来担心问题所在吧”这种“奢侈”的标签的问题。
世界各地的执法机构已经在扩展蜂窝数据的使用,来定位犯罪嫌疑犯。
这些被挖出来的数据可以作为支持证据,来指证嫌疑人或者提供不在场证明。而之前在某个案例中,有一个网络工程师被指证杀害了其妻子,他曾试图利用这一技术,通过其对网络设备的访问权限,来伪造其妻子给其通话的迹象,而实际上当时他的妻子已经死亡。
我认为这个数据依赖的问题非常重要,我们需要不断的反思。
正如其发生的那样,我的职位让我不仅可以提出这个问题,而且还可以提议一个解决方案。对我来说,很明显我们已经拥有一个底层架构来决定什么是对的什么是错的,并且在对方间达成共识,而无需自己拥有所有数据,或者是盲目的信任别人的数据。
这个架构当然就是区块链技术了,我认为其整合了许多现有系统,这对于我们将数据依赖提高到新层次来说是至关重要的。
尤其是,我相信为了解锁更多数据的价值,基于区块链的解决方案是非常需要的,下面是我列出的一些领域:
·数据分析
·保险理赔
·记录管理
·监管合规性
总之,数据对我们的生活越来越重要,而我也会反复提到数据依赖的问题。
要解决这个问题,我们就需要提出这个问题,这不仅仅是数据所有权的问题,也不是其他任何一方“可能是可靠”的这种假设问题。
区块链技术将提供一个有效且高度适用的方案,来解决这一问题,而且最终将对数据依赖问题生成一个普遍的标准。
声明:此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。本网站所提供的信息,只供参考之用。