声明:本文旨在传递更多市场信息,不构成任何投资建议。文章仅代表作者观点,不代表火星财经官方立场。
边肖:记得要注意
撰写人:怀特项目组
区块链是多方共同完成总账记录过程的技术。许多参与的计算方将设备连接成网络,形成一个开放的区块链网络,如比特币、以太坊、博卡等。所有计算参与者共享资源供开发者和用户使用。在这样的操作规则中,“数据流”贯穿了每一个操作步骤。从底层节点的通信到块打包、复制和确认,再到应用层的事务传递。从网络中的转账交易到各个节点的余额、账户数据、数据上行。确切地说,与传统数据库中的数据处理相比,区块链的数据处理范式是最大的优势。这里不得不说,在漫长的互联网周期中,数据已经被企业公认为其价值的核心。与此同时,大量的数据处理和管理问题亟待解决。幸运的是,许多区块链项目正在尝试使用区块链技术,并将其与其他技术相结合,以形成基于区块链的数据解决方案。例如,区块链的数据结构中增加了多种结构设计和各种计算形式。在本文中,白计划将逐一阐述项目中数据处理的三种范式,包括:数据结构中最常见的范式,所说明的案例是预言性的network Chainlink;基于硬件的数据流范式,图示案例为Jasmy,日本物联网项目;以及目前最难的基于可信计算的数据流范式,项目是数据可信计算网络PlatON。这三种范式在未来一定会大规模改变数据市场。
1.基于区块链数据结构的基础和高级区块链网络的数据流流程,节点发现事务(数据),然后将事务打包形成块,然后打包后的节点开始广播,参与共识的节点开始复制块保存(或者共识节点确认保存后其他所有节点开始复制块)。这样,区块链上的数据就变得可信(公开透明,不可篡改)。数据存储在块中,因为块大小有限,所以块中往往充满了小字节信息,如比特币转账交易、以太坊转账和合约调用消息等。我们可以用其他信息代替这些交易信息,比如商品溯源、流通信息等。也可以用任何可以公开的信息代替,比如广告点击、公益捐赠使用情况、银行共管账户信息等。然而,由于其他信息的大字节,诸如交易数据的小字节信息更适合存储在块中。经过区块链的多方确认,这些公开数据是可信的,可以读取和使用。目前,这种模式应用最广泛的例子是Oracle Oracle Predictor。例如,链环。
2.Chainlink的先知网络数据结构我们都知道Chainlink已经成为了很多DeFi应用的价格输入源,因为其网络中提供的feed价格足够安全可靠。根据Chainlink的技术文档,Chainlink网络连接着很多价格输入点,比如Kalkenrates,每一个输入价格都是由连接到Chainlink的几个独立的Chainlink Oracle操作者进行更新,汇总后在链条上进行处理。
Chainlink的价格处理模型
经过链上的处理,会形成可信的价格数据,可以被DeFi应用发现和使用。根据使用数据的次数,将链接令牌作为奖励支付给网络,提供feed价格的价格提供者最终获得价格带来的奖励收入。在这个模型中,从链状网络外部输入的数据,经过汇总后在链条上进行加工,最终传递给需求方实现价值。在这个过程中,有很多关键的部分,比如每个价格都是由去中心化的Oracle更新的。对于每个价格提要,我们需要得到分散在很多地方的价格,最后汇总。此外,每个价格供给的分散预测者的数量是不同的。例如,在ETH/USD定价中,有21个预测机定价来源。为了随时更新最准确的数据,应对饲养价格的智能合约,21台预言机中至少有14台提供了价格数据,才能顺利更新数据。上述操作中的数据是否正确可信极其重要,否则就会出现劫持预言机攻击DeFi应用价格的事件。所以处理异常需要有一定的规则,包括:取平均价格;如果价格偏离较大,重启价格更新;有规定的价格汇总时间等。Chainlink塑造了基于区块链共识实现可信数据(简单数据)的最佳范例,DeFi的崛起对预测贡献巨大,为DeFi塑造了基础安全,将区块链数据结构输出为流支付的商业模式。当然,这也是一种去中心化的商业模式。
3.基于硬件采集的数据流Chainlink模型应用广泛,但在上面这个最基本的结构中,如果我们仔细推敲,可以明显看到一些不足,比如数据经过链处理后变得可信,但“数据缠绕”和缠绕前的过程是不可控的。更大的问题是Chainlink处理的是简单的数据,也就是字节数小,公共性强的数据。所以这种数据模型可以做一些流程转换,最终创建一个数据流程:终端(数据源)的加密——数据存储——存储数据哈希链——链上的数据流。这个过程可以描述为基于硬件、分布式存储和区块链网络相结合的数据流。目前擅长物联网网络的融合应用。今天我们的图解例子是Jasmy,起源于日本的物联网网络。该网络曾与丰田Toyota Motor和出行服务商Witz合作过一次,通过平台模型处理智能汽车的终端数据,在避免个人信息合规的基础上挖掘数据价值。让我们剖析一下它的数据处理范式。首先,物联网终端,包括智能设备、手机、电脑等具有终端计算能力的设备,可以通过边缘计算的方式管理终端中的数据。包含加密和一些管理的集成。
Jasmy管理硬件终端的例子
这部分因为要管理大量的终端设备,需要连接物联网设备组成物联网平台,主要负责设备的管理。下一步处理是因为数据类别复杂,在设备端加密。为了实现数据可调用,需要将数据上传到开放的网络环境中,并保证数据可随时查看和下载,但需要控制其所有权和使用权。因此,为了处理大量的数据,它将被应用于分布式存储。最方便的例子是基于IPFS的数据存储结构。完成数据的分布式存储后,在区块链网络中满足与ID、所有权、激励的绑定条件,分布式存储的文件hash也可以存储在区块链中,公开透明。
4.物联网技术融合的数据处理范式这个过程与Oracle实现的形式最大的区别在于,使用物联网终端完成边缘的加密,基于末端的加密完成后续的流转。Jasmy的流程如下:1。物联网平台负责管理终端物联网设备,利用Jasmy的SKC服务和SG服务实现终端的数据加密和管理。2.终端的数据存放在Jasmy的个人数据柜中,进行分布式存储。在此过程中,SKC和SG技术可以将数据定位到个人ID或设备ID。3.分布式存储的文件哈希是链接的,链接上的ID与文件哈希绑定。4.基于区块链网络的数据交易应用可以传递数据价值,即交换数据所有权和数据使用权。5.数据用户可以调用分布式存储个人数据柜中的数据。得益于Jasmy的几大特色,Jasmy在硬件领域拥有日本硬件厂商索尼的加密技术,在物联网领域拥有供应链能力,这是其他普通区块链创业者可以轻易实现的。例如,SKC的核心技术是非接触式芯片加密技术FeliCa,该技术已在日本使用多年,该技术正在为索尼产品提供安全保障。这恰恰是Jasmy结构中新增的计算方法。此外,Jasmy还可以和硬件厂商一起推出具有终端安全和计算能力的设备参与网络,比如Jasmy推出的Jasmy Secure PC。这样的框架已经开始为日本企业服务,包括丰田、威茨、VAIO等。
Jasmy塑造的数据价值实现模式
与之前的Chainlink Oracle形式相比,Jasmy的优势在于物联网终端的加密和个人数据柜分布式存储的实现。如果不考虑分布式数据存储,Chainlink也在走向硬件辅助数据源安全的网络架构,它在尝试使用具有可执行安全环境的硬件作为Oracle数据源,实现数据终端的可信。和Jasmy在硬件端的做法如出一辙。
5.基于数据可信计算的数据流可以从Jasmy的设计模型中看出。在区块链的简单模型上经过一些技术上的加持,它可以取得出色的效果。如果融合更多的技术,能达到什么样的效果?对于数据来说,数据最需要的是所有权的归属,以及基于数据所有权的数据的可靠流动,也就是保证数据所有者权益的一系列要求,比如数据实现的可用性和不可见性。这种范式可以定义为基于可信计算模型的数据流,分为分布式存储、数据所有权定义和可信执行。这部分由柏拉图解释。在PlatON的网络结构中,有一层layer2单独用来实现可信计算。layer2可以理解为链下的部分,负责计算和存储。所以铂顿的数据可信计算也是在layer1的区块链结构之外实现数据处理,然后利用区块链网络带来的所有权和激励。
在上图中,我们可以看到,在layer2的计算网络中,有一个状态,它是数据存储的载体节点,在这个结构中,它是一个账户模型和数据存储的融合应用。根据PlatON的技术文档,在状态检索中,虽然PlatON使用了以太坊的账户模型来存储数据,但是因为数据量大,所以状态数据并不是存储在Patricia tree(以太坊的存储结构)中,而是单独存储在另一个不存储历史状态的SNAPDB(数据库)中。柏拉图认为,链式存储需要充分考虑成本,只有需要所有图书达成共识的有价值的信息才应该存储在公共图书中。有价值的信息包括块、交易和账户数据。
柏拉图的数据存储模型
所以柏拉图的存储可以分为账户数据存储(statedb)和快照存储(snapshotdb)。显然,一个位于链中的第1层,另一个位于第2层。但是,在第二层中,数据被额外处理以充分发挥其数据计算特性。处理由可信计算设备和技术完成,包括可验证计算(VC)算法,可以实现非交互式认证,以及安全多方计算(MPC),结合秘密共享(SS)和同态加密(he)实现隐私计算协议。此外,还有MPC虚拟机进行可信的智能合约计算,这是全网智能合约运行的基础。通过这些layer2层的实现,最终实现数据流和数据应用时,不会泄露原始数据,可以进行协同计算和结果验证的计算。需要注意的是,连接到第2层的计算设备需要特殊的计算能力,才能执行某些应用场景的要求。它需要超强的计算能力和可信度。因此,铂顿将使FPGA/ASIC开发的高性能计算设备接入网络,以满足这一过程的需要。对比Chainlink和Jasmy两种范式,柏拉图的差异是显而易见的。在技术融合的应用上,普拉顿投入了巨大的研发力量;努力进入第二层,这是更具挑战性的土地技术。
6.三种数据处理范式的应用分析以上三种范式是基于区块链的主流数据处理方法,但是它们的应用情况如何呢?首先,毫无疑问,第一种简单模式的应用最为广泛,因为它针对的是金融领域。就像在DeFi的发展中,Chainlink发挥了很大的作用,以此为代表的模型也是溯源链的应用。
Chainlink的某些节点可以提供喂食显示。
而Oracle是针对简单高频数据的范式,简单易用,但不擅长解决互联网社会的遗留问题。比如关于数据隐私,甲骨文更开放,更值得信赖,但完全不擅长独特的数据部分。基于物联网的数据流是一种明显面向生活和商业化的数据处理范式。比如Jasmy的应用,已经针对互联网app数据,企业办公数据,硬件生态的一些数据。这是一个从用户端到平台和商业生态流都有设计的范式。这也是目前应用最广泛的范式结构。最后,可信计算是一种主要面向数据资产商业化的范式。这部分最难解决的是数据在商业化数据的协同场景中的可得性和不可见性,是海量数据的可信任度。它不仅需要技术,还需要可信的技术、计算能力和存储。所以这三种范式各有千秋,甲骨文的范式最适合加密货币领域的DeFi。比如Jasmy的应用边界最广,可以切入简单财务数据以外的应用领域。技术相对完善,但还需要更详细的数据定义和规范。它可以向第三范式发展。第三种数据范式在技术上是可行的,但落地应用还需要一个过程,其中数据权益更细化的定义和规范、高并发和高速计算处理的技术实现是落地应用更难的部分。
7.数据写在最后的问题比老虎还凶,但解决方案在创新者的实践中已经做好了准备。一旦区块链项目的落地进程加快,上述三种范式将创造更多的商业价值。比如Jasmy对企业数据进行了秘密设计,对终端数据进行管理,可以增加边缘数据的可用价值,提高企业数据的利用率。柏拉图可以实现数据的不可见性,然后可以应用在AI隐私计算领域,帮助机器学习过程中的数据应用。这个过程是很多行业的突破,比如AI医疗、AI出行、AI互联网应用等等。几年前,当我们感叹AI技术的出现时,我们会说“未来已经来了”,但笔者认为,现在,在解决了数据问题之后,我们真的可以理直气壮地说“未来已经来了”,因为这是一个数据属于拥有者的新未来,是一个互联网数据混乱时代无法代表的新未来。