区块链在大数据技术中的运用

(整期优先)网络出版时间:2020-07-02
/ 2

区块链在大数据技术中的运用

赵延博 1 张学杰 2

1. 山东省轻工工程学校青岛工程职业学院 2. 青岛海信移动通信技术股份有限公司

摘要

区块链技术以去中心化分布式账单为主要特征迅速崛起,其能够很好的解决大数据的技术瓶颈,为大数据环境提供安全和信任保障。通过分析大数据技术目前遇到的困境,区块链技术架构和关键技术,区块链技术能够很好解决大数据遇到的技术问题,二者相互促进,融合发展,共同开启美好未来。

一、大数据产业发展和遇到的困境

怎样在新的时代去处理数据,是我们需要面对的新挑战和新机遇。大数据作为一项新兴技术给各行业发展带来机遇,但是也遇到发展困境,一些问题迫切需要解决。

1、数据本身要确保高质量。大数据分析的核心价值在于做出趋势预测,通过数据分析可以做出各种预测,但是预测的前提是准确、完整、一致的高质量的数据。

2、妥善处理信息共享与隐私保护的关系。数据资源的共有共享给人们的生活带来前所未有的高效、便捷、可量化的维度,同时也为数据泄露开启了便利之门。

二、区块链技术介绍

区块链技术起源于化名为“中本聪”(Satoshi Nakamoto)的学者在2008年发表的奠基性论文《比特币: 一种点对点电子现金系统》[1]。2009年初,比特币网络正式上线运行[2]。作为一种虚拟货币系统,比特币的总量是由网络共识协议限定的,没有任何个人及机构能够随意修改其中的供应量及交易记录。

三、区块链技术架构及关键技术

区块链技术架构主要包含三部分,分别为核心应用组件、核心技术组件以及配套设施(如图1 所示)。

5efd7e6e35151_html_125afe4343e3c88b.png

图1

  1. 数据存储

  1. 数据结构:在区块链技术中,数据以区块的方式永久储存。区块的数据结构一般分为区块头(header)和区块体(body),如图2 所示。5efd7e6e35151_html_615e18022fc22f98.png

图2

  1. 数据库

按照数据库的数据结构组织形式来看,一般分为Key-Value型和关系型两种。其中,Key-Value型数据库的数据结构组织形式比较简单,读写性能很高,能支持海量并发读写请求,而且可扩展性强,操作接口简单,支持一些基本的读、写、修改、删除等功能,但不支持复杂的SQL功能和事务性。

  1. 网络协议

区块链网络协议一般采用P2P协议,确保同一网络中的每台计算机彼此对等,各个节点共同提供网络服务,不存在任何“特殊”节点。不同的区块链系统会根据需要制定独自的P2P网络协议,比如比特币有比特币网络协议,以太坊也有自己的网络协议。

  1. 加密算法

  1. 散列(哈希)算法

典型的散列算法有MD5、SHA1/SHA2和SM3,表1对比了这些算法的特点。

表1

5efd7e6e35151_html_9ffbe21a76cef942.png

  1. 非对称加密算法

在近代公钥密码系统的研究中,其安全性都是基于难解的可计算问题的,常用的非对称加密算法特点及其比较如表2和表3所示。

表2

5efd7e6e35151_html_71d43866ce73d302.png

表3

5efd7e6e35151_html_34535543a883b621.png

  1. 隐私保护

目前区块链上传输和存储的数据都是公开可见的,仅通过“伪匿名”的方式对交易双方进行一定的隐私保护。对于某些涉及大量的商业机密和利益的业务场景来说,数据的暴露不符合业务规则和监管要求。

  1. 智能合约

智能合约可视作一段部署在区块链上可自动运行的程序,其涵盖的范围包括编程语言、编译器、虚拟机、事件、状态机、容错机制等。

四、区块链技术融入大数据

1、区块链确保数据安全性

区块链的安全性是由它的系统架构决定的。区块链系统由无数节点构成,系统中的所有节点都拥有一个完全一样的数据区块,即账本,所有节点构成一个去中心化的分布式账本。

2、区块链为数据资源的可追溯性提供保障。在区块链中,网络中的多个节点共同参与了数据的生成和使用记录,并且节点之间会相互检验数据信息的有效性,既可以防止数据被篡改,有提供了数据的可追溯性,同时也避免用户对自己(交易)行为抵赖

3、区块链技术的去中心化保证了数据流通的透明性。明确用户数据来源,保证数据来源的可靠性,并且用户自己可以明确地看到自己的信息流通过程,防止信息被滥用的情况。这样数据的发送和接受方会以及中介都会建立相互信任的关系。

4、区块链破除了大数据的孤岛效应,保障数据流通。区块链分布式账本的本质特性保障了数据面前每个节点用户都是平等的,破除了大数据集中的问题。区块链中的数据运用了密码技术(哈希、数字签名等)保证了数据的唯一性,可追溯性。

5、保证数据交易不可篡改。区块链是建立在密码技术上(哈希、数字签名等)的一种数据库技术,其中每个数据节点之间都相互验证,如果有人恶意修改,就会被验证出来,保证数据交易不被篡改,可以在没有专人监督的情况下准确无误的进行交易,让大数据更好发挥作用,完善社会信用体系。

六、前景展望

2019年10月24日下午中共中央政治局就区块链技术发展现状和趋势进行第十八次集体学习。中共中央总书记习近平在主持学习时强调,区块链技术的集成应用在新的技术革新和产业变革中起着重要作用。我们要把区块链作为核心技术自主创新的重要突破口,明确主攻方向,加大投入力度,着力攻克一批关键核心技术,加快推动区块链技术和产业创新发展。

区块链通过去中心化的方式,创造了互联网虚拟世界的共同治理的体系,也建立了虚拟世界的信任体系。区块链的到来,给实现虚拟世界的共享共治创造了机会,让大数据发挥更大的作用,为人类服务。

参考文献

[1] Nakamoto S. Bitcoin: a peer-to-peer electronic cash system [Online], available: https://bitcoin.org/bitcoin.pdf, 2008

[2] Davis, Joshua (10 October 2011). "The Crypto-Currency: Bitcoin and its mysterious inventor". The New Yorker. Archived from the original on 1 November 2014. Retrieved 31 October 2014.