社会正处于工业经济向数字经济的过渡的时期,典型的现象:不论实体经济体还是以互联网企业为代表的虚拟经济体,都在加快利用大数据、人工智能、区块链等技术,以期做到全面的数字化升级,达到提升效率、降低生产成本和风险的目的。
一、数据技术是数字化升级的基础
技术之间是相互关联和依存的。大数据是大规模处理数据的技术组合体,人工智能是多源异构数据知识提取的技术组合体,区块链是确保高价值数据存储达到共识的技术组合体。它们都是技术的组合体,底层封装着已经成熟的不再被人们追捧的技术,比如通信协议和硬盘技术。
二、产业数字化是个工程问题
技术相互交错,配以提升效率、降低生产成本和风险的目的,共同支撑了如今各产业数字化升级。但远远不够,还存在工程性的问题——产业如何数字化?
从工程的角度看,技术已经做好了准备(尽管还有各种问题,但已达到可期状态),剩下的大致有3个问题:
输出:产业数字化的目的,该被转化为何种输出?这是一个系统的功能层,包括交互形式,功能质量评估指标。
输入:数据作为生产资料,如何被沉淀和清洗?期望达到什么输出,反推出需要什么数据,然后看如何把这些数据沉淀和清洗。
处理方式:根据输入数据的形式和输出功能的需求,决定采取何种存储,何种模型,何种架构
可以看出,这是一个逆推的过程,符合典型的工程方法论——从结果推到出过程,并一步步从开始实现过程,得出结果。数字化工程一定需要对产业各环节有足够多的了解,才能切实解决问题。因此,如果一个产业中的企业没有数字化工程能力,就需要借助外部大数据公司。这些没有实体产业的大数据公司,也面临着无法规模化的困境(美国大数据独角兽Palantir同样面临跨产业的规模化问题)。
三、数据往往不能自给自足
从产业的角度,每个企业都属于一个产业,除了用工程的方式解决自有数据的整合外,需要的数据往往不能自给自足。产业中其他环节的数据,跨产业的数据,都是一个企业要实现数字化升级需要的。而这些数据分布在其他企业的系统中,如果在数字化业务中需要这些数据,会面临不小的挑战:
其他企业有什么利益点,吸引他们将数据共享?
共享数据的企业,害怕数据共享衍生出来的责任问题?
能否给出清晰的数据需求,让企业能够按需求治理数据?
当前国内法律仍未给出准确规范。在2018年大数据博览会上,大部分论坛都提出了”政府能够引导立法,产业界积极实践,梳理利益模式和应用模式“的期望。已有不少大数据企业,正在帮助各产业进行数字化升级,也积累了很多工程上的经验。关于数据流通或交易,也有企业提出了自己理解的“三权理论”、用区块链等技术来为流通确权等想法。但毫不夸张地说,产业界全都正摸着石头过河。
这应该还会是常态,愿意承担风险的企业杀出一条路来,获得先发优势。法律什么时候会跟上,以促进行业规范快速发展,难以说清楚。
四、数据伦理的关键——企业和人的数据权利平衡
数据的来源可简单分为2种:人为产生&机器产生。而机器如传感器等产生的数据,有时也跟人有关(比如POS机、摄像头),也有纯自然数据(比如,卫星产生的土地、公路等摇杆数据)。数据是产业数字化升级的核心生产资料,但数据有伦理问题:任何企业所拥有的数据,只要跟人有关,就涉及数据权利的问题。企业和个人用户,对于数据分别拥有什么权利?
GDPR是目前为止最严格的个人隐私保护法,从字面解释来说,几乎完全抑制了数据的跨企业流动。这对产业数字化升级来说不是一件好事。
同样,国内的法律仍未给出准确规范。但践行国家大数据战略和政务数据开放的原则,产业界众多公司正积极探索。愿意承担风险的企业通常的做法是:
**- 从实践中总结理论,划分个人和企业的权利,为政府立法和协会组织提供案例
打造实现用户知情权、监督权、获益权的产品和服务。或许不会实现人权角度的“用户完全控制自己的数据”乌托邦,但用户确实有可能比过去20年能更了解和支配自己的数据,甚至因数据而获益。注:区块链在这里或许真能起到积极作用**
五、数字经济和智能时代的宏伟蓝图可期
数字化、数据化、信息化和数据资产化,似乎是必然演进的路径,只是时间的早晚问题,是渗透的程度问题。如何在重产业知识依赖情况下实现规模化,如何实现跨企业的数据共享,如何处理好企业和用户对于数据的伦理问题。有方向,有挑战,有机遇,更有蓝图。