拥抱大数据时代
——读《大数据时代》有感
大家好!今天我和大家分享的是,阅读《大数据时代——生活、工作和思维的大变革》这本书的一些感受。不当之处,敬请指正。
大数据时代已经来临
正如作者维克托·迈尔·舍恩伯格指出的那样,大数据开启了一次重大的时代转型,就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发。
这种说法似乎让人觉得有些摸不着头脑。什么大数据?什么大数据时代?在哪里?怎么看不见。其实,即使不知道什么是大数据,我们的生活已经与大数据密不可分。
举个例子,大家立刻会感受到大数据就在身边。触屏手机差不多人手一部,触屏手机还有一个名称叫智能手机。所谓的智能其实体现在丰富的移动应用软件上,这些应用软件在业内被称作移动APP。每款APP背后差不多都有大数据的影子,UC浏览、百度地图、拉手、美团、墨迹天气、阅读、游戏、移动QQ、微信、微博等各种APP,都在收集和使用着海量数据。用Google搜索一下关键词“大数据”,会有近47,700,000个结果,而且还在不断增长。
再举个例子。2013年4 月15日,美国波士顿马拉松爆炸案发生几小时内,数以千计的在场群众将事发现场拍摄的照片和视频放到公共网络平台上,这些照片和视频图像来自各种
1
相机、手机和平板电脑。不到一天时间,嫌犯就被确认。又过了一天,两名嫌犯在前往纽约,准备再次做案的路途中被追捕,1死1伤。 这是历史上第一次反犯罪机构的专业能力与社会大众汇集的海量信息及时结合,在与犯罪份子的时间竞赛中取胜。
再举个例子。打车软件是一种比较典型的大数据应用,受欢迎程度远远超出政府和出租车公司的想象。目前国内发达地区常见的打车软件有嘀嘀打车、快的打车、摇摇招车等。因为与行业规定有所冲突,5月下旬,深圳交通管理局下发《关于加强手机召车软件监管的通知》,规定“已经安装手机打车软件的驾驶员必须卸载,不得继续使用。”此后北京、上海、武汉、杭州的交通管理部门也表示,将严格禁止出租司机与乘客达成价外加价的行为。这个刚刚受到资本青睐的行业看上去随时都有可能戛然而止。而在大洋彼岸的美国,政府试图通过法规条例来让Uber(一家提供手机应用叫车服务的公司)变得非法时,用户曾向市议会成员发难,并发送了数千封抗议电子邮件。面对不可逆的创新技术应用潮流,用户的选择为市场真正需要的东西创造了成长环境。经过一年的争取,Uber终于成为纽约市首个被许可提供手机应用叫车服务的公司。
从这些例子中,我们可以看到大数据在商业、生活、娱乐、公共安全等领域中正在被广泛应用,并产生巨大影响。
什么是大数据?
2008年9月4日,美国《自然》杂志就如何处理海量数据,作了一个名为《BIG DATA》的专题,第一次提出大数据的概念;而实际从事大数据技术研究和应用的Google公司当时已成立10周年。通常的观点,大数据是指海量资料,规模巨大,无法通过目前主流软件工具在合理时间内达到收集、管理和处理的目标。《大数据时代》一书认为,大数据同时具有数据、技术和思维三层涵义,也就是说,除了代表海量数据之外,也指收集、存储、分析
2
等相关技术,以及大数据背景下的新思维方式。
大数据具有4V特点:Volume(体量)、Velocity(速度)、Variety(多样)、Value(价值)。大数据中非结构化数据增长迅速,体量庞大;大数据要求得到实时处理,即刻见效,而不是批量处理,事后证明;大数据中数据形式多种多样,除了数字数据之外,还有大量文本、视(音)频、图片等;大数据中有很多不相关的信息,必须借助智能化分析、机器深度学习等大数据挖掘技术,才能实现真正价值。
为了更形象地了解所谓的“大”,我们可以看看计算机中关于数据测量的单位,常见的有MB、GB、TB,U盘、硬盘容量通常以GB为单位,TB则是机房中磁盘阵列的容量单位;更大的单位像PB、EB、ZB、YB,在日常生活中就少见了。《红楼梦》含标点87万字(不含标点853509字),1GB 约等于671部《红楼梦》;1TB 约等于631,903 部;1PB 约等于647,068,911部。中国国家图书馆藏书为2631万册。中国最大搜索公司——百度公司,每天处理的数据量将近100个PB,相当于5000个国家图书馆信息量的总和。
大数据可以干什么?前面说过几个大数据应用的例子,实际上,大数据可用的地方远不止如此。按照舍恩伯格的观点,大数据最核心功能在于预测,即把数学算法运用到海量的数据上,预测事情发生的可能性。世界上很多公司和机构多年前就已经开始采用相关技术提供服务。如,亚马逊可以向我们推荐想看的书,谷歌可以为关联网站排序,Facebook知道我们的喜好, QQ可以帮我们推荐可能认识的人。当然,同样的技术也可以运用到疾病诊断、推荐治疗措施甚至是识别潜在犯罪分子上。最近,百度知道推出的一项在线问诊功能,可以帮助用户在数以百万次计的问诊中,查找与自己疾病症状相似的结果。
大数据发展动态是什么样的?用《大数据时代》一书中的话说,大数据就像一个神奇的钻石矿,当它被发掘后仍能不断被赋予新的价值。它的真实价值就像漂浮在海洋中的冰山,
3
第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。IBM、微软等公司在2006年以后开始重金收购数据存储、分析等相关技术公司,布局大数据业务。2009年,美国政府建立data.gov网站,向社会开放政府持有的相关数据。2011年5月,MGI(麦肯锡全球研究院)发布《大数据:创新、竞争、生产力的下一个新领域》,大数据开始倍受关注。2012年1月,瑞士达沃斯召开的世界经济论坛上,大数据成为主题之一,会上发布《大数据,大影响》报告(Big Data, Big Impact) 宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。2012年3月29日,美国奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,这一倡议标志着大数据已经成为重要的时代特征。
大数据为文化管理指出新路
大数据在诸多领域绽放光彩,而且前途一片光明。那么能不能在文化行政管理、文化服务等方面尝试引入大数据的理念和技术呢?回答这个问题之前,先说一个花絮。2012年6月,有一本名叫《大数据》的书出版,10月8日,时任广东省委书记汪洋视察广东省财政厅时以《大数据》内容为纲发表讲话,汪洋说,“休息这几天,我看了两本书,其中有一本是一个美籍华人涂子沛写的《大数据》,看了以后非常有启发。我推荐你们全厅干部都看一下这本书,研究一下大数据时代。”谈到大数据对政府部门的重要意义时,汪洋说,现在大数据战略被认为是世界下一个创新、竞争和生产力提高的前沿,将来引导我们政府前进的是基于实证的事实,而不是利益集团在政府决策过程中施加的影响。我们基于这些数据说话,将使政府更有效率、更加开放、更加透明。在汪洋的推荐下,“大数据”最终进入广东省政府的推动计划。2012年11月,广东省制订了《广东省实施大数据战略工作方案》,广东成为率先在全国推行大数据战略的省份。
这个小故事说明,在政府部门引入大数据理念是可行的,而且很多地方已经着手在做。在读《大数据时代》期间,我也常常思考大数据如何在文化行政管理部门及服务单位应用,
4
形成了一些不成熟的想法。如,想象过针对文化市场、遗产保护、公共文化服务、文化艺术、文化产业等业务块面,分类进行相关数据整理,实现数据化(不同于数字化)管理,定期发布,增加透明度,同时提供挖掘利用;想象过对网站每个页面的访问情况进行跟踪和统计,分析出哪一类的信息更受关注(这一点已经可以看到),进而为管理工作提供决策参考;想象过结合LBS(基于位置的服务)技术,开发相关移动APP及服务网站,为全省群众文化辅导考核管理等实现技术支撑;想象通过分析图书馆借书记录、持证读者分布,对不同地区不同读者的阅读需求做出预测、推荐……。
每个人每一天都在享受着大数据带来的便捷,同时每个人也在不断提供着大量的数据信息。但是,就像生活水里的鱼不知道水的存在一样,生活在数据海洋中的我们,对周围海量数据的存在也有一点不自知。一旦我们有意识去研究,并以开放的姿态拥抱大数据时,世界将从此变得不同。
谢谢大家!
5
参考资料
1.《Bigdata: The next frontier for innovation, competition, and productivity》 McKinseyGlobal Institute,2011
2.《大数据:你准备好了吗?》,Oracle公司,贺辉群
3.《大数据时代》,阿里研究中心,张文涛
4. 《大数据引领我们走向数据智能化时代——BigData专题报告》 ,国金证券,易欢欢
5.《大数据时代的三大发展趋势及发展方向》,国金证券,赵国栋
6.《四大杠杆:商业巨头是怎么玩转大数据的?》 http://tech2ipo.com/56302
7.《媒体都在鬼扯“大数据”,如何发掘大数据的潜力?》http://tech2ipo.com/55610
8.《白话大数据》http://tech2ipo.com/59860
9.《我的征途是数据之海:大数据时代来袭》http://tech2ipo.com/54543
10.《数据革命带来的大变革前夜 中国唯更开放》http://www.donews.com/it/201306/1516267.shtm
6
因篇幅问题不能全部显示,请点此查看更多更全内容