在2013年刚开始热议“大数据”这个观念的人们,会发现自己不知不觉已落伍过时。2014年的人们顾不上再空谈其概念和意义,他们蜂拥到大数据的各个富矿当中,埋头于各种开发应用。据业内人士预测,大数据技术很快会出现在社会各个领域。
从数据本身来讲,大数据的3个V(volume,velocity and variety/数据量大,输入和处理速度快,数据多样性)都是呈指数级发展的,翘首向上的曲线图明白无误地告诉人们,大数据的下一个数量级(无论叫什么)也将很快到来。一篇名为《2020年的数字宇宙》的研究报告计算出,从2005年到2020年,“数字宇宙”的规模将增加300倍之多,从130EB增加到40ZB,也就是40万亿GB,约为地球上所有海滩上的沙粒数量的57倍。
从古至今,海边沙子、天上星星,一直都是“不可胜数”的同义词,而在大数据时代的今天,它们竟成了不在话下的“小数据”。
大数据技术很快会出现在社会各个领域
伴随数据爆炸式发展,数据处理技术也飞快发展,目前还属于新奇玩意的数据批处理和存储技术,转眼就成了通用的计算基础设施,成了企业数据架构的核心组件。这意味着,目前还掌握在数据科学家手中的专业,将很快成为一般技能,几年之内,人们运用MapReduce和Hadoop等大数据工具,也许就像当年接受MS Office时的情况一样。
再看看资本方面。根据业界权威Gartner发布的统计,被大数据技术所驱动的IT支出,也呈现出成倍增长的势头,到2016年,全球将达到550亿美元,比2011年翻一番。
到了这个时候,再怀疑新技术革命是不是新一轮忽悠已没有意义,无论是资本驱动,还是技术驱动,总之,现实正紧追忽悠,忽悠正变成现实,两者合一了。
Google公司每天要处理超过24 PB(2的50次方字节)数据,Facebook每天收录30亿次点击和上传,Twitter上每天有超过4亿条微博发布。这些领跑大数据时代的公司,当然不是在自娱自乐,它们都极为认真地看待它们每日每时收集到的海量数据,把数据当作其核心资产。虽然巨头们还不急于推出太过惊世骇俗的应用,但人们明白,由于信息构成了世界的本质,一旦大数据开始不受约束地显示其力量,世界的各个领域都将被颠覆。
在目前这个阶段,大数据对个人的颠覆已轻松完成。曾几何时还被视为个人隐私坚固盾牌的三大措施——告知与许可、模糊化、匿名化,在大数据时代都已名存实亡。随着数据量越来越大,数据来源越来越多,个人毫无抵抗地变成了透明体。若一个小小的智能电表都有能力凭它所收集的用电数据推测你的生活方式和起居规律,那又何况你的手机、电脑和银行卡?又何况街上无处不在的摄像头?一家英国报纸曾说过,如果《一九八四》的乔治•奥威尔活到现在,他会发现在他的伦敦公寓60米范围内,起码有30多架摄像头在监视着他的一举一动。世界早已进入了“超级老大哥”时代,个人的自由意志在丧失,个人的生存价值在消散。
大数据对团体的颠覆也轻而易举。一个广为人知的案例是:为了揭示日本相扑赛事中非法操纵比赛的情况,芝加哥大学的经济学家们使用了11年中超过64000场比赛的记录数据,果真发现了消极比赛的发生规律,让业内的潜规则大白于天下。
这还属于很初级的应用。在目前的PB级时代,大数据技术刚刚成熟,还只是小试牛刀,从巨量的历史数据中随意抽取一部分相关关系,建立几个简单的算法模型,预测一下流感的传播、机票的打折、电影的票房、交通的状况…显得很无害,很友善,很为人民服务。但每年数百亿美元所养育的大数据技术当然不只是为了小小的“练习题”,十年之内,大数据的规模就将从PB级跨入EB级(2的60次方字节),再跨入ZB级(2的70次方字节)。坐拥历史上空前规模的数据量和空前发达的数据处理技术,“超级老大哥”们还会满足于小规模、小范围的颠覆吗?
如果能够轻而易举破解日本相扑业内部不为人知的“行规”,那么,从理论上讲,任何一个团体和组织的内部“行规”、隐秘知识、核心机密,都有可能通过海量的公开数据进行破解。而且,面对呼啸而来的大数据海浪,组织的规模和内部的信息封锁都不再构成障碍,安保能力的增长只是算术级的,数据能力的增长却是指数级的,在这场竞赛中,开始可能道高一尺魔高一丈,后来就会道高两尺魔高八丈,可以肯定,大数据全胜!
问题来了。主权国家这个人类社会的利维坦,不过就是个较大规模的组织。十年之内,今天看起来还巍然屹立坚不可摧的国家,也终将面临大数据浪潮的涤荡。就像破解日本相扑赛事,很快就会有人宣布,他利用大数据技术精准地破解了某个国家的特殊行为模式。
希腊的债务危机是如何形成的?日本的右倾化会走多远?伊朗核计划的真实状况如何?“薄荷四国”的提法是噱头还是现实?……这类题目的话语权将很快从政治分析师转到数据分析师手中,前者凭借经验和逻辑所建立起来分析框架,将被后者的海量数据冲得稀里哗啦。
在新加坡国立大学马凯硕教授近日发表的一篇文章中,开篇即提出问题:“中国强硬的新姿态背后传达出怎样的信息?是一个强有力的政府在宣告中国从今将表现得像一个真正的大国;还是一个弱势政府屈服于国内民族主义风潮?真相如何,外界不得而知,但我们能够推断,如果中国继续坚持强硬立场,其在亚太地区获取多少利益,便要在全球层面付出多少代价。这是中国未来不得不面对的新困境。”
在大数据时代,人们很快就不这样说话了。针对一国政府与国内民族主义风潮的互动关系,甚至会有现成的模型,随时通过大数据进行检验。至于一国在地区层面与全球层面的利益交换,也可以轻易数据化,得出基于量化指标的结论。
十年之内,各国政府都会设有应对大数据国际政治的专门机构。中国政府会发布大数据报告,揭示日本的军国主义历史演变轨迹;日本也会针锋相对,发布关于中国军力增长的大数据分析,甚至预测出中国建立海外军事基地的时间。随着各国政府从大数据分析中获得的新知识、新观察、新洞见越来越多,国际政治的整体局面必将大为改观。
但国家本身却不是这场数据革命的主导者,而是被动的接受者和追随者。“除了上帝,其他人必须用数据说话”,据说这是硅谷经理人的信仰,那些每日每时都在收集着“富可敌国”的数据资源的巨头企业,其实也早已拥有了“强可敌国”的大数据力量,在所有人都必须用数据说话的时代,它们就是新的上帝。是它们在引领变革,在将硅谷的信仰的行为规范推向全世界。如此看来,Google,Facebook,Twitter等公司在目前这个阶段的相对低调和隐忍,更显得其状不祥,大有风暴前短暂平静的模样。
而一个基本事实是,最大的大数据公司都在美国,用国家来衡量,美国早已是囊括了大数据资源最多的国家。如果大数据终将导致权力的重新分配,美国将再次占据优势。这是大数据时代国际政治格局的另一个维度,也不得不正视。
参考阅读:文扬:互联网的颠覆浪潮终将冲向政治领域(一)
相关文章
「 支持!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!