大數據時代的來臨,帶給我們眾多的沖擊,每個人都應當與時俱進、不斷提升,放棄殘缺的守舊思想,大膽接受新的挑戰。
探討大數據時代將給我們帶來哪些變革,首先要搞清楚什么是大數據,其次,要厘清大數據會帶來哪些變革,最后,要思考如何應對大數據時代的挑戰。
什么是大數據?
國際數據公司定義了大數據的四大特征:海量的數據規模(vast)、快速的數據流轉和動態的數據體系(velocity)、多樣的數據類型(variety)和巨大的數據價值(value)。僅從海量的數據規模來看,全球IP流量達到1EB所需的時間,在2001年需要1年,在2013年僅需1天,到2016年則僅需半天。全球新產生的數據年增40%,全球信息總量每兩年就可翻番。
而根據2012年互聯網絡數據中心發布的《數字宇宙2020》報告,2011年全球數據總量已達到1.87ZB(1ZB=10萬億億字節),如果把這些數據刻成DVD,排起來的長度相當于從地球到月亮之間一個來回的距離,并且數據以每兩年翻一番的速度飛快增長。預計到2020年,全球數據總量將達到35~40ZB,10年間將增長20倍以上。
需要強調的是:所謂大數據并不僅僅是指海量數據,而更多的是指這些數據都是非結構化的、殘缺的、無法用傳統的方法進行處理的數據。也正是因為應用了大數據技術,美國谷歌公司才能比政府的公共衛生部門早兩周時間預告2009 年甲型H1N1流感的暴發。
厘清大數據帶來了哪些變革
就像電力技術的應用不僅僅是發電、輸電那么簡單,而是引發了整個生產模式的變革一樣,基于互聯網技術而發展起來的“大數據”應用,將會對人們的生產過程和商品交換過程產生顛覆性影響,數據的挖掘和分析只是整個變革過程中的一個技術手段,而遠非變革的全部。“大數據”的本質是基于互聯網基礎上的信息化應用,其真正的“魔力”在于信息化與工業化的融合,使工業制造的生產效率得到大規模提升。
簡而言之,“大數據”并不能生產出新的物質產品,也不能創造出新的市場需求,但能夠讓生產力大幅提升。正如,《大數據時代:生活、工作與思維的大變革》作者肯尼思•庫克耶和維克托•邁爾-舍恩伯格指出:數據的方式出現了3個變化:第一,人們處理的數據從樣本數據變成全部數據;第二,由于是全樣本數據,人們不得不接受數據的混雜性,而放棄對精確性的追求;第三,人類通過對大數據的處理,放棄對因果關系的渴求,轉而關注相互聯系。這一切代表著人類告別總是試圖了解世界運轉方式背后深層原因的態度,而走向僅僅需要弄清現象之間的聯系以及利用這些信息來解決問題。
|