IBM稱,全球所有計(jì)算機(jī)每天產(chǎn)生250億億個(gè)字節(jié)的數(shù)據(jù)。這相當(dāng)于每人每天產(chǎn)生大約半張CD的數(shù)據(jù)量。無數(shù)激動(dòng)人心的會(huì)議展示和咨詢報(bào)告都以“大數(shù)據(jù)”為主題。那么,它對(duì)經(jīng)濟(jì)學(xué)可能有何幫助?
每個(gè)人所說的“大數(shù)據(jù)”含義不盡相同,但以下為一些共識(shí)。第一,如果不依賴某些可視化軟件的幫助,人類不可能理解如此大的數(shù)據(jù)量。用散點(diǎn)圖尋找規(guī)律或異常情況的傳統(tǒng)辦法,在這里毫無作用。第二,數(shù)據(jù)從產(chǎn)生到被利用往往只有很短的時(shí)間,至少對(duì)一些人如此。你的手機(jī)運(yùn)營(yíng)商能夠?qū)崟r(shí)獲悉你手機(jī)所在位置。第三,數(shù)據(jù)可能高度互相關(guān)聯(lián)。理論上,谷歌(Google)可掌握你的電子郵箱和安卓(Android)手機(jī)位置信息,知道你在Google Plus社交網(wǎng)絡(luò)上有哪些好友,并了解你的搜索記錄。第四,數(shù)據(jù)是雜亂無章的:你儲(chǔ)存在手機(jī)上的視頻屬于“大數(shù)據(jù)”,但它與整齊有序的分類數(shù)據(jù)庫(kù)(按照生日、就業(yè)狀況、性別、收入等分類)還相去甚遠(yuǎn)。
這可能給經(jīng)濟(jì)學(xué)家?guī)韱栴}。經(jīng)濟(jì)學(xué)家已經(jīng)被慣壞了:20世紀(jì)30和40年代,西蒙?庫(kù)茲涅茨(Simon Kuznets)和理查德?斯通(Richard Stone)建立了清晰有序、邏輯連貫的國(guó)民賬戶系統(tǒng)。幾十億項(xiàng)個(gè)人交易一下子被概括為“英國(guó)2012年GDP”;幾十億次價(jià)格變動(dòng)體現(xiàn)為通脹指數(shù)這么一項(xiàng)指標(biāo)。數(shù)據(jù)整齊地排列成矩形,例如,橫排為若干個(gè)國(guó)家,豎排為年份,每個(gè)方格內(nèi)的數(shù)據(jù)對(duì)應(yīng)某個(gè)國(guó)家在某個(gè)年份的通脹率。