計量經濟學家與律師,耶魯法學院教授(William K. Townsend教授席),耶魯管理學院教授。經常在美國公共電台的「市場分析節目」(Marketplace)擔任評論員,也是《富比世雜誌》(Forbes)的專欄作家。目前擔任《法律、經濟學與組織期刊》(Journal of Law, Economics, and Organization)編輯,已出版八本書,發表過上百篇文章。
詹姆斯在自編的年鑑《棒球摘要》(Baseball Abstracts)裡,對棒球專家僅憑目測就能挖掘明日之星提出質疑。路易士(Michael Lewis )在所寫的《魔球─逆境中致勝的智慧》(Moneyball )裡指出,詹姆斯是棒球界主張資料導向決策的第一人。詹姆斯的論點簡單有力,他認為資料分析優於專家的觀察力:
這兩人帶動了統計研究的風潮,不少人對他們的數據分析大表認同。詹姆斯激勵了美國棒球研究學會(SABR)的成立,現在甚至有一個術語代表棒球領域的數據分析─棒球統計學(sabermetrics)。艾森菲特則是在二○○六年發行《美酒經濟學期刊》(Journal of Wine Economics)。現在還有一個酒類經濟學家協會;毫不令人意外,艾森菲特就是首任會長。事後看來,艾森菲特初期的預測超準。我查了一下拉圖堡(Chateau Latour)最近的葡萄酒拍賣價,一九八九年份的售價果然是八六年份的兩倍有餘,九○年份的售價更高。帕克,你能不心服嗎?
在一個又一個領域,「直覺主義者」與傳統專家都在與超級數據達人對抗。在醫界,「實證醫學」(evidence-based medicine )引發激烈爭辯,歸根究底,爭的是治療方法的選擇是否應該依據統計分析。直覺主義者當然不會輕易認輸,他們堅稱資料庫絕無法涵蓋專家窮一生經驗累積的知識,迴歸分析也絕比不上一個有二十年資歷的急診室護士,她可能只要看一眼就能判斷一個小孩是否「不太對勁」。
李維特(Steven D. Levitt )與杜伯納(Stephen J. Dubner )在《蘋果橘子經濟學》(Freakonomics )裡提出數十種例子,說明資料庫的統計分析如何揭露因果關係背後的關鍵力量。而李維特與唐納修(John Donohue )讓我們知道,看似不相干的事件,如一九七○年的墮胎率與一九九○年的犯罪率,其實有很重要的關聯。(這兩人都是我的好友,也曾合作寫書,本書後面會再提到他們。)但《蘋果橘子經濟學》並未討論量的分析如何影響實務決策,而這正是本書要補足的重點。事實是,產業內、產業外,有許多人正透過你想不到的方式將統計分析運用在各項決策上。
我和李維特都沒有買路捷的股票(坦白說,那是因為我們不希望改變自己的動機),但我們自知掌握了寶貴的資訊。我們的報告發表後,該公司股票漲了二?四%。我們的研究說服了更多城市採用路捷科技,也促使保險公司提供更多折扣(但還是不夠多)。
我要表達的重點是,我熱愛數據分析,我的角色等於是資料採礦咖啡廳裡的主廚。就像艾森菲特一樣,我在一份重要期刊《法律、經濟學與組織期刊》(Journal of Law, Economics, and Organization)擔任編輯,必須經常評論統計報告的品質。由我來探討資料導向決策的興起,具備絕佳的視野,因為我既是這股風潮的參與者也是觀察者,能看熱鬧也能看門道。
伊恩.艾瑞斯是美國著名的計量經濟學家與律師,經常在美國公共電台的「市場分析節目」(Marketplace)擔任評論員,也是《富比世雜誌》(Forbes)的專欄作家。目前為耶魯法學院教授(William K. Townsend教授席)、耶魯管理學院教授,也擔任《法律、經濟學與組織期刊》(Journal of Law, Economics, and Organization)編輯,著作等身。很榮幸能幫他的新書《什麼都能算,什麼都不奇怪──超級數據分析的祕密》中譯本寫推薦序,這本好書介紹的是數據分析──讓你我都身陷「數海」的解救者。
許多傳統的數據分析方法是在一九二○年到五○年之間發展出來,而這段期間的數據分析學家包括費雪(R. A. Fisher)、尼曼(Jerry Neyman)及荷特林(Harold Hotelling)等人。到了一九八○年代以後,因為電腦的快速發展,硬體速度愈來愈快,軟體解決問題及運算的能力愈來愈強,使得數據分析的理論及新的數據分析方法論受到很大的影響,諸如一些在電腦應用上發展得不錯的數據分析方法論,都是統計學與資訊科學的結合,而這些新的方法現在都大量運用在數據分析上。
很多人跟我說現在的數據分析太容易也太簡單了,把數據丟進許多數據分析的軟體(MINITAB、SAS、SPSS…… 等),結果就出來了。我常笑著說這叫作「GARBAGE IN, GARBAGE OUT」,把一份不明來由的數據扔進分析軟體,跑出來的分析結果還是不明究理,垃圾進去垃圾出來,一蹋糊塗也一片朦朧,唯有數據分析的專業人員才比較懂得如何分析、如何善待與利用數據,因此超級數據達人一定先要有數據分析方面的專業素養與技術。在此想強調的是數據分析有用論,至於如何使其有用?就由這本書來告訴大家正確的觀念。