前言
大約從2011年出現「大數據」(Big Data)這個關鍵字以來,到目前為止,已經有許多和「大數據」相關的書籍出版上市。
在這段期間,大數據成了掀起熱潮的流行術語,被說成像是不可思議的魔法棒,和「大數據」有關的各類新聞幾乎每天都在報導,另一方面也逐漸開始進行了實際具體的議論。
然而,深入探討這議論的人還是少數,也一直處於認知度不高的狀態。而且,積極致力於應用大數據的企業也不多。至今蔚為話題、也被稱為魔法棒的「大數據」,為什麼活用它的企業會如此少呢?
「因為資料的分析相當困難」,有人會提出這樣的意見吧,或許也有意見認為「並不保證一定成功,所以才無法全力進行」。
的確,雖然出現了許多論及大數據的概念或事例的書籍,或是針對各種統計分析手法與實踐應用而寫的書籍,但卻很少有寫到「資料分析是簡單的」、「只要努力進行就必定成功」的著作。
事實上,大數據並不是魔法棒。但是,它的確是非常有效的工具。這項工具雖然在用法上需要耗費不少功夫,但只要能完整地善加運用就一定可以獲得成果。而且,隨著技術的進步,這項工具還能提供從適合初學新手到適合高階使用者的各種多元選擇。
筆者參與過許多為了培養從事大數據專案人才、資料科學家(data scientist)而舉行的演講或研討會,在本書中,就是根據累積至今的登台演說經驗,整理出在具體進行活用大數據方面容易陷入的錯誤要點,以及如何成功的know how祕訣。
為了能讓更多人對大數據抱持關注、努力加以應用,因此書內記載的是以進行程序或方法的理解說明為主,完全不會出現任何計算公式。
那麼,接下來就開始進入大數據的世界吧。
?
筆者