庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
好吃(NO.5+6)套書(共二冊)
  • 定價99.00元
  • 8 折優惠:HK$79.2
  • 放入購物車
二樓書籍分類
 
當我們變成一堆數字

當我們變成一堆數字

沒有庫存
訂購需時10-14天
9789573264590
齊若蘭
遠流
2009年4月30日
117.00  元
HK$ 99.45  







* 叢書系列:實戰智慧叢書
* 規格:平裝 / 304頁 / 25k / 普級 / 單色印刷 / 初版
* 出版地:台灣


實戰智慧叢書


商業理財 > 電子商務 > 網路行銷/趨勢商機















  每一天,我們使用手機、電腦、信用卡、會員卡……都會送出無數關於我們的訊息,把每個人變成可以搜尋、可以解析的0與1。

  從IBM、Google、保險公司到歐巴馬競選團隊,莫不重金禮聘身懷絕技的「數字搜客」,從一大堆數字符碼中過濾出寶貴的趨勢和洞見。他們從熱門關鍵字中了解組織士氣或社會氛圍,觀察消費者在大賣場內的行走路徑和購物習慣,

  利用健康監控提早發現疾病徵兆,在茫茫人海中為男男女女找出最速配的另一半,用揪出賭場老千的技術追緝恐怖份子......

  不管你願意與否,「數字時代」已經來臨,正靜靜形塑著我們的生活、工作、購物、甚至戀愛方式,《當我們變成一堆數字》為你解讀這個大未來的運作和意義!

作者簡介

史蒂芬.貝克( Stephen Baker)

  美國資深媒體觀察家與部落客。為美國《商業周刊》撰稿超過二十年,同時也在《華爾街日報》、《洛杉磯時報》與《波士頓環球報》發表文章。曾以墨西哥汽車產業興起專題報導榮獲海外記者協會獎。

  他與友人共同經營的部落格〈Blogspotting.net〉被《紐約時報》評為五十個最值得關注的部落格之一。



推薦文一 擋不住的技術,就在你我身邊 張志浩
推薦文二 數字是窮人的原子彈 劉威麟(Mr.6)
作者專訪 誰是數字搜客?
前  言 「數字搜客」時代已經來臨

第一章 工作者
你的職場DNA,老闆都知道
第二章 購物者
未來,購物車告訴你家裡缺什麼
第三章 選民
他們到底在想啥?
第四章 部落客
每篇文章都是免費民調
第五章 恐怖份子
從賭場到反恐戰場
第六章 病患
舖上神奇地毯,隨時做體檢
第七章 情侶
電腦媒婆巧安排

結  語 他們說的真的是「我」嗎?



作者專訪

誰是數字搜客?

Q:誰是數字搜客?

A:全球一群忙著用數據分析我們每一個行動的菁英份子。他們從多得跟山一樣高的繁多資訊中,仔細找出人們的行為模式,以便預測我們會想買什麼東西、投票給誰、在工作上哪方面比同事強,有些甚至可以幫我們找出潛在的情人類型。這些擁有數學與電腦科學專精背景的數字搜客是符號領域的專家,包括IBM與Google 等大企業都正竭力討好他們。

  當我剛開始寫這本書時,我以為數字搜客擁有與一般人大相逕庭的思維與行事風格,即所謂的「數字人」,後來我發現並不是如此。他們分析資訊的方式其實跟一般人每天慣用的邏輯沒有太大不同。例如:假設一個朋友跟你借美金一百元,你馬上會開始蒐集相關資訊並推測可能遭遇的問題。像是:她收入多高?她常對人說謊嗎?如果我拒絕借錢,她的反應會如何?…等等。你會自行評估上述各種變數,而數字搜客在做的也正是如上述一樣的事。某種角度來說,我們全都是數字搜客,唯一不同的是,他們有電腦幫忙,可以在同時間分析預測數以百萬計的人們的行動而已。

Q:資料探勘這概念並不新,如今又有什麼不同呢?

A:從前,例如說一九九一年,倘若一個偵探或傳記作者想拼湊出你這一年的生活全貌,他可能得爬進你的閣樓裡,翻過那成堆的信件、快照、電話帳單等諸多紙張;同時還要採訪你的朋友、鄰居與同事才辦得到。人們生活的歷史紀錄原本大多儲存在紙本與模糊的記憶中,但現在情況已改變。我們的相片,還有我們在辦公室做的所有事情,現在都可以數位檔案傳送。因此,現在我們可以把人生中的每一個細節都轉化成零與一組成的數據。誰能解讀這些數據,進而找到關於重新認識我們自身、新服務與新產業的重大創見呢?只有數字搜客才行。

  這樣的改變可能會讓一些學人文科學的人們感到挫折:曾經,文字與數字世界間有明確的分界,數字人只掌管科學、建築與工程領域,而把人文領域的研究留給我們。而我們這些微積分當掉的人,依然可以在心理學、新聞學、法律與行銷學等領域步步高升。然而,現在數字搜客等於公然闖進這些人文科學的領域。

  但是,我們這些人也漸漸開始使用數字搜客的工具與方法,像是:在網路上搜尋哪一位心臟科醫生最值得信賴的資訊、以及下載軟體來記錄我們的慢跑情況,藉此資訊擬出參加馬拉松賽最適宜的訓練與養生計畫等等。

Q:這算是一本財經書嗎?

A:不單是那樣,這是本牽涉到所有人的書。它說明數字搜客如何透過數據解碼我們的行為,以及這現象將如何改變世界。

  別誤會我的意思,這現象的確是企業領域中的當紅關鍵趨勢,數字搜客目前首先從廣告與媒體業著手改變,但也即將重建其他許多產業。

  這本書的前身是美國《商業周刊》的一篇封面故事〈數學將震撼你的世界〉。同時,我們在書中談到的數字搜客也為許多企業工作,包括雅虎(Yahoo!)、埃森哲(Accenture)與Chemistry.com。但本書焦點不僅止於企業,或者它們如何獲利,而是關於數字搜客將從工作、購物與醫療等各個層面,來掌控我們的生活。

Q:數字搜客會犯錯嗎?

A:常常會。他們的分析建立在統計學與機率學上,而且他們時常解讀錯誤。即使是最聰明的數據分析師,也常被一小段的資訊給考倒。這剛好就發生在我身上:當我與內人測試使用Chemistry.com的配對系統時,電腦竟把我排除在內人的擇偶名單之外。一個可能的風險是,人們將會因為相信它擁有科學基礎,而接受系統的分析結果。我希望他們在讀了本書後,會更了解電腦系統是怎麼導出這些結論的,並且在必要時可駁斥它。

Q:我們應該害怕數字搜客嗎?

A:應該這麼說:我們要保持警覺。他們可以用難以預料的方式挖掘出我們的秘密,而他們用演算法推論出的預言,也可能就此決定了人們是否能獲聘一個職位、保險金該繳多少、甚至是否有恐怖份子的嫌疑。

  但是我們也要隨時謹記在心:數字搜客不一定每一次都對。他們的分析建立在統計學上,有時能帶來極佳的結果。例如說,雜貨商會很高興知道,有六成的目標購物者確實被廣告折價券吸引去買菲力牛排,即便還是有些折價券不巧落入吃素人士或不吃牛的印度教徒手中。數字搜客帶來的改變並不僅止於購物層面,更包括了治療腦癌與保衛國土安全等重要的事情。然而,當系統發生錯誤時,事情也會因為這項應用牽涉了太多層面而變得更棘手。

  所以我們要防範的,一是不要被他們的錯誤分析誤導,另一則是阻止他們對我們有太多的了解與有點如「老大哥」式的全面監控,這的確是有風險的。

Q:你在調查撰寫這本書的過程中最可怕的發現是?

A:應該是警務的領域。數字搜客藉著分析消費者資訊來預測我們的購買與投票行為等等,這還說得過去。但是,一個掌握著執法權的政府,如果也透過消費者資訊建構出一個性騷擾兒童罪犯的可能面貌,並用來當辦案參考,該怎麼辦?例如說:資料分析出全國的教師個人資訊後,發現某一個在學校教國二英文的老師,有四三%的機率可能是戀童癖,那我們該解雇他嗎?或者應該警告父母小心這名老師?執法單位若得知資訊什麼都沒做,而這名老師後來的確犯罪了,是否構成缺失呢?民權人士該不該阻止這件事?這將可能改變人們在法律上對無辜者的認定原則。

Q:那麼最有啟發性的發現是?

A:一位在微軟工作的研究員大衛?哈克曼。他正在做過濾垃圾郵件的研究,並發現這些垃圾郵件有類似「突變基因」的設計,以便一直躲過各種新的過濾方法。哈克曼認為他在過濾垃圾郵件研究中導出的數學模型,有一天也可能預測出HIV這類引發出愛滋病的突變型病毒的變化軌跡。這是數字搜客最棒的特質之一:他們可以運用同樣的運算模型,輕鬆地從這領域跳到另一個毫不相干的領域來做研究。這也正是哈克曼在做的事情,他已經引領自己在微軟建立的團隊轉戰到HIV病毒研究領域,縱然目前尚未找出有效疫苗,已經有一些進展了。

Q:哪些章節讀起來最有趣?

A:我在第六章所進行的採訪是自己最喜歡的。我去了奧瑞岡州採訪英特爾的研究計畫,發現他們的研究員在年長人士的家中裝了無數的感應監控裝置,甚至有的裝在地板下面。某日研究人員震驚地發現,有個女人在就寢和早餐之間的這段時間,體重居然增加了八磅。是因為她體內積水達到危險的程度嗎?是不是該叫救護車呢?結果完全不是這麼一回事,其實體重增加只不過是因為小狗跳上床和她一起睡罷了。

Q:是哪些靈感引發你寫此書?

A:我某次在IBM研究中心訪談一位任職於此處的敘利亞數學家塔克瑞提,他告訴我,他的研究計畫是建立關於公司內五萬名同事資訊的數學模型。他引領的團隊將可以預測每一個人的產值有多少、哪些人最適合在一起工作、還有哪些人值得被公司栽培。

  那天下午,當我從IBM研究中心開車回家途中,忽然想到他們既然有能力建構關於工作者的數學模型,也就能建構關於消費者、病患、投票者等等,甚至關於全人類的數學模型!就是這樣的念頭引發我開始著手寫這本書。

Q:關於數字搜客最大的迷思是?

A:我們都一直以為人們可以清楚區分為「數字人」與「文字人」,像是數字人不擅於社交等等。這並不是真的。事實上,我們都同時是數字人與文字人。我所遇到的數字搜客口頭表達能力都很強,甚至很多還會兩到三種語言。

Q:數字搜客在哪一個領域帶來的改變是最快的?

A:他們在消費行為、行銷、廣告與媒體領域領先群倫。例如看看Google,它已透過數學與電腦科學的運用,也就是數字搜客的工具,來為資訊世界帶來革命性的改變。

Q:你希望讀者讀完此書時會為他們帶來哪些啟發與感受?

A:我希望他們開始觀察或想像數字搜客如何在他們的職場、學校、醫院或甚至雜貨店裡進行研究。我已經警覺到當我在電腦上查詢棒球比賽結果,以及在停車場停車刷儲值卡時,自己正丟出哪些訊息給這個世界。我也好奇他們會藉此資訊導出什麼結論?如果讀者也開始這麼想,也許會開始研究自己的行為模式以及自己製造的資訊。對大多數人來說,這是個認識自己的新方式,同時不論你喜不喜歡,這也是世界上的其他人將用來了解你的方式。

(本文摘譯自本書作者史蒂芬?貝克的部落格。部落格網址:www.thenumerati.net/)

前言

「數字搜客」時代已經來臨

  想像你和我現在這樣,坐在一家吵雜的咖啡館中。右邊鄰桌,有位年輕女士正在敲打筆記型電腦的鍵盤。你轉過頭去,瞄一下她的螢幕,她正在上網。你繼續觀察。

  幾小時過去了。她瀏覽了線上的電子報。你注意到,她讀了三篇關於中國的文章,還查看星期五晚上有什麼電影可看,觀賞了一下《功夫貓熊》(Kung Fu Panda)的預告片。然後她點閱了一則網路廣告,因為廣告聲稱能讓她和中學時代的老同學聯絡上。你坐在哪兒,拚命做筆記,每過一分鐘,你都對她有更深的了解。現在,想像你可以同時觀察一億五千萬人的上網行為。而戴夫.摩根(Dave Morgan)的工作大致就是如此。

  某個夏天傍晚,我們坐在他位於紐約的辦公室中,摩根問:「那麼,喜歡看浪漫愛情電影的人又是怎麼一回事呢?」當時這位廣告界的創業家正滔滔不絕地說明關於網路漫遊的種種。他可以追蹤我們在網路上從一個網站移動到另一個網站的軌跡,彷彿我們是燕子或座頭鯨。

  最近,他對於經常在網路上點閱租車廣告的人產生了莫大的興趣,其中最大的族群是曾經點閱線上訃聞的人。他說,這倒是很合理,「有人死了,所以你飛去參加喪禮,下飛機後租了一輛車。」但第二大族群--浪漫愛情電影的愛好者,才真正讓摩根百思不解。摩根不明白為什麼許多愛情電影的愛好者似乎都會點閱阿拉莫租車公司的廣告。

  四十三歲的摩根是個開朗的中年人,頭髮梳向一邊,彷彿自從小時候他媽媽把梳子沾了水,幫他把頭髮往旁邊梳以後,那撮頭髮就一直留在那兒沒動。他在賓州西部的克立菲德鎮長大,那裡離龐蘇塔尼鎮車程很短。每年二月的第二天,也正是冬至和春分之間,小鎮民眾都會聚集在一起,圍觀籠子裡剛從冬眠中醒來、還昏昏沉沉的土撥鼠,研究這隻土撥鼠看到自己的影子時,有什麼反應。根據克爾特人的古老傳說,這一點點資訊就能告訴他們春天的腳步是否近了,還是一直要等到三月,天氣才會變暖。

  摩根的方法比這種民間預測進步多了。他在紐約創辦的塔科達公司(Tacoda),僱用統計學家來追蹤我們在網路上漫遊的足跡,並且設法預測我們的下一步。摩根是網路廣告的先驅,他在網路熱期間,創辦了一家叫「24/7 Real Media」的廣告公司。網路泡沫破滅後,他就創辦了塔科達,幾乎毫無縫隙地銜接上他心目中的下一波新浪潮:協助廣告商聚焦於最有可為、最能被廣告訊息打動的上網人口。

  塔科達的業務需要大量資料。他們和幾千家線上刊物簽約,其中包括《紐約時報》和《商業周刊》。這些線上刊物的網站容許塔科達將名叫「cookie」1的一小段電腦編碼丟進我們的電腦中,塔科達因此可以追蹤我們從一個網站漫遊到另一個網站的路徑。塔科達關注的是我們的行為,並無意探究我們姓啥名誰或掌握其他個人資訊(否則可能會引起反彈,被視為侵犯隱私權)。但塔科達仍然獲得很多資訊。假定你造訪《波士頓環球報》(Boston Globe)的網站,閱讀了一篇關於豐田新車Prius的專欄文章,然後你又瀏覽了美國線上網站(AOL)的汽車相關資訊,很可能你是在尋找市場上有關輪胎的訊息。所以塔科達趁你在網路漫遊的時候,插進一則汽車廣告。你點進去,塔科達就可以從廣告商那兒分到一筆錢--而且又蒐集到更多有關你上網習慣的點點滴滴。塔科達每天都收集到二百億筆這類的網路行為線索。

  有時候,摩根的團隊會發現有些在網路漫遊的人同時移動。要找出他們集體移動的原因是一大挑戰,不過一旦弄清楚箇中緣由,廣告商就能預期使用者的線上漫遊行為,而且在他們的漫遊路徑上放置適當的廣告。但要做到這點,需要花心思作研究。

  就拿愛情電影迷和租車廣告之間耐人尋味的關係為例,摩根和他的同事為了要了解其中的奧秘,必須深入挖掘手中的數據。是否看完某種型態愛情電影的人,尤其是在某些奇特地點看電影的人,會大批湧去租車?這些人是否還常逛其他相同的網站?答案都藏在我們電腦送出的一連串0與1訊號當中。或許統計數字顯示,電影迷和租車者之間出現的明顯關聯,其實只是統計上的奇怪變化罷了。摩根的團隊也可能因此發掘出更大的趨勢,找出羅曼史和旅行、性慾和流浪癖之間的關係,並因而激發出各種廣告上的創見。無論是哪一種狀況,摩根都能安排數百種測試,從每一次測試中,他都對我們多了一些了解,並且能更準確地針對目標對象作廣告。廣告商過去都只能憑直覺來臆測他所作的這些分析,如今他卻以科學方法取而代之。我們就是他的天竺鼠或土撥鼠,而且我們無休無止地為他工作。

四處飛舞的位元

  說到製造數據,人類可是十分多產。凡是使用行動電話、筆記型電腦和信用卡的人,只要活在世上的每一天,我們的數位檔案都愈來愈厚。

  就以我為例好了,就在這個春天的早晨,我坐在這裡寫作的時候,我的行動電話公司可以在新澤西這家咖啡廳方圓幾公尺的範圍內將我定位,信用卡簽帳紀錄可以證實我喝了不少咖啡,或許為了克服我昨晚八點十九分買的那瓶葡萄牙紅酒帶來的效應。我買完酒,剛好來得及看一場大學籃球賽,TiVo智慧型節目導航數位錄放影機可能曉得,我看完上半場就關掉電視。在我經過每一家銀行和便利商店時,保全監視攝影機會捕捉到我的影像,並且記錄時間。更別提等到我開始上網漫遊,我的漫遊足跡早已變成全世界幾十家網路刊物和廣告商的紀錄了。摩根只不過是廣大好奇群眾中的一份子罷了。在上世紀末,為了蒐集這類的報告,東德政府得徵召數萬名東德公民來當間諜,今天我們卻偵查自己的行為,而且每分鐘都把更新的電子資料傳送出去。

這一切全都是由電腦晶片開的頭。

  一直到一九八○年代,上面覆蓋著數百萬微小電晶體的小小矽晶片還是新奇的發明。但是一年年過去,電腦晶片變得愈來愈便宜,而且無所不在,製造商幾乎在任何需要一丁點智慧的產品中都植入晶片。無論是我們的行動電話、汽車控制器、數位相機、當然還有電腦,都要仰仗晶片。每逢節慶,我們打開禮物包裝時,就會有更多晶片進入我們的生活之中。這些晶片能記錄它們接收到的每一個指令和執行的每一項工作。它們是吹毛求疵的記錄者,會記下我們生活中的所有細節。如果單獨拿出來看,每個片段資訊幾乎都毫無意義。但把點點滴滴的資訊組合在一起,呈現出來的型態卻能勾勒出我們的品味和特徵、我們的工作習慣,以及我們在大賣場和超市中購物時走的路徑。

  這些資訊流環繞著地球流動。你用行動電話發送笑臉給朋友,你這個小小的動作立刻和數十億其他訊息一起,透過光纖網路快速竄流,發射到衛星上,然後又回到地面,你還沒來得及把手機放回口袋中,這個訊息就已經抵達新加坡的某個伺服器。由於四周有這麼多位元在到處飛舞,我們呼吸的空氣中充斥著各種資訊的微粒。

  如果有人能夠好好收集和組織這些四處瀰漫的電子訊息,我們的生活面貌會突然清晰起來,創造出不斷變化、隨時更新的人類行為拼貼圖。這樣的前景已足以令行銷人員興奮不已。一旦他們有辦法分析和我們相關的數據,就能解讀我們的慾望、恐懼和需求,然後精準地向我們推銷我們渴望獲得的東西。

  但是,實際狀況沒有這麼簡單。要翻攪這片包含了電子郵件、下載的色情圖片和購物收據等各種數據的汪洋大海,將掀起混亂的波濤。根據comScore研究公司二○○八年的調查,雅虎網站(Yahoo !)單單在一個月內就可以收集到一千一百億筆顧客相關資料。任何人只要造訪過雅虎廣告商的網站,平均都會留下二千五百二十個線索。你可能以為,只要把這些細節拼湊起來,就可以立刻呈現出我們身為購物者、旅行者和工作者的樣貌。但要描繪出如此清晰的樣貌並不容易。

  我拜訪雅虎的研究主管普拉赫卡.雷格海文(Prabhakar Raghavan),他告訴我,他們收藏的大部分數據都是數位垃圾,他稱之為「噪音」,這些垃圾很容易就可以淹沒雅虎的電腦。如果雅虎的科學家在搜尋資料庫時,下達了不精確的電腦指令,可能會讓公司的伺服器瘋狂地掃描過龐大的「噪音」達數天之久。但及時修改一下指令,就可以加快搜尋速度高達三萬倍,把原先需要二十四小時的流程縮短為三秒鐘左右。

  他的意思是,如果具備了適當的聰明才智,就能夠在幾乎深不可測的數據汪洋中解讀意義。雖不容易,但仍然可以找出隱藏其中、與我們相關的種種資訊。

在數位垃圾中找意義

  唯一能夠解讀這些數據的人是頂尖的數學家、電腦科學家和工程師,他們知道如何把我們生活中的點點滴滴轉化為符號。

  為什麼需要這樣做呢?假設你想追蹤一整年中你吃下的每一樣東西。如果你是四年級的小學生,你會到文具店去買厚厚一疊索引卡,然後每一餐都把自己吃過的不同食物記在不同的卡片上。肉餅、菠菜、布丁……。幾天後,你的索引卡愈堆愈高。問題是,你沒有辦法計算或分析你記下來的資訊?卡片上只是一堆字罷了。當然,這些字也都是符號,每個字都代表某個東西或某個概念,但是你幾乎不可能拿這些字來加加減減,或根據這些字來畫出代表趨勢的曲線圖。把這些字堆在一起,結果只是形成專家所謂的「非結構化資料」(unstructured data),其實就是「一團混亂」的意思。比較好的做法是把所有的肉類都用英文字母M來標示,所有綠色蔬菜都以G代表,所有糖果都是C,以此類推。一旦這些文字被簡化為符號,你就可以把它們列在試算表上,計算出,比方說,在某個星期中,你吃了多少肉類或糖果。然後你可以畫一個曲線圖,描述你的飲食內容和體重變化或臉上冒出的青春痘之間的關係。

  整個過程的關鍵在於,必須找出相似處、規律和型態。人類本能就懂得這樣做,古早以前,我們就是這樣弄清楚哪些植物可以吃,以及如何說話。但當許多人把心力放在應付特定的挑戰時,其他一些人則偏向象徵性的思考。我可以想像遠古的人類圍坐在火堆旁,有的人正在爭奪更大塊的肉,有的人則忙著求偶儀式。但旁邊有千中選一的寥寥數人卻把玩著石頭,思考著:「如果每個小石頭都代表一頭長毛象,那麼這個小石頭……」托拜斯.丹齊格(Tobias Dantzig)在《數字:科學的語言》(Number : The Language of Science)中指出,後來羅馬人用「calcula」(小石頭)這個字來代表這樣的思考過程,但這只是起步而已。計算的本質漸漸從數實體的小石頭提升到更高層次的抽象推理過程。

  這門科學就此發展了許多世紀,現在有很多專家習於處理數以億計或兆計的龐大數字,那是其他人難以想像或在我們眼中毫無意義的數字。這門科學將我們的日常現實轉變為符號,而這群精於數據運算的專家就是傳遞薪火的人。

  隨著人類資訊爆炸,電腦威力愈來愈強,這群大師的權力也愈來愈大。其中有兩個人在一九九○年代後期創辦了Google網站,激起巨大的浪花。 Google網站幾乎完全奠基於數學,目的是協助我們找資料。Google把簡單的搜尋引擎轉變為媒體巨擘,它的突破在於發現我們的疑問--我們搜尋網頁時輸入的字--對廣告商而言有莫大的價值。他們找到了把我們的資料變成金錢的方法。其他許多公司也希望能做同樣的事,無論生物界、醫療業、廣告業、體育界或政界都大量僱用數學奇才,他們不斷計算和我們有關的各種數據,於是我們每個人都在不知不覺中被量化了。

  半個世紀之前這個流程剛啟動時,電腦是個粗糙的大盒子,體積就和垃圾車差不多大小。對一般人而言,電腦遙不可及,關在有空調的房間裡嗚嗚運轉著。對早期的電腦而言,人類實在太過複雜了,甚至在對弈時,電腦都沒有辦法贏我們。但在某些數字相關領域,它們卻展現出無窮的潛力。

  早期有個和消費者信用相關的試驗就是個好例子。一九五六年,兩個史丹佛大學畢業生,數學家比爾.費爾(Bill Fair)和他的工程師朋友厄爾.艾薩克(Earl Issac)想到可以用電腦取代放款人員。這部龐大的機器其實什麼都不懂,甚至連貸款申請人靠什麼維生都不清楚,當然更不知道申請人最近是否加薪或正在鬧離婚。相反的,訓練有素的放款人員手上掌握了豐富的資料,他們通常都認識申請人的家人,了解申請人辛苦的求學過程,以及他訂婚後,可能因為酗酒問題(假如他和他叔叔很像的話)解除婚約。銀行放款部門對於鎮上每個家族都有鉅細靡遺的了解,如果他們有意的話,簡直可以為此寫一篇社會學論文,但是銀行業者缺乏科學化的系統來分析所有的資料,因此主要憑直覺來作決定。

  相反的,電腦分析把焦點放在一組數字上,主要是申請人的銀行帳戶結餘、債務和利息支付及還款紀錄。費爾和艾薩克創辦了一家公司2,專門分析這些數字的型態。他們開發的方法能判定每位顧客無法如期還款的機率,給每個人打個分數,結果證明這些風險評分比人類直覺可靠多了。大多數拿到高信用分數的借款人後來都如期還款,而且有資格貸款的人數也比過去多。畢竟機器完全看數字來判斷,不會有任何歧視,所以人人機會均等,而且和很多分析系統一樣,比較公平。弔詭的是,狹窄的格局換來了寬宏大量的結果,而且許多借款人的表現比放款人員的預期好很多,信用市場因此逐漸擴張。

  不過,電腦一直謹守分寸,它從數字的世界起家,也一直待在數字的世界,從事文字、音樂和影像工作的人幾乎沒有察覺到電腦的存在。但未來數十年,電腦的威力將愈來愈強大,每毫秒(千分之一秒)都狼吞虎嚥下更多的0與1。電腦愈來愈便宜,也愈來愈小,而且會和散佈在世界各角落的其他電腦相連結。在我們學人文藝術的人眼中,電腦吞噬了所有的科技,取代了打字機以後,繼續往前推進,如大軍壓境般,一舉擊潰了錄音機和傳統相機,併吞了偉大的電話。我們這些人長期視電腦為來自地下室的異形,是科技怪胎世界中的產物,但到了一九九○年代,連我們都開始在家裡和辦公室為電腦空出位置,因為我們知道,我們可以使用這些機器和全世界分享文字和影像。

  事實上,我們也別無選擇,因為傳統方法慢如牛步。但有一個條件:我們必須把我們傳送出去的所有訊息、以及和我們生活相關的種種細節,全都轉換為0與1。我們就這樣逐漸將我們的寶貴資產--在地球上與別人溝通和通訊的鑰匙,交到一群精通符號式語言的大師手上。現在這群數學家和電腦科學家各就各位,控制著有關我們生活的種種資訊,我稱他們為「數字搜客」(numerati)。

  一個酷熱的夏天午後,摩根坐在他俯瞰第七大道的辦公室裡,拉下遮陽簾擋掉一些熱氣,卻始終弄不清楚該怎麼打開日光燈。他坐在陰影中,告訴我過去一個世代以來行銷方式的轉變。

  他說,過去行銷人員都集中心力向大眾市場促銷。從他們的角度看來,我們這些人和通用汽車的生產線沒有太大差別:凱迪拉克和別克汽車屬於有錢人和拚命往上爬的人,中產階級喜歡雪佛蘭,龐狄亞克為喜歡炫耀的年輕人而設計,農民則買貨車。他們只需要知道這些就夠了,因為二十世紀中葉的美國工廠,不管生產的是牛仔褲或花生醬,都採用大量生產的方式。針對特定族群的小量生產成本實在太高了。當然,加州沿海城市的某些地區會吸引一些奇裝異服的怪人,他們喜歡穿短褲、戴扁帽,開著外國車到處跑。不過大多數人無論吃的食物、穿的衣服或開的車子,都是工廠大量製造的產品,我們透過大眾媒體來了解這些產品。美國人創造的這種模式在二次大戰後數十年間,流傳到歐洲、亞洲和拉丁美洲的大部分區域。由機器製造的產品能夠很有效率地運送到數百萬名消費者手上。

  摩根說,在這樣的工業時代裡,廣告宣傳是很簡單的事情。你把所有人根據收入、性別和居住地區,區分為五、六類,然後你在他們閱讀的雜誌或觀賞的電視節目上打廣告。在產品幾乎都大同小異的年代,品牌變得非常重要。但如今,這一切都改變了。摩根說:「五十年內,我們會從指揮控制型經濟轉型為由消費者驅動的經濟型態。」

消費者為王的年代來臨

  為什麼呢?因為今天電腦長驅直入工廠,製造商因此擁有更大的彈性,更容易在早餐食品中加入更多核果,或讓汽水多一些檸檬味。只要一個簡單的指令,就可以讓織布機從織條紋圖案改為織格子圖案,不會比我在撰寫本章時改變字體困難多少。這表示產業界可以推出數以千計的不同產品。全球化早已把全世界的貨品都送到我們家門口,今天,我們幾乎有無窮的選擇。要在擁擠的市場上勝出,需要的不只是工業效率,而是以適當的價格提供我們想要的口味、質地和顏色。摩根說,如今是消費者為王的年代,「市場不再受制於製造商或通路。」

  這表示,行銷人員必須把每個人當成不同的個人。其中一個方法是雇大批主修心理學和文學的大學畢業生,手臂下夾著筆記本,挨家挨戶敲門作調查。但是這個做法太不實際了。比較合理的研究方式是追蹤和分析我們不斷吐出的資訊。摩根又更進一步告訴我們,他的團隊正在發展一種實驗,希望可以監控人們注視線上廣告時的認知反應。他們的實驗把焦點放在一種叫「p300」的腦波(美國海軍曾經用類似的試驗,測試飛行員如何在空中分辨友軍和敵軍)。如果測試對象看到廣告後,在不到一秒的時間內就激起「p300」波,那麼塔科達團隊就認為這個人不只在注視廣告,而且還在腦子裡處理所看到的訊息。

  下一步是找出哪一種人會對哪一類廣告起反應。摩根和不同產業中的眾多數字搜客一樣,仔細觀察不同的人,並且尋找其中隱藏的關聯性。他會問:我們做的哪些事情可能透露出我們下一步會做什麼?

我們全都變成一堆數字!

  我和別人提到本書的時候,他們往往感嘆:「我們全都變成一堆數字!」

  我說,沒錯,但是我們很久以前,就已經是一堆數字了:想想在墨西哥組裝廠生產電纜的一排排工人,或一次大戰期間在凡爾登戰役中衝鋒陷陣的士兵,或甚至在死之華合唱團演唱會中推開十字轉門的快樂群眾吧!從管理的觀點來看,在這些場景中出現的人或許都是沒有名字、面目模糊,完全可以相互替代的。工業時代的重要趨勢就是把每個人都變成簡單的數字。但這已經是過去式了。

  今天,數字搜客想在我們身上進行的是更加野心勃勃的計畫。忘掉個位數吧!他們希望為我們計算龐大複雜的數據和方程式,也就是建構數學模型。科學家一直運用數學模型來模擬從卡車到核彈的所有事物。他們收集了龐大數據後,建立模型,讓每個數字都代表一項事實或機率。每個模型必須以數字的形式反映物理上的真相:大小和重量、金屬和塑膠特性、對氣壓和溫度的改變有何反應。複雜的模型可能有數千種、甚至百萬種變數,而且在數學的世界中彼此交互作用,就像在真實世界中一樣。建立這些模型是很辛苦的工作,有時候也會失敗。比方說,二○○八年全球金融海嘯就起因於有瑕疵的模型未能忠實反映出房貸市場的複雜情勢和其中包含的風險。

  儘管有這些缺失,今天的數字搜客仍然繼續破浪前行,密切注意我們的一舉一動。他們已經把和我們有關的資料位元,編織到可預測的模型中,而且目前還只是暖身而已。未來十年,各行各業的每個人都會在不知不覺間被塑造成各種模型,被納入形形色色的工作者、病人、士兵、情人、購物者和選民的模型中。在目前的初始階段,許多模型都還不成熟,因此每個人都被塑造得彷彿呆板的火柴人。不過最終目標仍是要塑造出有血有肉的人類模型,和真實的我們一樣複雜,而且每個人都各具特色。

  整合所有這些努力之後,我們將親眼見證(也親身體驗)模擬人性的數學模型建構過程,這將是二十一世紀最偉大的工程之一。等到數學家掌握到愈來愈多的數據(從星羅棋布的環境感應器到數百萬監視攝影機提供的龐大資訊),這些數學模型將能呈現出更多物質世界的面貌。這是個逐漸成型的平行世界,是由數字、向量和演算法3構成的創新和發現的實驗室。而你我都置身其間。

  當數字搜客把我們轉化為令人暈頭轉向的數字組合時,他們將對我們有何了解呢?

  首先,他們必須設法找到我們。假定你是紐約市郊的休旅車潛在買家,或新墨西哥州阿布奎克市某位勤上教堂、反墮胎的民主黨員;也許你是Java程式設計師,即將外派到印度海德拉巴;或者是熱愛爵士樂和奇揚第紅酒的射手座,住在瑞典斯德哥爾摩,正在尋找可以放在壁爐邊的熊寶寶;或甚至天可憐見,你是正急著把炸彈綁在手腕上,搭上巴士的恐怖份子。無論你是什麼樣的人--即使我們每個人都有多重不同面貌--企業和政府都希望把你找出來,為你定位。想想看:Google因為協助我們找到正確的網頁,而膨脹為數十億美元的大企業。所以,在每一個你想像得到的產業中,如果你能把正確人選找出來,將具有何等的價值?類似這樣的資訊將是千金難買,所有我們扔掉的個人資料都將指出無數條直通我們家門口的路徑。即使你不透露自己的名字,要找到你仍然易如反掌。美國卡內基美崙大學的一項研究顯示,只要曉得美國人的性別、出生年月日和郵遞區號,就能找出其中八七%的人叫什麼名字。

  數字搜客也希望改變我們的行為。如果我們正在購物,他們希望能讓我們買更多東西;如果我們是上班族,他們希望提升我們的生產力;如果我們是病人,他們希望能用更低的成本,讓我們更健康。IBM和亞馬遜網路書店等企業正在建構我們的初步模型,他們可以預測我們的行為,同時在我們身上作一些實驗。他們可以模擬商店和辦公室的變化,看看我們如何反應,然後設法利用數學運算,找出提升績效的方法。像你這樣的購物者看到尼康(Nikon)高級相機降價一百美元時,會有什麼反應?如果花五百美元送你去上試算表的課程,能讓你提升多少生產力?如果公司裁掉你的同事的職位,或把他們調到印度班加羅爾工作,他們會怎麼樣因應這樣的狀況?數字搜客會把我們的模型放在各式各樣的可能情境中,在我們身上嘗試各種不同的處方或廣告方式。他們會看看我們嘗試新運動或調職到遠地後,可能會有什麼反應。我們不需要參與其中,我們甚至渾然不覺我們的數學分身彷彿實驗室白老鼠般,日以繼夜地辛勤操練。我們看到的只是研究的結果--有用的建議、處方或訂單。

  這個資訊爆炸的世界是個巨大的人類行為實驗室,是經濟行為和心理學等社會科學的測試場。微軟和雅虎等公司的研究人員忙著聘請從醫學到語言學等各個領域的科學家,協助他們掌握從我們生活點滴中湧出的龐大資訊。這些數位化的資訊流完全不受古老疆界的限制,它們都透過演算法來定義,而非根據學門來分類,因此很容易就可以相互滋養。這表示心理學家、經濟學家、生物學家和電腦科學家可以用前所未有的方式密切合作,大家都過濾無數關於我們生活的種種細節後,從中找出答案。紐約新媒體公司Inform Technologies的首席科學家傑克.艾荷恩(Jack Einhorn)預測,二十一世紀的偉大發現將來自於從龐大數據中找出型態。「下一個如沙克4般對世界造成巨大影響力的人,將是數學家。」

情緒變化--值得探索的新疆界

  仲夏的曼哈頓,交通嚴重打結。我抵達紐約雀兒喜區的法國小餐館時,摩根已經坐在窗邊的桌旁,閱讀Treo多媒體手機收到的電子郵件。我們用餐的時候,他看起來心不在焉,不時瞄一下手機。服務生送來甜點菜單時,摩根的手機響了。他看了手機一眼,向我道聲對不起,就匆匆離開,走入酷熱的暑氣中。我從靠窗的位子上看著他走到對街,快步往遠方走去。

  再見到摩根,已經是十月了。他搬離塔科達在第七大道的辦公室,剛剛在美國線上總部安頓下來,他在高樓上的辦公室正好俯瞰洛克斐勒中心的溜冰場。我和他在門口碰面,一起往餐廳走去。他說就在我們上次共進午餐那天,他和投資人達成共識,把塔科達賣給美國線上。(據說售價高達二億七千五百萬美元,應該順便提一下,數字搜客通常都賺很多錢。5)至少就目前而言,摩根是美國線上的資深廣告主管。他當然不是真的需要這份薪水,不過他說他忍不住要繼續留在工作崗位上。他說,有了美國線上的資源和數百萬用戶,他可以對上網人口有更多的了解,而且可以更準確地針對我們促銷。這是個漫長的過程,他說,「目前只是開端而已。」

  我問他先前告訴我的關聯性,也就是愛情電影迷和租車行為之間有什麼關聯。他過了一會兒才想起來是怎麼一回事。我問他,他的研究人員後來有沒有找出任何解釋?他點點頭,「一定和周末有關係。」他說,阿拉莫租車公司的廣告中提倡的「逃離現實世界」的概念,吸引了網頁瀏覽者的注意,愛情電影迷之所以租休旅車,主要是為了周末度假。或許他們想要模仿深深吸引他們的電影情節,非週末期間的租車廣告顯然就引不起他們的興趣。

  這件事讓摩根更洞悉我們的感覺。他說,無庸置疑,許多愛情電影迷在出差時也可能租車。但是在瀏覽了浪漫愛情電影的影評後,他們只想逃離辦公室,躲到那帕谷或南塔克特島度假。至少就當下而言,他們早把工作拋到千里之外了。所以,眼前的挑戰是不只要找出我們的品味和偏好,還要了解我們的情緒變化。「想想看,」他說:「人們會點擊的電影和音樂透露出許多他們當下的心理狀態。他們快樂嗎?還是在沉思?」他認為,我們透過行動電話流露的情緒訊息是值得探索的新疆界,是挖掘行為資訊的金礦。他繼續描述美國線上等音樂網站為廣告商帶來的潛在機會,廣告商可以藉由觀察我們點擊的是快樂、悲傷或鼓舞人心的歌曲,而了解我們當時的情緒狀態。

  關於這點,我倒是沒那麼確定。如果我點擊一首快樂的歌,或許只不過是想提提神罷了。摩根聳聳肩。他要等到做了更多研究之後,才會知道答案,這表示他需要搜集更多數據,計算更多數字。單單想到這點,就會讓他笑逐顏開。窗外的天色漸暗,雨水打散了聚集在洛克斐勒中心的群眾。摩根用雙手蓋住頭,飛奔回他的行為實驗室。

  1 電腦跟隨使用者造訪過的網站所記錄下的檔案,目的是儲存使用者瀏覽過的網址等資訊。

  2 費爾艾薩克公司也希望將他們在數據分析和模型化的專業技術應用在其他領域,其中一個潛在市場是醫藥界。由於忘記服藥的病人往往會因為更嚴重(也更花錢)的健康問題而被送進急診室,據估計,美國保險公司每年因此付出的金額高達一百五十二億美元。所以費爾艾薩克公司正在開發的系統會根據病人不按時服藥的風險,給每個人一個分數。人們會不會按時服藥可能和年齡、教育程度或是否獨居有關。如果未來研究人員弄清楚該如何預測這樣的風險,風險指數很高的病人可能會每天接到診所打來的電話,提醒他們該服藥了。費爾艾薩克公司也在思考如何為誠實、慷慨和可靠等人類特質設計評分方式。如果未來慈善機構能拿到我們的慷慨指數,那麼他們募款就會更有效率。不過目前這還只是空想罷了。

  3 algorithm,其英文原文,乃源自第九世紀的波斯科學家Al-Khwarizmi的名字,但在他誕生之前,演算法早已存在。隨著電腦誕生,應用數學家和工程師開始創造出愈來愈多演算法。今天,演算法是搜尋引擎和行銷活動後面的發動機,美國職棒大聯盟整個球季的賽事日程表也要靠演算法來擬定。你可以把演算法想成一套指令,是一系列關於計數、分類、運算和比較的指令,簡言之,就是完成電腦運算工作的指令。比方說,搜尋引擎的演算法會計算每個網頁會連結到多少其他網頁,網友造訪頻率為何、以及關鍵字在每一頁出現多少次等。演算法的指令必須清晰而合乎邏輯,遵循一套嚴謹的規則。

  4 Jonas Salk, 1914-1995,小兒麻痺症沙克疫苗的發明人。

  5 塔科達不是唯一被網路巨擘收購的行為科技廣告公司。二○○七年九月,雅虎以三億美元買下和塔科達非常類似的新公司BlueLithium。再前一年,微軟也花了六十億美元收購廣告科技公司aQuantive,這家公司擁有行為科技事業部DrivePM。

推薦文一

擋不住的技術,就在你我身邊
奧美互動行銷公司董事總經理
張志浩

  工作的關係,往返於台灣與大陸是每個月的例行事務。而飛行途中正是閱讀的好時機。上周,正沉靜在閱讀本書的內容時,突然一位空姐打斷了我,並問了一句:「Mr. Chang,一切還好嗎?」我驚訝的望著她回答:「Fine, Thank you.」,心裡卻納悶,她為何知道我姓張,而且坐在這裡(經濟艙)?我因此班機的人數不多,早已換了一個較大空間,且周圍無人的座位。但他們似乎還是積極的搜尋我,關心我(還是監視我?)?還是因為我是累積里程的「Frequent Flyer」?

  我了解這一切都是拜資料庫行銷的顧問關係管理(CRM)的關懷活動,但仍覺得恐怖。這就是資料採礦(Data mining)之後的行銷活動,資料庫的資訊累積加上一群「數字搜客」,或一群「資料礦工」 (Data miner)進行所謂的分群、預測等專案,都是以消費者的行為數據累積後加以分析,然後進行行銷活動。這樣的活動,早在十多年前,就已於許多企業中展開。只是未來如果將一個人的信用卡紀錄、銀行往來紀錄、手機通訊紀錄、網路行為再加上各式各樣的會員活動紀錄整合一起分析,那麼人還有隱私嗎?這就是「數字搜客」正在進行的事情。

  這樣的發展永遠與其他議題一樣有著正反兩極的爭論,如核能源的發展,如細胞複製的發展。但唯一不爭論的是,人類是一直不斷的往前邁進,追求新的技術,發明新的科技,根本目的原是以造福人類的福祉而出發,這種趨勢似乎也阻擋不了!

  從一個行銷從業人員的角度,數位是一個必然發展的趨勢,數位(Digital),數字(0;1)累積了龐大的數據(Data),就像一座礦山,人類忍不住好奇的會挖採、分類、分析,然後去蕪存菁地找出精華運用,甚至創造財富,點「字」成金。這是人類的本性,防堵不了,就像不合法的「性」,禁了千年,也是無效。那麼到底如何處理呢?法律規範?就像NCC日前打算嚴格管制eDM電子傳單的散發,個人覺得只是螳臂擋車,毫無意義。企業的自我約束、道德規範及不斷的教育消費者正確的數位概念,訴諸於民意(網路鄉民意),就像Web2.0分享的概念,日久自會形成集體的監督機制,法律只是最後手段。

  《當我們變成一堆數字》一書非常值得一讀,可以幫助自己了解:自己處於何種環境,並想想自己的態度及因應之道!

推薦文二

數字是窮人的原子彈
網路趨勢專家
劉威麟(Mr.6)

  如果說網路是窮人的原子彈,那數字又是原子彈中最新的品種。

  看了這本《當我們變成一堆數字》,我很有感覺,因為我正是「數字」的愛好者與擁護者。我看到了「數字」還有源源不絕的力量,可以讓每一個小人物一吐豪氣。

  《當我們變成一堆數字》寫得很好。我覺得其中最重要的是,從歷史的角度來看,「搜尋引擎」絕對是史上最重要的發明之一。

  十多年來,我一直在網際網路的世界打滾,在網際網路圈我看過最大的一次「權力更替」,應該就是Yahoo!與Google的世代交替,前者(Yahoo!)是以媒體為大傘,將人與人之間串連起來;後者(Google)其實只是「機器」,和Yahoo!比起來貧乏得很,它沒有「人氣」,幾乎只是資料,但是這些資料卻是「來自所有人」所一點一滴貢獻出來的資料。我們一度認為,上網的意義在於和更多的人產生互動,現在我們已經完全被搜尋引擎給收服了。原來,上網最大價值,在於快速的掌握其他六十億人所幫我們點點滴滴提供的資訊。

  本書中所提到的「數字搜客」,就是使用搜尋引擎的箇中好手。他們還有其他的門路,搜尋引擎是他們其中一個開始。對於專業「數字搜客」而言,任何他們要的資料都可以在第一次的搜尋就相當準確地被「找出來」。隨著更進一步地搜尋,就會一次比一次更精確。要他們做一場精彩的報告,需要的時間可能只要十五秒,如果給他們十五個小時,說不定可挖出足以巔覆整個產業的秘密!

  其實,根據我對網路世界的理解,做這些事情的人很多,除了Google外,全球隨時都有好多「爬蟲」在默默地翻閱我們在網路上所留下的蹤跡,默默地在比對!

  所以,對每一個個人來說,也要有點警覺心,比如說,我自己可能在部落格上透露了自己的小孩是二歲,男生,然後買了一罐嬰兒奶粉,這些資料其實已經被記錄了下來。同時,也不要小看自己在網路上隨便透露自己對某個產品不太喜愛,說不定也已經被默默的排在搜尋引擎之首,隨便有人搜尋都看得到。

  不過,更大的金礦,還在後面!

  現在的儲存技術已經非常好,可以將所有的資訊都記錄下來,但是資訊要整理出一個「結論」,依然需要更厲害的技術。資料採礦的技術已持續加速進展,而化成 0與1數字的各種資訊也以更狂暴的速度往上成長中,知名網站如亞馬遜其實也只能分析這麼多數字中非常小的比例。因此,這也是許多公司現在砸錢的主要標的。

  在未來來臨之前,現在開始追風,還不算太晚。每個人都可以先開始看看「數字搜客」的故事,或許有機會,加入這場世紀盛宴!




其 他 著 作
1. 實驗鼠的祕密基地 Mrs. Frisby and the Rats of NIMH
2. 99分:快樂就在不完美的那條路上
3. 杜拉克談高效能的5個習慣
4. 真希望我20歲就懂的事:史丹佛大學的創新×創意×創業震撼課程
5. 杜拉克教我的17堂課
6. 最後一個甜甜圈不要拿
7. 杜拉克給經理人的行動筆記(皮面精裝)
8. 基業長青(軟皮精裝)
9. 從A到A+的社會(軟皮精裝)
10. 科技頑童沃茲尼克