自序
測不準原理究竟是我們觀察的原因,還是物質本身的內秉性質?這要先對機率進行一番哲學思辯。人工智慧(AI) 的精神,就是科學的結果非全部都屬「決定論(determinism)」,而應再融入「機率論(probability theory)」。目前人工智慧(AI) 基於仿生學、認知心理學、Bayesian 迴歸、機率論、統計學和經濟學的演算法等等也在逐步發酵中。AI 又稱機器智能,是指由人製造出來的機器所表現出來的智能。通常人工智慧是指通過普通電腦程式的手段實現的人類智能技術。該詞也指出研究這樣的智慧型系統是否能夠實現,以及如何實現的科學領域。
AI 又稱「製造智慧機器的科學與工程」,迄今,已是一門顯學,屬於自然科學和社會科學的交集。AI 實際應用,包括:FinTech、財經預測、機器視覺、指紋識別、人臉識別、視網膜識別、虹膜識別、掌紋識別、專家系統、自動規劃等貝氏迴歸的預測。機器學習演算及Bayesian 後驗機率等貝氏推論,不僅適合傳統科學研究法,更適合於大數據(big data) 時代的來臨。
機器要達到具備思考能力的統合強人工智慧,比較流行的方法包括統計方法,計算智慧和傳統意義的AI。目前有大量的生產線工具應用了人工智慧,其中包括搜尋和數學最佳化、邏輯推演「貝葉斯定理(Bayesian theorem)」。
迄今STaTa 己提供45 種Bayesian 迴歸,供人工智慧、機器學習等自然科學及社會科研究者使用,這種AI 統計應用技術已非常成熟。但坊間仍無「人工智慧」貝氏迴歸分析的書,殊實可惜。
數學中的貝氏定理,只要「前提( 先驗) 越清楚、預測就越精準」,例如「颱風對臺北市帶來災情」在沒有絕對的把握時,就在規定期限前蒐集最多的資料,再做最後決定。
本書貝氏45 種迴歸,採用貝氏條件機率的原理,故適合學科,包括:生物醫學、財經、物理學、哲學和認知科學、邏輯學、數學、統計學、心理學、電腦科學、控制論、決定論、不確定性原理、社會學、教育學、經濟學、犯罪學、智慧犯罪等。
STaTa 是地表最強統計軟體,作者撰寫一系列STaTa 書籍,包括:
1. 《 STaTa 與高等統計分析的應用》一書,該書內容包括:描述性統計、樣本數的評估、變異數分析、相關、迴歸建模及診斷、重複測量等。
2. 《 STaTa 在結構方程模型及試題反應理論》一書,該書內容包括:路徑分析、結構方程模型、測量工具的信效度分析、因素分析等。
3. 《 STaTa 在生物醫學統計分析》一書,該書內容包括:類別資料分析 ( 無母數統計)、logistic 迴歸、存活分析、流行病學、配對與非配對病例對照研究資料、盛行率、發生率、相對危險率比、勝出比(Odds Ratio) 的計算、篩檢工具與ROC曲線、工具變數(2SLS)?Cox 比例危險模型、Kaplan-Meier 存活模型、脆弱性之Cox 模型、參數存活分析有六種模型、加速失敗時間模型、paneldata存活模型、多層次存活模型等。
4. 《 Meta 統計分析實作:使用 Excel 與 CMA 程式》一書,該書內容包括:統合分析(meta-analysis)、勝出比(Odds Ratio)、風險比、4 種有名效果量(ES) 公式之單位變換等。
5. 《 Panel-data 迴歸模型:STaTa 在廣義時間序列的應用》一書,該書內容包括:多層次模型、GEE、工具變數(2SLS)、動態模型等。
6. 《 STaTa 在總體經濟與財務金融分析的應用》一書,該書內容包括:誤差異質性、動態模型、序列相關、時間序列分析、VAR、共整合等。
7. 《 多層次模型 (HLM) 及重複測量:使用 STaTa》一書,該書內容包括:線性多層次模型、vs. 離散型多層次模型、計數型多層次模型、存活分析之多層次模型、非線性多層次模型等。
8. 《 模糊多準評估法及統計》一書,該書內容包括:AHP、ANP、TOPSIS、Fuzzy 理論、Fuzzy AHP?等理論與實作。
9. 《邏輯斯迴歸及離散選擇模型:應用 STaTa 統計》一書,該書內容包括:邏輯斯迴歸、vs. 多元邏輯斯迴歸、配對資料的條件Logistic 迴歸分析、MultinomialLogistic Regression、特定方案Rank-ordered logistic 迴歸、零膨脹orderedprobit regression 迴歸、配對資料的條件邏輯斯迴歸、特定方案conditional logit model、離散選擇模型、多層次邏輯斯迴歸等。
10《有限混合模型(FMM):STaTa分析(以EM algorithm做潛在分類再迴歸分析)》一書,該書內容包括:FMM:線性迴歸、FMM:次序迴歸、FMM:Logit 迴歸、FMM:多項Logit 迴歸、FMM:零膨脹迴歸、FMM:參數型存活迴歸等理論與實作。
11《多變量統計之線性代數基礎:應用 STaTa 分析》一書,該書內容包括:平均數之假設檢定、多變量變異數分析(MANOVA)、多元迴歸分析、典型相關分析、區別分析(discriminant analysis)、主成份分析、因素分析(factor analysis)、集群分析(cluster analysis)、多元尺度法(multidimensional scaling, MDS)等。
12《人工智慧 (AI) 與貝葉斯 (Bayesian) 迴歸的整合:應用 STaTa 分析》,該書內容包括:機器學習及貝氏定理、Bayesian 45 種迴歸、最大概似(ML) 之各家族(family)、Bayesian 線性迴歸、Metropolis-Hastings 演算法之Bayesian 模型、Bayesian 邏輯斯迴歸、Bayesian multivariate 迴歸、非線性迴歸:廣義線性模型、survival 模型、多層次模型。
此外,研究者如何選擇正確的統計方法,包括適當的估計與檢定方法、與統計概念等,都是實證研究中很重要的內涵,這也是本書撰寫的目的之一。為了讓研究者能正確且精準使用Bayesian 迴歸,本書內文儘量結合「理論、方法、統計」,期望能夠對產學界有拋磚引玉的效果。
最後,特感謝全傑科技公司(http://www.softhome.com.tw),提供STaTa 軟體,晚學才有機會撰寫STaTa 一系列的書,以嘉惠學習者。
?
張紹勳 敬上