前言
感謝你拿起本書。
對我來說,在大學部工學部(大學理工學院)念書,已經是三十年前的事了,那時我們的必修課程中並沒有統計學。不過,現在的電腦與網路科技比那時還要發達許多,蒐集、處理大規模資料已是再尋常不過的事,使統計學成為一門應用廣泛的學問。最近很流行的「人工智慧」,也是在蒐集了非常龐大的資料以後,從中找出我們想要的答案,這可說是統計學發展的結晶。另外,許多大學的共同課程中,也加入統計學課程。不管學生是文組還是理組、主修哪個領域,統計學都成為了一門必備的學問。
若我開的統計課上有許多來自各個領域的學生,我除了教他們統計學的計算過程,也會說明「統計學為什麼要這樣計算、有什麼目的」,也就是「統計學的內在」。
「統計學的內在」可以用數學表示。在我開的課中,為了讓學生不要被嚇跑,我一定會在一開始就說「統計學會用到的計算只有+、-、×、÷、平方根,還有次方這六種而已喔」。但當我們開始計算平均值,用到Σ這個符號(計算總和)時,就有學生撐不下去了。遺憾的是,這樣的學生還不算少。
這些地方之所以會成為學生的障礙,並不是因為學生們數學差。只是因為他們並不曉得這些符號在數學領域中的使用方式,或者說他們不了解數學的「語言」,也可能只是他們剛好忘了這些符號怎麼用而已。這些學生們就因為這樣而失去了接觸統計學的機會,我覺得是一件很可惜的事。
因此,在開始學習「統計的內在」前,本書準備了「數學準備篇」這個章節,以說明「數學的內在」。在這個部分中,我們會先從「如何閱讀數學相關書籍」開始說明,像是數學邏輯與日常邏輯有什麼不同、變數與常數,以及數學中常用到的「希臘字母」。此外,還會提到次方、平方根、以及Σ符號等,只在數學中出現的表現方式,也會說明微分、積分的概念。
在做完這些數學熱身運動後,就可進入「統計學基礎篇」,開始說明統計學的基礎原理。我們會先說明在蒐集資料之後如何進行分析,也就是所謂的「敘述統計學」。不論資料大小,我們都可以用代表值、相關、迴歸等概念說明資料的特性,我希望讀者在讀過這個部分「不只能說出每一筆資料各有不同,還能夠說出資料的組成特性」。
熟悉以上內容之後,就可進入「統計學進階篇」。我們會學到如何從蒐集到的資料,分析未能蒐集到的資料,也就是所謂的「推論統計」。在這個部分中,「機率」扮演著很重要的角色。推論統計方法中,若知道蒐集到之資料的「組成特性」,就可以知道除此之外的資料可能會長什麼樣子,這就是這個部分的重點。
在這裡有一個小小的要求想要拜託準備要閱讀這本書的你,當你在閱讀本書時,如果覺得好像有掌握到某些「統計學的內在」,請你一定要試著用個人電腦跑跑看資料處理。能夠進行資料處理的工具包括Excel之類的試算表軟體,以及R這類免費統計分析軟體,市面上有相當多這些軟體的解說書籍。如果在你親手操作這些工具、處理資料時,真正意會到「這個步驟想做什麼」,才表示這些統計學的「核心」真的有成為你的一部分。
執筆本書時,Ohm社書籍編輯部門的各位給予我許多協助,並提供了許多很棒的建議,在此表示我的謝意。
另外,由於我申請到了平成二十八年度關西大學研修員的身分,獲得了研修費,使我能夠在這段期間內專心於研究、寫作活動。本書的部分內容也是在這段期間內完成的。
筆者在大學開的統計學課程中所使用的投影片已公開於網站上,網址為:racco.mikeneko.jp/Kougi/。
二?一七年一月
淺野 晃