作者序
「想學習Python 的資料分析,可是該從何學起才好呢?」記得是2017年年中,在社群裡聽到這個問題。市面上雖然已有許多資料分析、機器學習的書籍,卻也因此讓人覺得某些相關書籍不是那麼充足,例如介紹Python基本工具的書,或是介紹分析資料所需的數學知識的書,所以我才決定要寫這本書,也感謝共同作者的幫助,這本書才得以問世。
本書算是一本教科書,主要介紹Python資料分析工具與分析所需的數學知識,也會針對資料分析所需的資訊進行完整又簡潔的說明。希望大家能透過本書學習最基礎的知識,再利用其他官方文件或書籍學習本書未及之處。
本書的目標族群是想成為資料分析工程師的讀者、對Python有一定程度了解的工程師。所謂「有一定程度了解」,指的是能讀懂Python官方教戰手冊的程度,本書也只介紹最低限度所需的Python語法與規格。至於資料分析方法,會使用NumPy或pandas介紹處理資料的方法,接著會介紹以Matplolib具體呈現資料的方法,最後再解說以scikit-learn進行機器學習的分類或預測的方法。除了工具的使用方式之外,也會解說基礎的數學知識。
要分析資料或是進行機器學習,就必須具備相關的數學知識,所以本書將從數學公式開始講解,直到大家能了解數學公式為止。再者,實際分析資料時,收集資料、將資料轉換成方便分析的格式都是非常重要的一環,所以本書也將簡單地介紹網路爬蟲、自然語言處理、影像處理這些內容。
期待各位讀者能透過本書全面地學習資料分析,進而踏出成為資料分析工程師的第一步。
作者代表 寺田學