CH7:介紹SQL Server 2016版才有的新功能,也是微軟致力於大數據分析的解決方案,主要提供資料科學家能夠透過原先所熟悉的R語言,不論是在交談式介面中透過SQL Server R Services直接撰寫R腳本指令進行資料分析,或是在Visual Studio.NET中透過R Tools for Visual Studio或Microsoft R Client的安裝,在原有Visual Studio開發環境撰寫R指令從事各種機器學習,進行關聯、分類、集群和預測的工作。
書附光碟內容
※CD�本書範例檔案
1.Microsoft SQL Server 2016 範例資料庫
2.SQLServer2016
?
目 錄
Chapter 0 大數據時代導讀
?
Chapter 1 視界
1.1 視界的優點
1.2 視界的缺點
1.3 視界的種類
1.4 使用「Management Studio」建立檢視表
1.5 使用「Management Studio」修改檢視表
1.6 使用「Management Studio」刪除檢視表
1.7 使用「T-SQL 指令」建立檢視表
1.8 使用「T-SQL 指令」修改檢視表
1.9 使用「T-SQL 指令」編輯檢視表的資料
1.10 使用「T-SQL 指令」刪除檢視表
1.11 習題
?
Chapter 2 索引
2.1 主索引
2.2 叢集索引
2.3 次索引
2.4 多層索引
2.5 密集索引和稀疏索引
2.6 使用「Management Studio」建立索引
2.7 使用「Management Studio」修改索引
2.8 使用「Management Studio」刪除索引
2.9 使用「T-SQL 指令」建立索引
2.10 使用「T-SQL 指令」修改索引
2.11 使用「T-SQL 指令」刪除索引
2.12 習題
?
Chapter 3 交易管理和並行控制
3.1 交易管理
3.2 為何需要並行控制
3.3 排程的循序性
3.4 並行控制的方法
3.5 使用「T-SQL 指令」執行交易
3.6 習題
?
Chapter 4 VB.NET 2015 資料庫系統實作
4.1 ADO.NET簡介
4.2 建立資料庫系統專案
4.3 習題
?
Chapter 5 SQL Server 可程式性物件
5.1 規則物件
5.2 預設值物件
5.3 預存程序物件
5.4 觸發程序物件
5.5 習題
?
Chapter 6 資料倉儲與資料探勘
6.1 資料倉儲簡介
6.2 資料探勘簡介
6.3 習題
?
Chapter 7 大數據分析與應用
7.1 大數據簡介
7.2 SQL Server R Services
7.3 R Tools for Visual Studio
7.4 Microsoft R Client
7.5 習題
?
序
序
大數據時代導讀
不論資訊科技如何演進,從大型主機(Mainframe)、主從式(Client-Server)、三階層(Three-tier)架構,乃至於現今大眾耳熟能詳的雲端運算、行動APP、社群媒體、物聯網等應用模式,亙古不變的是「資料」依舊成為企業營運的核心命脈,畢竟沒資料就沒價值(No data, no value)。隨著雲端運算盛行,Hadoop框架中的HDFS(Hadoop Distributed File System)讓大量資料得以分散式儲存、MapReduce則是讓大量資料得以分散式計算,藉由大量儲存和快速運算等兩大特性,讓大數據分析得以實現。平心而論,大數據並不是一個新議題,經過這些年各大媒體爭相報導,企業也逐漸從模糊的概念、爭相理解,到最後認同大數據的實用價值,思慮如何導入應用,冀望能輔助公司決策更加精準。
有鑑於此,筆者將這些年從事大數據分析工作可能會用到的理論知識、系統開發,程式撰寫,建立模型的經驗整理成冊,希望對於想要踏入大數據分析這個領域的讀者有所助益。書中第一、二、三、五章主要介紹關聯式資料庫中進階技巧,以檢視表為開端,接續單元介紹索引技術、交易管理和可程式性物件,這些章節內容與觀念可以讓我們處理大量結構化資料時更有效率,第四章則是介紹ADO.NET資料庫程式設計,讓讀者從無到有建置一個小型資訊系統專案,相信對於資訊系統開發有一定認識、對於程式撰寫能力也會提升,第六章介紹資料倉儲與資料探勘,對於監督式學習或非監督式學習相關知識有一定程度的了解。最後第七章則是介紹SQL Server 2016版才有的新功能,也是微軟致力於大數據分析的解決方案,主要提供資料科學家能夠透過原先所熟悉的R語言,不論是在交談式介面中透過SQL Server R Services直接撰寫R腳本指令進行資料分析,或是在Visual Studio.NET中透過R Tools for Visual Studio或Microsoft R Client的安裝,在原有Visual Studio開發環境撰寫R指令從事各種機器學習,進行關聯、分類、集群和預測的工作。書中除了介紹一些常用和知名套件如何撰寫,例如:如何利用wordcloud套件繪製文字雲、Arules套件apriori進行關聯規則分析、stats套件kmeans進行集群分析、C50套件C5.0進行決策樹分析、stats套件glm和RevoScaleR套件rxLogit進行羅吉斯迴歸分析。更重要的是對於這些模型如何使用、和對跑出的結果如何進行解讀,都有非常完整的介紹,相信對於有志成為資料科學家的初學者而言,本書絕對是一本很好的入門書籍。