庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
區政新角度
  • 定價64.00元
  • 8 折優惠:HK$51.2
  • 放入購物車
二樓書籍分類
 
Spark技術手冊:輕鬆寫意處理大數據

Spark技術手冊:輕鬆寫意處理大數據

沒有庫存
訂購需時10-14天
9789865022990
Matei Zaharia,Bill Chambers
歐萊禮
2019年10月18日
293.00  元
HK$ 263.7  






ISBN:9789865022990
  • 規格:平裝 / 608頁 / 18.5 x 23 x 3.04 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 資料庫/大數據 > 資料處理/大數據











      本書是由Spark這個專案的成員所撰寫,詳盡的說明如何使用、部署與維運Apache Spark。本書將帶領您探索Spark結構化API基礎操作、結構化串流,並透過新的高階API建立端到端的串流應用。開發與系統管理人員可由本書學習到如何進行Spark的監控、調校以及除錯,以及如何使用MLlib分散式機器學習函式庫。



      .完整說明大數據與Spark

      .透過實際的範例學習DataFrame、SQL與Dataset等Spark核心API概念

      .深入了解Spark低階API、RDD以及DataFrame與SQL的關係

      .學習如何在叢集環境運行Spark

      .針對Spark叢集與應用程式進行除錯、監控與調校

      .體會Spark結構化串流處理引擎的威力

      .學習MLlib函式庫並將其應用於多種分類或推薦等機器學習專案中



      Bill Chambers是Databricks的產品經理,專注於大數據分析並提供企業用戶完整的文件與協作讓客戶藉由Spark與Databricks取得成功。



      Matei Zaharia是史丹佛電腦科學系的助理教授以及Databricks的技術長。他於2009在加州柏克萊大學發起Spark專案,同時他也是Apache Mesos專案的共同發起人以及Apache Hadoop的早期貢獻者。



    好評推薦



      「本書是專業Spark開發人員的必讀指南,提供在其他書上找不到的技巧與訣竅」 —Ion Stoica, Director of the UC Berkeley RISE Lab


     





    第一篇 大數據與Spark概覽

    第1章 何為Apache Spark?

    第2章 Spark 簡介

    第3章 Spark 工具組導覽



    第二篇 結構化API—DataFrame、SQL與Dataset

    第4章 結構化API 概覽

    第5章 基礎結構化操作

    第6章 操作不同型別的資料

    第7章 聚合

    第8章 關聯

    第9章 資料源

    第10章 Spark SQL

    第11章 Datasets



    第三篇 低階API

    第12章 彈性分散式資料集(RDD)

    第13章 進階RDD

    第14章 分散式共享變數



    第四篇 Production Applications

    第15章 如何在叢集上運行Spark

    第16章 開發Spark 應用程式

    第17章 部署Spark

    第18章 監控與除錯

    第19章 效能調校



    第五篇 串流

    第20章 串流處理基礎

    第21章 結構化串流基礎

    第22章 事件時間和狀態處理

    第23章 生產級的結構化串流



    第六篇 進階分析與機器學習概覽

    第24章 進階分析與機器學習概覽

    第25章 前處理與特徵工程

    第26章 分類

    第27章 迴歸

    第28章 推薦

    第29章 非監督式學習

    第30章 圖形分析

    第31章 深度學習

    第32章 其他特定語言: Python(PySpark) 與R(SparkR 和sparklyr)

    第33章 生態系與社群




    其 他 著 作