庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
二樓書籍分類
 
唯一串流大數據處理平台:Apache Kafka動手做

唯一串流大數據處理平台:Apache

沒有庫存
訂購需時10-14天
9789865003654
胡夕
深石
2019年2月25日
193.00  元
HK$ 164.05  






ISBN:9789865003654
  • 規格:平裝 / 496頁 / 17 x 23 x 2.2 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 資料庫/大數據 > 資料處理/大數據











      作者把學到的知識及原理集中整理、轉化成文字來幫助那些尚未接觸Kafka 的讀者們,希望讀者們能夠降低在學習Kafka 時所花費的時間成本、 快速上手;作者也期許眾讀者們,於閱讀完本書的同時,能夠和作者一樣,體驗到瞭解一個過去從未觸及的領域時,所產生的那種滿足及興奮感。



    本書特色



      結合典型使用場景, 對Kafka 整個技術體系進行了較為全面的講解。對Kafka 的設計原理及其流式處理組件進行了較深入的探討。書附詳實案例,便於讀者了解實際情形。


     





    01 認識Apache Kafka

    1.1 Kafka 快速入門

    1.2 訊息引擎系統

    1.3 Kafka 概要設計

    1.4 Kafka 基本概念與術語

    1.5 Kafka 使用場景

    1.6 本章小結



    02 Kafka 發展歷史

    2.1 Kafka 的歷史

    2.2 Kafka 版本變遷

    2.3 如何選擇Kafka 版本

    2.4 Kafka 與Confl uent

    2.5 本章小結



    03 Kafka 線上環境部署

    3.1 叢集環境規劃

    3.2 虛擬分散式環境安裝

    3.3 多節點環境安裝

    3.4 驗證部署

    3.5 參數設定

    3.6 本章小結



    04 producer 開發

    4.1 producer 概覽

    4.2 建置producer

    4.3 訊息分區機制

    4.4 訊息序列化

    4.5 producer 攔截器

    4.6 無訊息遺失設定

    4.7 訊息壓縮

    4.8 多執行緒處理

    4.9 舊版本producer

    4.10 本章小結



    05 consumer 開發

    5.1 consumer 概覽

    5.2 建置consumer

    5.3 訂閱topic

    5.4 訊息輪詢

    5.5 位移管理

    5.6 重平衡(rebalance)

    5.7 解序列化

    5.8 多執行緒消費實例

    5.9 獨立consumer

    5.10 舊版本consumer

    5.11 本章小結



    06 Kafka 設計原理

    6.1 broker 端設計架構

    6.2 producer 端設計

    6.3 consumer 端設計

    6.4 實現精確一次處理語義

    6.5 本章小結



    07 管理Kafka 叢集

    7.1 叢集管理

    7.2 topic 管理

    7.3 topic 動態設定管理

    7.4 consumer 相關管理

    7.5 topic 分區管理

    7.6 Kafka 常見指令稿工具

    7.7 API 方式管理叢集

    7.8 MirrorMaker

    7.9 Kafka 安全

    7.10 常見問題

    7.11 本章小結



    08 監控Kafka 叢集

    8.1 叢集健康度檢查

    8.2 MBean 監控

    8.3 broker 端JMX 監控

    8.4 clients 端JMX 監控

    8.5 JVM 監控

    8.6 OS 監控

    8.7 主流監控架構

    8.8 本章小結



    09 最佳化Kafka 叢集

    9.1 引言

    9.2 確定最佳化目標

    9.3 叢集基礎最佳化

    9.4 最佳化傳輸量

    9.5 最佳化延遲時間

    9.6 最佳化持久性

    9.7 最佳化可用性

    9.8 本章小結



    10 Kafka Connect 與Kafka Streams

    10.1 引言

    10.2 Kafka Connect

    10.3 Kafka Streams

    10.4 本章小結









      這是一個最好的大數據時代,這是一個最壞的大數據時代!



      很抱歉,我使用了這句改編後的狄更斯名言作為開頭,我想沒有誰會質疑「當今是大數據時代」這個論點。實際到大數據企業內,各種各樣的大數據產業方興未艾,其中在即時流式處理領域湧現出大量的技術與架構,令技術人員們應接不暇。即時流式處理系統在克服了傳統批次處理系統延遲時間方面的固有缺陷的同時,還擺脫了設計上的桎梏,實現了「夢寐以求」的正確性。可以說,對流式處理從業人員來說,這正是摩拳擦掌、大展巨集圖的最好時代。



      與此同時,我們也清醒地意識到當今大數據領域內的細分越來越精細化。不必說日漸火爆的人工智慧和機器學習潮流引誘著我們改弦易轍,也不必說那些紛繁複雜的技術架構令人眼花繚亂,單是靜下心來沉澱所學、思考方向的片刻時光於我們這些從業者來說都已顯得彌足珍貴。我們仿佛在黑暗密林中徘徊,試圖找出那條通往光明的「康莊大道」。每當發現了一條羊腸小路都好似救命稻草一般緊



      緊抓住。多年後我們回望那只不過是不斷追逐熱點罷了,在技術的海洋中我們迷失了前進的方向。從這個意義上說,這實在是一個糟糕的時代。



      時光切回到4 年前的某個下午,那時我正在做著Kafka 的大數據專案。我突然發現與其盲目跟風各種技術趨勢,何不精進手頭的工作,把目前工作中用到的技術搞明白,於是我萌發了研究Kafka 的想法。直到今天,我都無比慶倖那個午後做出的衝動決定,正如Adam Grant 在《離經叛道》一書中所說:最正確的決定都是在衝動之下做出的。誠不欺我!

    ?




    其 他 著 作