庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
秘密花園
  • 定價93.00元
  • 8 折優惠:HK$74.4
  • 放入購物車
二樓書籍分類
 
網站擷取:使用Python(二版)

網站擷取:使用Python(二版)

沒有庫存
訂購需時10-14天
9789864769261
Ryan Mitchell
楊尊一
歐萊禮
2018年10月09日
193.00  元
HK$ 173.7  






ISBN:9789864769261
  • 規格:平裝 / 280頁 / 18.5 x 23 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 程式設計 > SQL

















      在現代網路蒐集資料



      如果程式設計是魔術,那麼網站擷取當然是一種魔法。你可以撰寫簡單的自動化程式查詢網頁伺服器、請求資料、並解析所需的資訊。本書不只介紹網頁擷取,還包含擷取各種現代網站資料的詳盡指南。



      本書第一部份專注於網站擷取機制:使用Python從網頁伺服器取得資料、執行伺服器回應的基本處理工作、以及與網站的自動化互動。第二部分探索適用於不同擷取場景的各種工具與應用程式。



      •解析複雜HTML網頁

      •以Scrapy架構開發爬行程序

      •學習爬行資料的儲存方式

      •從文件讀取與提煉資料

      •清理格式不良的資料

      •以自然語言讀寫

      •透過表單與登入的爬行

      •JavaScript與API爬行

      •使用影像文字識別軟體

      •避開爬行陷阱與機器人阻擋程序

      •使用爬行程序測試你的網站



    好評推薦



      「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」 — Eric VanWyk, 電子計算機工程師,麻州歐林工程學院


     





    前言



    第一部 建構擷取程序

    第一章 你的第一個擷取程序

    第二章 進階HTML解析

    第三章 撰寫網站爬行程序

    第四章 網站爬行模型

    第五章 Scrapy

    第六章 儲存資料



    第二部 儲存資料

    第七章 讀取文件

    第八章 清理髒資料

    第九章 讀寫自然語言

    第十章 表單與登入

    第十一章 與擷取相關的JavaScript

    第十二章 透過API 爬行

    第十三章 影像處理與文字辨識

    第十四章 避開擷取陷阱

    第十五章 以爬行程序測試你的網站

    第十六章 平行擷取網站

    第十七章 遠端擷取

    第十八章 網站擷取的法規與道德



    索引




    其 他 著 作
    1. 網站擷取:使用Python