{itemname}
{itemname}
香港二樓書店 > 今日好書推介
拒絕家庭意外!居家安全設計健檢100+:瓦斯•水電•防墜•防盜,讓家人遠離危險的保平安設計
定價93.00元
8
折優惠:
HK$74.4
●二樓推薦
●文學小說
●商業理財
●藝術設計
●人文史地
●社會科學
●自然科普
●心理勵志
●醫療保健
●飲 食
●生活風格
●旅 遊
●宗教命理
●親子教養
●少年讀物
●輕 小 說
●漫 畫
●語言學習
●考試用書
●電腦資訊
●專業書籍
網站擷取|使用Python 第三版
沒有庫存
訂購需時10-14天
9786264250948
Ryan Mitchell
賴屹民
歐萊禮
2025年8月27日
240.00 元
HK$ 216
詳
細
資
料
ISBN:9786264250948
規格:平裝 / 356頁 / 18.5 x 23 x 1.6 cm / 普通級 / 單色印刷 / 三版
出版地:台灣
分
類
電腦資訊
>
程式設計
>
SQL
同
類
書
推
薦
手術刀般精準的FRM - 用Python科學管控財金風險(實戰篇)
手術刀般精準的FRM:用Python科學管控財金風險(基礎篇)
Python桌面開發王者:Qt 6最強實例貫穿開發
Python+Office辦公自動化實戰
Python 資料結構×演算法 刷題鍛鍊班:234 題帶你突破 Coding 面試的難關
內
容
簡
介
從現代網頁爬取資料?
爬取×解析×轉換──讓資料收集快、準、全,告別繁瑣工作!?
從HTML到API、從圖片到文字,使用Python做網頁爬取,能廣泛應用於市場預測、機器翻譯甚至是醫學診斷,實用性極高。因此,無論在哪一個領域,網路爬蟲都可以更有效地應用於商務、分析、提升生產效能,開創新機會。?
「本書是內容豐富的傑作,可幫助讀者有意識地、有效地抓取網頁資料,值得推薦給想從網站爬取資料、打算建立網站和分享資料的每一個人。」 —Michael Hopkins P.Geo., PMP?
如果說程式設計像魔法一樣,那麼「網站擷取」無疑就是一種巫術,只要寫一個簡單的自動程式,就可以用它來查詢網頁伺服器、請求資料、解析資料,並提取所需資訊。本書第三版經過徹底翻新,不僅介紹網路爬取,也全面性地教你如何從現代網頁抓取幾乎每一種類型的資料。?
本書的第一部分專門討論網路爬取機制,包括使用 Python 從網頁伺服器請求資訊、初步處理伺服器的回應,以及自動和網站進行互動。第二部分則探討更具體的工具和應用,以應對可能遇到的各種網頁爬取情境。?
本書教你如何:?
•解析複雜的HTML網頁?
•使用Scrapy框架來開發爬蟲?
•儲存你抓到的資料?
•從文件中讀取和提取資料?
•清理格式不嚴僅的資料,以及將之正規化?
•讀寫自然語言?
•爬取表單與登入網站?
•爬取JavaScript和 API?
•使用和編寫「圖片轉文字」軟體?
•避免爬網陷阱和反機器人封鎖?
•使用爬蟲來測試自己的網站?
?
目
錄
第一部分 建構爬蟲?
第 1 章 網際網路的運作方式?
第 2 章 網頁爬蟲的法律問題與道德原則?
第 3 章 網頁爬蟲的應用?
第 4 章 寫出你的第一個網路爬蟲?
第 5 章 進階 HTML 解析?
第 6 章 編寫網路爬蟲?
第 7 章 網頁爬取模型?
第 8 章 Scrapy?
第 9 章 儲存資料?
第二部分 進階抓取?
第 10 章 讀取文件?
第 11 章 處理髒資料?
第 12 章 讀寫自然語言?
第 13 章 藉由表單與登入來爬網?
第 14 章 抓取 JavaScript?
第 15 章 透過 API 來爬取資料?
第 16 章 圖片處理與文字辨識?
第 17 章 避免抓取陷阱?
第 18 章 使用爬蟲來測試你的網站?
第 19 章 平行爬網?
第 20 章 網路爬蟲代理?
序
序
電腦程式設計對尚未掌握技巧的人來說如同一種魔法。如果說程式設計就像魔法,那麼網路抓取就像巫術了,所謂的巫術,就是輕鬆寫意地施展魔法來實現令人印象深刻且實用的壯舉。?
在我擔任軟體工程師的時期,很少程式設計實務可以像網路爬取一樣,讓程式設計師和外行人都備感期待。寫一個簡單的自主程式來收集資料,並將那些資料顯示在終端機上或儲存在資料庫裡並非難事,但無論你完成幾次,那種令人振奮的體驗和無限可能的感受都不會消失。?
遺憾的是,當我和其他程式設計師討論網路爬取時,他們依然對這一門技術有一些誤解與困惑。有些人不確定這樣做是否合法(它是合法的),或不知道如何處理大量使用 JavaScript 的網頁,或需要登入才能爬取的情況。很多人不明白如何啟動大型的網路爬蟲專案,甚至不知道該去哪裡尋找資料。本書的目標是解答這些常見的疑問與誤解,並提供大多數網路爬取任務的完整指南。?
網路爬取是一個多樣且變化迅速的領域,本書試著提供高階的概念和具體的範例,希望涵蓋你可能會遇到的各種資料收集專案。在整本書中,我提供許多程式來示範這些概念,並讓你實際操作它們;所有程式範例都可以在 GitHub 上閱讀和下載。這些範例程式可以自由使用和修改,無論你是否註明來源(當然,若能註明來源,我將感激不盡)。
書
評
其 他 著 作