庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
成為賈伯斯:天才巨星的挫敗與孕成
  • 定價217.00元
  • 8 折優惠:HK$173.6
  • 放入購物車
二樓書籍分類
 
文本探勘:小技術大應用(附範例光碟)

文本探勘:小技術大應用(附範例光碟)

沒有庫存
訂購需時10-14天
9789865035082
許健將,劉福蒝
全華圖書
2020年10月27日
117.00  元
HK$ 111.15  






ISBN:9789865035082
  • 叢書系列:實用資訊
  • 規格:平裝 / 240頁 / 19 x 26 x 1.2 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣
    實用資訊


  • 電腦資訊 > 資料庫/大數據 > 資料處理/大數據











      動輒十萬字、甚至數十萬字的小說,其中人物錯綜複雜的關係、心境轉折與環境的變遷;廣大的網路訊息與文件,其中有多少潛藏的訊息等待我們發掘。文本探勘,就是要在大量文字中萃取出我們所需要的資訊。

    ?

      本書之撰寫,是針對完全不具備R語言能力之初學者為主要對象,以手把手的方式進行教學,讀者只要跟隨書本的章節和範例,一步一步地練習,相信必能在最短的時間內學會文本探勘的基本技術,並應用在自身所屬的領域上。包括語料庫的建立與相關套件的使用;利用文本探勘對中、英文小說進行各種分析;以及利用文本探勘進行網路爬蟲。全書由淺入深、按部就班地指導讀者學會文本探勘技術,進而能從各類非結構化的文字當中擷取有用的資訊,以做為後續進行下決定(decision-making)或形成政策(policy-making)之用。

    ?

    本書特色

    ?

      1. 利用R語言的文本探勘能力做中、英文小說的情感分析。

      2. 利用R語言進行網路爬蟲,在非結構化的文字中擷取資訊。

      3. 學習上列的技術後,能從各類非結構化的文字中擷取有用的資訊,以利未來決定與決策之用。



     





    Chapter 1 - R語言的下載與安裝

    1.1 R語言

    1.2 RStudio

    1.3 R語言的套件



    Chapter 2 - 學習文字探勘前的R基礎

    2.1 變數

    2.2 資料型態與資料結構

    2.3 缺失值

    2.4 管線運算子

    2.5 正規表達式(Regular expression)

    2.6 基本字符串函數

    2.7 stringr套件

    2.8 資料的讀取與匯出

    2.9 建立R函數

    2.10 條件執行

    2.11 迴圈

    2.12 apply相關函數



    Chapter 3 - 文本探勘

    3.1 文字探勘的基本概念

    3.2 套件介紹

    3.3 英文語料庫

    3.4 中文語料庫



    Chapter 4 - 中、英文小說

    4.1 套件介紹

    4.2 認識Gutenberg Project

    4.3 tidy文本格式

    4.4 情感詞庫

    4.5 英文小說分析 - Little Women

    4.6 英文小說 - n元語法

    4.7 中文小說分析 - 三國演義



    Chapter 5 - 網路爬蟲與文字探勘

    5.1 網路爬蟲介紹

    5.2 靜態擷取網頁

    5.3 動態擷取網頁




    其 他 著 作