文本挖掘:基於 R語言的整潔工具 (Text Mining with R: A Tidy Approach)
茱莉亞·斯拉格 (Julia Silge), 戴維·羅賓遜 (David Robinson)
- 出版商: 機械工業
- 出版日期: 2018-04-11
- 定價: $354
- 售價: 8.5 折 $301
- 語言: 簡體中文
- 頁數: 161
- 裝訂: 平裝
- ISBN: 711158855X
- ISBN-13: 9787111588559
-
相關分類:
R 語言
- 此書翻譯自: Text Mining with R: A Tidy Approach (Paperback)
已絕版
買這商品的人也買了...
-
$350$343 -
$359$341 -
$474$450 -
$796深度學習 (Deep Learning)
-
$650$507 -
$250深度學習與 R語言
-
$301精通Python自然語言處理(Mastering Natural Language Processing with Python)
-
$680$578 -
$450$356 -
$500$390 -
$301自然語言處理技術入門與實戰
-
$440$348 -
$720$612 -
$250程序員的數學
-
$690$538 -
$331Python 3.0 科學計算指南 (Scientific Computing with Python 3)
-
$975$926 -
$301深度學習:R語言實踐指南 (Introduction to Deep Learning Using R: A Step-by-Step Guide to Learning and Implementing Deep Learning Models Using R)
-
$660$594 -
$550$429 -
$332推薦系統與深度學習
-
$580$458 -
$209大數據數學基礎 (R語言描述)
-
$250Python 機器學習 — 數據分析與評分卡建模
-
$474$450
商品描述
全書共9章,主要介紹如何使用基於R的整潔工具來進行文本分析。首先介紹了整潔文本的格式,以及如何獲取整潔文本數據集;並通過tidytext中的情感數據集來進行情緒分析;接著介紹瞭如何根據tf-idf統計量來識別特定文檔中的重要單詞,以及如何利用n-gram來分析文本中的文字網絡;之後介紹瞭如何將整潔文本轉換為文檔詞項矩陣和Corpus對象格式,並給出了主題建模的概念;最後通過整合多種已知的整潔文本挖掘方法,給出了一些研究案例,這些案例涉及Twitter歸檔文件、NASA數據集以及來自新聞組的即時通信信息。總的來說,本書側重於分析文學、新聞和社交媒體方面的文本,非常適合從事相關文本挖掘的工作人員和自然語言的初學者閱讀。與此同時,使用書中提供的大量針對性編程例子,不但可以提高工程實戰能力,而且可以在本書提到的整潔框架上建立自己的分析任務。