Python 自然語言處理

劉鴻博,王時繪,張小梅

  • 出版商: 電子工業
  • 出版日期: 2022-12-01
  • 定價: $324
  • 售價: 8.5$275
  • 語言: 簡體中文
  • 頁數: 268
  • ISBN: 7121446596
  • ISBN-13: 9787121446597
  • 相關分類: Text-mining
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

商品描述

本書基於Python編程語言,以實戰為導向,主要介紹自然語言處理的各種理論、方法及應用案例。全書共14章:第1~3章側重介紹自然語言處理所必需的理論基礎知識,包括自然語言處理基礎、Python基礎、語料庫基礎等內容;第4~10章主要講解詞法分析、詞向量與關鍵詞提取、句法分析、語義分析、情感分析等自然語言處理核心技術的原理及實現方法,以及自然語言處理中常用的機器學習和深度學習技術;第11~14章主要介紹自然語言處理比較典型的應用場景,包括機器翻譯與寫作、智能問答與對話及個性化推薦,以及自然語言處理技術在醫療、司法和金融領域的應用情況。本書設置較多示例,實操性較強,建議讀者根據書內講解動手完成實驗,以便鞏固所學內容。

目錄大綱

目 錄
第1章 自然語言處理基礎 1
1.1 什麽是自然語言處理 1
1.1.1 自然語言處理的概念 1
1.1.2 自然語言處理的研究任務 3
1.2 自然語言處理的發展歷程 4
1.3 自然語言處理相關知識的構成 6
1.3.1 基礎術語 6
1.3.2 知識結構 7
1.4 探討自然語言處理的幾個層面 8
1.5 自然語言處理與人工智能 10
第2章 Python基礎 11
2.1 搭建Python開發環境 11
2.1.1 Python的科學計算發行版—Anaconda 11
2.1.2 Anaconda的下載與安裝 13
2.2 正則表達式在自然語言處理中的基本應用 17
2.2.1 匹配字符串 18
2.2.2 使用轉義符 20
2.2.3 抽取文本中的數字 21
2.3 Numpy使用詳解 22
2.3.1 創建數組 22
2.3.2 獲取Numpy中數組的維度 24
2.3.3 獲取本地數據 24
2.3.4 正確讀取數據 25
2.3.5 Numpy數組索引 25
2.3.6 Numpy數組切片 26
2.3.7 數組比較 26
2.3.8 替代值 27
2.3.9 數據類型的轉換 28
2.3.10 Numpy的統計計算方法 29
第3章 語料庫基礎 30
3.1 語料庫基礎概述 30
3.2 自然語言工具包NLTK 31
3.2.1 NLTK概述 31
3.2.2 安裝NLTK 32
3.2.3 使用NLTK 33
3.2.4 在Python NLTK下使用Stanford NLP 37
3.3 獲取語料庫 41
3.3.1 訪問網站 41
3.3.2 編寫程序 42
3.3.3 通過NLTK獲取 43
3.4 綜合案例:走進《紅樓夢》 46
3.4.1 數據採集和預處理 46
3.4.2 構建本地語料庫 47
3.4.3 語料操作 47
第4章 詞法分析 51
4.1 中文分詞 51
4.1.1 中文分詞介紹 51
4.1.2 規則分詞 52
4.1.3 統計分詞 58
4.1.4 混合分詞 67
4.1.5 中文分詞工具—Jieba 67
4.2 詞性標註 70
4.2.1 詞性標註概述 70
4.2.2 詞性標註規範 71
4.2.3 Jieba分詞中的詞性標註 72
4.3 命名實體識別 73
4.3.1 命名實體識別概述 73
4.3.2 基於CRF的命名實體識別 75
4.3.3 日期識別實戰 77
4.3.4 地名識別實戰 81
第5章 詞向量與關鍵詞提取 90
5.1 詞向量算法word2vec 90
5.1.1 神經網絡語言模型 91
5.1.2 C&W模型 92
5.1.3 CBOW模型和Skip-gram模型 93
5.2 關鍵詞提取技術概述 94
5.3 TF-IDF算法 95
5.4 TextRank算法 96
5.5 LSA/LSI/LDA算法 98
5.5.1 LSA/LSI算法 98
5.5.2 LDA算法 99
5.6 提取文本關鍵詞 100
第6章 句法分析 108
6.1 句法分析概述 108
6.1.1 句法分析的基本概念 108
6.1.2 句法分析的基本方法 109
6.2 句法分析的數據集與評測方法 109
6.2.1 句法分析的數據集 110
6.2.2 句法分析的評測方法 111
6.3 句法分析的常用方法 111
6.3.1 基於PCFG的句法分析 112
6.3.2 基於最大間隔馬爾可夫網絡的句法分析 113
6.3.3 基於CRF的句法分析 114
6.3.4 基於移進-歸約的句法分析模型 114
6.4 使用Stanford Parser的PCFG算法進行句法分析 115
6.4.1 Stanford Parser 115
6.4.2 基於PCFG的中文句法分析實戰 116
第7章 語義分析 119
7.1 詞義消歧 119
7.1.1 基於規則的詞義消歧 120
7.1.2 基於統計的詞義消歧 121
7.1.3 基於實例的詞義消歧 122
7.1.4 基於詞典的詞義消歧 122
7.2 語義角色標註 124
7.2.1 格語法 124
7.2.2 基於統計機器學習技術的語義角色標註 125
7.3 深層語義推理 126
7.3.1 命題邏輯和謂詞邏輯 126
7.3.2 語義網絡 127
7.3.3 概念依存理論 129
第8章 情感分析 130
8.1 情感分析的應用領域 130
8.2 情感分析的基本方法 131
8.2.1 詞法分析 132
8.2.2 機器學習方法 132
8.2.3 混合分析 132
8.3 實戰—電影評論情感分析 133
8.3.1 模型選擇 134
8.3.2 載入數據 136
8.3.3 輔助函數 138
8.3.4 模型設置 138
8.3.5 調參配置 140
8.3.6 訓練過程 140
第9章 機器學習與自然語言處理 141
9.1 幾種常用的機器學習方法 141
9.1.1 文本分類 141
9.1.2 特徵提取 142
9.1.3 標註 142
9.1.4 搜索與排序 143
9.1.5 推薦系統 144
9.1.6 序列學習 145
9.2 無監督學習的文本聚類 146
9.3 文本分類實戰:中文垃圾郵件分類 148
9.3.1 實現代碼 148
9.3.2 評價指標 151
9.4 文本聚類實戰:用k-means對豆瓣讀書數據聚類 153
第10章 深度學習與自然語言處理 157
10.1 詞嵌入算法 157
10.1.1 詞向量 157
10.1.2 word2vec 158
10.1.3 詞向量模型 159
10.1.4 CBOW和Skip-gram 161
10.2 訓練詞向量實踐 161
10.3 RNN 166
10.3.1 簡單RNN 166
10.3.2 LSTM網絡 168
10.3.3 Attention機制 172
10.4 seq2seq模型與實戰 173
10.4.1 seq2seq模型 173
10.4.2 實戰seq2seq問答機器人 174
第11章 機器翻譯與寫作 194
11.1 機器翻譯 194
11.1.1 機器翻譯的意義 194
11.1.2 經典的神經網絡機器翻譯模型 195
11.1.3 機器翻譯譯文質量評價 200
11.1.4 機器翻譯面臨的挑戰 202
11.2 機器寫作 203
11.2.1 什麽是機器寫作 203
11.2.2 藝術寫作 204
11.2.3 當代寫作 207
第12章 智能問答與對話 212
12.1 智能問答 212
12.2 智能對話系統 212
12.2.1 對話系統的基本過程 213
12.2.2 對話系統的常見場景 213
12.3 問答系統的主要組成 214
12.4 不同類型的問答系統 215
12.4.1 文本問答系統 216
12.4.2 閱讀理解型文本問答系統 220
12.4.3 社區問答系統 223
12.4.4 IBM的“沃森”問答系統 225
12.5 前景與挑戰 226
第13章 個性化推薦 227
13.1 推薦系統是什麽 227
13.2 個性化推薦的基本問題 227
13.2.1 推薦系統的輸入 228
13.2.2 推薦系統的輸出 228
13.2.3 推薦的基本形式 229
13.2.4 推薦系統的三大核心 230
13.3 推薦的可解釋性 230
13.4 前景與挑戰 232
13.4.1 推薦系統面臨的問題 232
13.4.2 推薦系統的新方向 233
第14章 行業應用 235
14.1 智慧醫療 235
14.1.1 智慧醫療的產生與概念 235
14.1.2 智慧醫療中的人工智能 237
14.1.3 前景與挑戰 239
14.2 智慧司法 240
14.2.1 智慧司法是什麽 240
14.2.2 研究與應用方向 241
14.2.3 期望與挑戰 247
14.3 智能金融 248
14.3.1 瞭解智能金融 248
14.3.2 智能金融技術的應用 252
14.3.3 智能金融的前景與挑戰 254