Python 機器學習:基礎、演算法與實戰

孫玉林|責編:張賽//耍利娜

買這商品的人也買了...

商品描述

本書基於Python語言,結合實際的資料集,介紹了機器學習演算法以及資料分析方法的應用。
本書主要包含兩部分內容,第一部分為Python機器學習入門知識:主要介紹了Python的基礎內容、Numpy與Pandas庫資料操作、
Matplotlib與Seaborn庫資料視覺化、Sklearn庫機器學習,以及與機器學習相關的基礎知識;
第二部分為Python機器學習演算法應用:主要介紹了資料的迴歸預測分析、時間序列預測,
資料無監督學習中的聚類、降維以及關聯規則,資料分類模型的應用以及針對文字資料與網路圖資料的機器學習演算法應用。
本書適合對機器學習、資料分析有興趣的初學者學習,
也可作為Python機器學習、資料分析、資料視覺化的入門及進階的教材。

目錄大綱

第1章 Python機器學習快速入門 1
1.1 Python安裝 1
1.1.1 安裝Anaconda 1
1.1.2 安裝Python庫 5
1.2 Python常用資料型態 5
1.2.1 列表 5
1.2.2 元組 8
1.2.3 字典 9
1.2.4 集合 10
1.2.5 字串 11
1.3 Python條件、循環與函數 13
1.3.1 條件判斷語句 13
1.3.2 循環語句 14
1.3.3 函數 16
1.4 機器學習簡介 17
1.4.1 無監督學習 18
1.4.2 有監督學習 20
1.4.3 半監督學習 21
1.4.4 常用機器學習演算法 22
1.5 本章小結 22

第2章 Python中的常用函式庫 23
2.1 Numpy庫 23
2.1.1 Numpy數組產生 24
2.1.2 Numpy數組運算 27
2.1.3 Numpy數組操作 28
2.1.4 Numpy常用函數 33
2.2 Pandas庫 36
2.2.1 Pandas資料產生與讀取 37
2.2.2 Pandas資料操作 39
2.2.3 Pandas資料視覺化 44
2.3 Matplotlib庫 47
2.3.1 Matplotlib視覺化基礎 47
2.3.2 Matplotlib資料視覺化實戰 53
2.4 Seaborn庫 60
2.4.1 Seaborn庫功能簡介 60
2.4.2 Seaborn庫資料視覺化實戰 61
2.5 Sklearn庫 65
2.5.1 Sklearn庫功能簡介 65
2.5.2 Sklearn庫應用實戰 66
2.6 本章小結 70

第3章 機器學習流程 71
3.1 資料預處理與探索 72
3.1.1 缺失值處理 73
3.1.2 資料視覺化探索 74
3.1.3 資料標準化與變換 78
3.2 無監督問題應用 81
3.2.1 資料降維 81
3.2.2 資料聚類 84
3.3 有監督分類問題應用 87
3.4 有監督回歸問題應用 91
3.5 半監督學習應用 94
3.6 本章小結 96

第4章 模型的選擇與評估 98
4.1 模型的選擇 98
4.1.1 模型適配情形 98
4.1.2 避免欠擬合和過擬合的方式 100
4.1.3 模型的變異數與偏差 101
4.2 模型訓練技巧 101
4.2.1 相關方法 102
4.2.2 實戰案例:K折交叉驗證 103
4.2.3 實戰案例:參數網格搜尋 104
4.3 模型評估指標 106
4.3.1 分類效果評估 106
4.3.2 回歸效果評估 106
4.3.3 聚類效果評估 107
4.4 本章小結 108

第5章 迴歸模型 109
5.1 一元線性迴歸 111
5.1.1 模型介紹 111
5.1.2 實戰案例:一元線性迴歸建模 111
5.2 多元線性迴歸 116
5.2.1 模型簡介 116
5.2.2 實戰案例:房屋價格預測 116
5.3 正則化Lasso迴歸 127
5.3.1 模型簡介 127
5.3.2 實戰案例:Lasso回歸預測房屋價格 128
5.4 時間序列ARIMA模型 133
5.4.1 模型簡介 133
5.4.2 實戰案例:ARIMA模型預測未來啤酒消耗量 134
5.5 時間序列SARIMA模型 145
5.5.1 模型簡介 145
5.5.2 實戰案例:SARIMA模型預測未來啤酒消耗量 146
5.6 本章小結 149

第6章 無監督模型 150
6.1 常用降維演算法 151
6.1.1 主成分分析 151
6.1.2 因子分析 152
6.1.3 流形學習-等距映射 152
6.1.4 局部線性嵌入LLE 153
6.1.5 多維尺度轉換MSD 153
6.1.6 t-SNE 153
6.2 資料降維案例實戰 154
6.2.1 主成分分析資料降維 156
6.2.2 因子分析資料降維 159
6.2.3 流形學習-等距嵌入資料降維 160
6.2.4 局部線性嵌入資料降維 161
6.2.5 MDS資料降維 162
6.2.6 t-SNE資料降維 163
6.3 常用聚類演算法 164
6.3.1 K均值聚類 165
6.3.2 密度聚類 165
6.3.3 系統聚類 166
6.3.4 模糊聚類 167
6.4 資料聚類案例實戰 168
6.4.1 K均值聚類實戰 169
6.4.2 密度聚類實戰 173
6.4.3 系統聚類實戰 175
6.4.4 模糊聚類實戰 178
6.5 關聯規則挖掘 179
6.5.1 模型簡介 180
6.5.2 實戰案例:購物籃分析 181
6.6 本章小結 188

第7章 分類模型 189
7.1 決策樹演算法 193
7.1.1 演算法簡介 193
7.1.2 實戰案例:決策樹演算法實戰 195
7.2 隨機森林演算法 203
7.2.1 演算法介紹 203
7.2.2 實戰案例:隨機森林演算法實戰 203
7.3 Logistic迴歸演算法 208
7.3.1 演算法簡介 208
7.3.2 實戰案例:Logistic迴歸演算法實戰 209
7.4 支援向量機演算法 211
7.4.1 演算法簡介 211
7.4.2 實戰案例:支援向量機演算法實戰 213
7.5 人工神經網路演算法 219
7.5.1 演算法簡介 219
7.5.2 人工神經網路演算法實戰 221
7.6 本章小結 225

第8章 進階資料回歸演算法 226
8.1 高階資料迴歸演算法模型實戰 227
8.1.1 資料探索與視覺化 227
8.1.2 隨機森林迴歸預測實戰 232
8.1.3 GBDT迴歸預測實戰 234
8.1.4 支援向量機迴歸預測實戰 236
8.1.5 人工神經網路迴歸預測實戰 237
8.2 複雜時間序列預測模型 239
8.2.1 Prophet時序迴歸 239
8.2.2 多元時序迴歸 240
8.3 時間序列迴歸模型實戰 240
8.3.1 時序資料導入與視覺化探索 240
8.3.2 Prophet演算法預測用戶數 242
8.3.3 Prophet演算法預測流量 245
8.3.4 VAR多變量時間序列的建模與預測 247
8.3.5 VARMA多變量時間序列的建模與預測 250
8.4 本章小結 253

第9章 非結構資料機器學習 254
9.1 非結構資料分析簡介 255
9.1.1 文本資料分析簡介 255
9.1.2 網路圖資料分析簡介 256
9.2 文本資料分析實戰 257
9.2.1 文字資料預處理 257
9.2.2 文本取得TF-IDF特徵 263
9.2.3 文本資料K均值聚類 265
9.2.4 文本資料LDA主題模型 266
9.2.5 文字資料樸素貝葉斯分類 267
9.3 網路圖資料分析實戰 272
9.3.1 網路圖視覺化 272
9.3.2 網路圖聚類分割 277
9.4 本章小結 281

第10章 綜合實戰案例:中藥材鑑別 282
10.1 無監督學習-鑑別藥材種類 284
10.1.1 資料特徵視覺化探索 285
10.1.2 使用原始特徵進行聚類分析 287
10.1.3 使用降維後的特徵進行聚類 291
10.2 有監督學習-藥材產地鑑別 295
10.2.1 資料特徵視覺化探索分析 296
10.2.2 利用所選的特徵進行分類 297
10.3 半監督學習-藥材類別鑑別 303
10.3.1 資料預處理與視覺化探索 304
10.3.2 資料主成分分析降維 306
10.3.3 半監督學習分類-標籤傳播演算法 308
10.4 本章小結 311
參考文獻 312