Python 數據科學基礎與實踐
王仁武
- 出版商: 人民郵電
- 出版日期: 2021-11-01
- 定價: $419
- 售價: 8.5 折 $356
- 語言: 簡體中文
- 頁數: 308
- 裝訂: 平裝
- ISBN: 7115556091
- ISBN-13: 9787115556097
-
相關分類:
Data Science
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$250Python 數據挖掘方法及應用
-
$534$507 -
$534$507 -
$359$341 -
$356集成學習入門與實戰:原理、算法與應用
-
$235雲計算應用開發(初級)
-
$709Python 統計可視化之 Altair 探索分析實踐指南
-
$551雲端架構:基於雲平臺的 41種可復用的架構最佳實踐
-
$894$849 -
$383數據科學方法與實踐 ——基於 Python 技術實現
-
$556TensorFlow Lite 移動端深度學習
-
$403動手學 PyTorch 深度學習建模與應用
-
$518深度強化學習算法與實踐:基於 PyTorch 的實現
-
$509智能前端技術與實踐
-
$516$490 -
$779$740 -
$594$564 -
$658高級 Python 核心編程開啟精通 Python 編程世界之旅
-
$505python核心編程:從入門到實踐:學與練
-
$659$626 -
$659$626 -
$607前端工程化 : 基於 Vue.js 3.0 的設計與實踐
-
$419$398 -
$599$569 -
$505穿越作業系統迷霧:從零實現作業系統
相關主題
商品描述
本書使用數據科學領域中流行的編程語言之一——Python 來進行數據的基本處理與可視化、數據獲取、數據分析、數據挖掘、文本挖掘和深度學習,旨在幫助讀者掌握從事數據科學工作的必備技能。
全書共 9 章,主要內容包括數據科學概述、Python 基礎知識、Python 數據科學常用庫、Python 數據獲取、Python 數據分析、Python 數據挖掘、Python 文本挖掘、深度學習基礎和深度學習應用。
本書可作為普通高等院校數據科學與大數據技術、大數據應用與管理等專業相關課程的教材,也可作為數據分析從業人員的參考書。
作者簡介
王仁武,男,工科博士、副教授,現華東師範大學信息學系教師,主要研究方向數據分析、數據挖掘與文本挖掘、機器學習與深度學習等。
目錄大綱
第 1章 數據科學概述 1
1.1 什麼是數據科學 1
1.2 如何學習數據科學 2
1.3 什麼是數據科學家 2
1.4 數據科學家需要掌握的技能 3
1.5 Python與數據科學 3
1.6 數據科學領域常用的Python包 4
1.7 時代寵兒—深度學習 6
習題 6
第 2章 Python基礎知識 7
2.1 Python介紹 7
2.1.1 Jupyter Notebook的簡介及使用 8
2.1.2 Python基礎概念 10
2.1.3輸入和輸出 14
2.1.4運算符 15
2.2 常見數據結構和基本語句 17
2.2.1序列 17
2.2.2字典 23
2.2.3集合 27
2.2.4基本語句 29
2.3 函數和模塊 32
2.3.1函數 32
2.3.2模塊 38
2.4 異常處理 43
2.4.1什麼是異常 43
2.4.2常見異常錯誤 43
2.4.3捕捉異常 44
2.4.4觸發異常 45
2.5 文件讀寫 45
2.5.1編碼 45
2.5.2讀取文本文件 46
2.5.3 Word文件與Excel文件讀取 51
2.6 Pythonic 51
2.6.1解析式 52
2.6.2三元表達式 53
2.6.3花樣傳參:zip與星號操作 54
本章小結 56
習題 56
第3章 Python數據科學常用庫 58
3.1 Python數據分析概述 58
3.2 Numpy數值計算 59
3.2.1 Numpy基礎簡介 59
3.2.2 Numpy基礎用法簡介 60
3.2.3 Numpy數據分析常用函數簡介 73
3.3 Pandas基礎知識 76
3.3.1 Series介紹及其基本操作 76
3.3.2 DataFrame介紹及其基本操作 79
3.4 Pandas數據預處理 82
3.4.1數據合併 82
3.4.2 數據清洗 86
3.4.3 數據標準化 88
3.4.4 數據轉換 89
3.5 Pandas數據分析基礎 92
3.5.1 分層索引 92
3.5.2 Pandas常用函數介紹 97
3.5.3 分組 98
3.5.4 整形和旋轉 100
3.5.5 數據透視表和交叉表 104
3.6 Matplotlib數據可視化 108
3.6.1 Matplotlib簡介 108
3.6.2 Matplotlib繪圖基礎簡介 109
3.6.3 常用統計圖繪製簡介 113
本章小結 116
習題 116
第4章 Python數據獲取 118
4.1 數據及其類型 119
4.1.1 屬性與屬性類型 119
4.1.2 數據類型 120
4.1.3 數據集的類型 121
4.2 數據獲取方法 124
4.2.1 從文件中獲取數據 124
4.2.2 從數據庫中獲取數據 130
4.2.3 從網絡接口獲取數據 133
4.2.4 從網頁抓取數據 135
4.3 網絡爬蟲 135
4.3.1 爬蟲簡介及爬蟲流程 135
4.3.2 發起請求 136
4.3.3 獲取響應內容 138
4.3.4 解析內容 139
4.3.5 Selenium 144
本章小結 147
習題 147
第5章 Python數據分析 149
5.1數據分析基礎 150
5.1.1 對比分析 151
5.1.2 分組分析 152
5.1.3 結構分析 153
5.1.4 分佈分析 153
5.1.5 交叉分析 155
5.2 描述性統計分析 156
5.2.1 數據集中趨勢分析 156
5.2.2 數據的離散程度分析 157
5.2.3 數據的分佈形態分析 159
5.2.4 相關分析 160
5.2.5 基於Seaborn的數據可視化分析 161
5.3 主成分分析 164
5.3.1 主成分分析原理介紹 164
5.3.2 主成分分析基本流程 165
5.3.3 Python實現主成分分析 166
5.4 回歸分析 171
5.4.1 簡單線性回歸分析 172
5.4.2 多元線性回歸分析 177
本章小結 181
習題 181
第6章 Python數據挖掘 183
6.1 Python數據挖掘概述 183
6.1.1 數據挖掘分類及常用方法 184
6.1.2 使用Scikit-learn構建數據挖掘模型 186
6.2 分類預測:決策樹算法 193
6.2.1 分類算法概述 193
6.2.2 決策樹算法 194
6.2.3 決策樹分枝 195
6.2.4 決策樹剪枝 198
6.2.5 分類算法評估 199
6.2.6 決策樹的Python實現 200
6.3樸素貝葉斯(Naive Bayesian) 202
6.3.1 貝葉斯簡介 202
6.3.2 構建樸素貝葉斯模型 203
6.3.3 樸素貝葉斯的Python實現 204
6.4 人工神經網絡 205
6.4.1 人工神經網絡簡介 205
6.4.2 神經元與激活函數 207
6.4.3 前饋神經網絡 211
6.4.4 反向傳播機制 212
6.4.5 神經網絡的Python實現 215
6.5集成學習 220
6.5.1 集成學習簡介 220
6.5.2 裝袋法的代表——隨機森林 223
6.5.3 boosting的代表——xgboost 230
6.6 關聯分析(Association analysis) 232
6.6.1 關聯分析概述 232
6.6.2 Apriori算法 235
6.6.3 FP-Growth算法 238
6.6.4 關聯規則的Python實現 239
6.7 聚類分析 242
6.7.1 聚類分析概述 242
6.7.2 常用聚類算法 243
6.7.3 聚類算法Python實現 249
本章小結 252
習題 252
第7章 文本挖掘 254
7.1 文本挖掘概述 254
7.1.1 文本挖掘的定義 254
7.1.2 Python中的文本挖掘包 255
7.1.3 文本挖掘的過程 255
7.1.4 文本挖掘的應用 256
7.2 Python文本特徵提取 256
7.2.1 中文分詞與詞云 256
7.2.2 特徵詞量化與文本特徵提取 260
7.2.3 文本表示 262
7.3文本分類 268
7.3.1 文本分類概述 268
7.3.2文本分類的Python實現 269
7.4文本情感分析 271
7.4.1 情感分析概述 271
7.4.2 情感分析的具體應用及示例 273
7.5 LDA主題模型 275
7.5.1主題模型簡介 276
7.5.2主題模型在文本語義挖掘的應用 280
本章小結 282
習題 283
第8章 深度學習基礎 284
8.1 深度學習概述 284
8.1.1機器學習與深度學習 284
8.1.2 深度學習的發展 285
8.1.3 深度學習框架 286
8.2 PyTorch介紹與安裝 287
8.2.1 PyTorch介紹 287
8.2.2 PyTorch安裝 287
8.3 PyTorch基礎 288
8.3.1 Tensor張量 288
8.3.2 Variable變量 289
8.3.3 優化器 290
8.3.4 PyTorch與Numpy 290
8.4 卷積神經網絡 292
8.4.1卷積神經網絡簡介 292
8.4.2 二維卷積運算的運算基礎 293
8.4.3 二維卷積運算的填充與步長 295
8.4.4 三維卷積運算 296
8.4.5 其他卷積神經網絡組件 298
8.5 循環神經網絡 301
8.5.1 RNN的結構 301
8.5.2 RNN存在的問題 304
8.5.3 LSTM 304
8.5.4 GRU 305
8.6 CNN與RNN的PyTorch實現 306
8.6.1 卷積層 306
8.6.2 池化層 307
8.6.3 全連接層 308
8.6.4 RNN 308
8.6.5 LSTM 309
8.6.6 GRU 310
本章小結 310
習題 310
第9章 深度學習應用 313
9.1 圖片分類與遷移學習 313
9.1.1 遷移學習與傳統模型 313
9.1.2 圖片分類的經典案例 315
9.1.3 PyTorch實現DenseNet 317
9.2 命名實體識別 321
9.2.1 命名實體識別基礎 321
9.2.2 PyTorch實現命名實體識別 325
本章小結 330
習題 331
參考文獻 332