Python機器學習編程與實戰

林耀進張良均

預覽內頁

出版商: 人民郵電
出版日期: 2020-07-01
定價: $299
售價: 7.0 折 $209
語言: 簡體中文
頁數: 272
ISBN: 7115532532
ISBN-13: 9787115532534
相關分類: Machine Learning

立即出貨

商品描述

本書採用常用技術與真實案例相結合的講解方式，深入淺出地介紹了Python機器學習應用的主要內容。全書共8章，內容包括Python概述、NumPy數值計算、pandas基礎、pandas進階、Matplotlib繪圖、scikit-learn、餐飲企業綜合分析與預測、通信運營商客戶流失分析與預測。前6章設置了選擇題、填空題和操作題，後兩章設置了操作題，希望通過練習和操作實踐，讀者可以鞏固所學的內容。

本書可以作為高校大數據或人工智能專業的教材，也可作為機器學習愛好者的自學用書。

作者簡介

張良均，高級信息系統項目管理師，泰迪杯全國大學生數據挖掘競賽（www.tipdm.org）的發起人。華南師範大學、廣東工業大學兼職教授，廣東省工業與應用數學學會理事。兼有大型高科技企業和高校的工作經歷，主要從事大數據挖掘及其應用的策劃、研發及咨詢培訓。全國電腦技術與軟件專業技術資格（水平）考試繼續教育和CDA數據分析師培訓講師。發表數據挖掘相關論文數二十餘篇，已取得國家發明專利12項，主編圖書《神經網絡實用教程》《數據挖掘:實用案例分析》《MATLAB數據分析與挖掘實戰》等9本暢銷圖書，主持並完成科技項目9項。獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書，具有電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景。

目錄大綱

第 1章 Python概述　1

1.1　Python簡介　1

1.1.1　Python語言　1

1.1.2　Python與機器學習　1

1.1.3　Python環境配置　2

1.2　Python基礎知識　5

1.2.1　固定語法　5

1.2.2　運算符　6

1.2.3　數據類型　9

1.2.4　Python I/O　14

1.3　控制語句　17

1.3.1　條件語句　18

1.3.2　循環語句　20

1.4　函數　22

小結　25

課後習題　26

第　2章 NumPy數值計算　28

2.1　ndarray的創建與索引　28

2.1.1　創建ndarray　28

2.1.2　ndarray的索引和切片　33

2.2　ndarray的基礎操作　36

2.2.1　變換ndarray的形態　36

2.2.2　排序與搜索　42

2.3　ufunc　46

2.3.1　ufunc的廣播機制　46

2.3.2　常用ufunc運算　47

小結　54

課後習題　54

第3章　pandas基礎　56

3.1　pandas常用類　56

3.1.1　Series　56

3.1.2　DataFrame　60

3.1.3　Index　64

3.2　DataFrame基本操作　65

3.2.1　索引　66

3.2.2　排序　70

3.2.3　合並　73

3.3　其他數據類型操作　78

3.3.1　時間操作　78

3.3.2　文本操作　87

3.3.3　category操作　90

小結　93

課後習題　93

第4章　pandas進階　95

4.1　數據的讀取與寫出　95

4.1.1　CSV　95

4.1.2　Excel　97

4.1.3　數據庫　98

4.2　DataFrame進階　101

4.2.1　統計分析　101

4.2.2　分組運算　106

4.2.3　透視表和交叉表　111

4.3　數據準備　113

4.3.1　缺失值處理　113

4.3.2　重復數據處理　117

4.3.3　連續特徵離散化處理　118

4.3.4　啞變量處理　120

小結　122

課後習題　122

第5章　Matplotlib繪圖　124

5.1　Matplotlib繪圖基礎　124

5.1.1　編程風格　124

5.1.2　動態rc參數　128

5.2　分析特徵關系常用圖形　133

5.2.1　散點圖　133

5.2.2　折線圖　135

5.3　分析特徵內部數據狀態常用

圖形　137

5.3.1　直方圖與條形圖　138

5.3.2　餅圖　140

5.3.3　箱線圖　142

小結　144

課後習題　144

第6章　scikit-learn　146

6.1　數據準備　146

6.1.1　標準化　146

6.1.2　歸一化　149

6.1.3　二值化　150

6.1.4　獨熱編碼　151

6.2　降維　153

6.2.1　PCA　154

6.2.2　ICA　158

6.2.3　LDA　162

6.3　分類　166

6.3.1　Logistic回歸　166

6.3.2　SVM　171

6.3.3　決策樹　174

6.3.4　KNN　178

6.3.5　樸素貝葉斯　180

6.3.6　隨機森林　183

6.3.7　多層感知機　186

6.4　回歸　189

6.4.1　最小二乘回歸　191

6.4.2　嶺回歸　194

6.4.3　Lasso回歸　195

6.5　聚類　198

6.5.1　K-Means　199

6.5.2　層次聚類　202

6.5.3　DBSCAN　205

6.5.4　GMM　208

6.6　模型驗證　212

6.6.1　數據集劃分　212

6.6.2　交叉驗證　213

6.6.3　自動調參　214

6.6.4　模型評價　217

小結　221

課後習題　221

第7章　餐飲企業綜合分析與預測　225

7.1　餐飲企業需求分析　225

7.1.1　餐飲企業現狀與需求　225

7.1.2　餐飲企業數據基本狀況　226

7.1.3　餐飲企業數據分析的步驟與流程　227

7.2　數據準備　227

7.2.1　統計每日用餐人數與銷售額　227

7.2.2　數據預處理　229

7.3　使用K-Means算法進行客戶價值分析　231

7.3.1　構建RFM特徵　231

7.3.2　構建K-Means模型　233

7.3.3　K-Means模型結果分析　234

7.4　使用決策樹算法實現餐飲客戶流失預測　236

7.4.1　構建客戶流失特徵　236

7.4.2　構建客戶流失預測模型　238

7.4.3　分析決策樹模型結果　239

小結　240

課後習題　240

第8章　通信運營商用戶流失分析與預測　242

8.1　通信運營商用戶流失需求分析　242

8.1.1　通信運營商現狀與需求　242

8.1.2　通信運營商數據基本情況　242

8.1.3　通信運營商用戶流失分析與預測的步驟與流程　243

8.2　數據準備　244

8.2.1　數據去重與降維　244

8.2.2　數據清洗　245

8.2.3　數據合並　247

8.3　特徵工程　251

8.3.1　獨熱編碼　251

8.3.2　合並預處理後的數據集　252

8.4　使用MLP算法實現通信運營商用戶流失預測　253

8.4.1　數據集劃分與數據標準化　253

8.4.2　構建用戶流失預測模型　255

8.4.3　模型評價　255

小結　256

課後習題　256

Python機器學習編程與實戰

林耀進張良均

相關主題

商品描述

作者簡介

目錄大綱

類似商品

Python機器學習編程與實戰

林耀進 張良均

相關主題

商品描述

作者簡介

目錄大綱

類似商品

林耀進張良均