AI制勝:機器學習極簡入門

宋立桓

  • 出版商: 清華大學
  • 出版日期: 2020-07-01
  • 定價: $294
  • 售價: 7.0$206
  • 語言: 簡體中文
  • ISBN: 7302555516
  • ISBN-13: 9787302555513
  • 相關分類: Machine Learning
  • 立即出貨

  • AI制勝:機器學習極簡入門-preview-1
  • AI制勝:機器學習極簡入門-preview-2
  • AI制勝:機器學習極簡入門-preview-3
AI制勝:機器學習極簡入門-preview-1

買這商品的人也買了...

商品描述

機器學習包括有監督學習、無監督學習和半監督學習,而具體的問題又大致可以分兩類:分類問題和回歸問題。本書分為8章,使用Python第三方工具庫深入講解機器學習極大重要算法的實現,內容包括機器學習概述、貝葉斯分類、決策樹、集成學習、支持向量機、神經網絡、捲積神經網絡、捲積神經網絡分割圖片實戰。

目錄大綱

目   錄

第1章  機器學習概述 1

1.1  什麽是機器學習 1

1.2  機器學習的流程 3

1.2.1  數據收集 3

1.2.2  數據預處理 3

1.2.3  特徵工程 4

1.2.4  模型構建和訓練 4

1.3  機器學習該如何學 5

1.3.1  AI時代首選Python 5

1.3.2  PyCharm可視化編輯器和Anaconda大禮包 7

1.3.3  掌握算法原理與掌握機器學習軟件庫同等重要 13

1.3.4  機器學習與深度學習的區別 13

1.4  機器學習分類 15

1.4.1  監督學習 15

1.4.2  無監督學習 16

1.4.3  強化學習 16

1.5  過擬合和欠擬合 17

1.5.1  過擬合 18

1.5.2  欠擬合 18

1.6  衡量機器學習模型的指標 19

1.6.1  正確率、精確率和召回率 19

1.6.2  F1 score和ROC曲線 21

第2章  機器學習中的數據預處理 24

2.1  數據預處理的重要性和原則 24

2.2  數據預處理方法介紹 25

2.2.1  數據預處理案例——標準化、歸一化、二值化 25

2.2.2  數據預處理案例——缺失值補全、標簽化 26

2.2.3  數據預處理案例——獨熱編碼 28

2.2.4  通過數據預處理提高模型準確率 29

2.3  數據降維 31

2.3.1  什麽叫數據降維 31

2.3.2  PCA主成分分析原理 31

2.3.3  PCA主成分分析實戰案例 33

第3章  k最近鄰算法 36

3.1  K最近鄰算法的原理 36

3.2  K最近鄰算法過程詳解 37

3.3  KNN算法的註意事項 39

3.3.1  k近鄰的k值該如何選取 39

3.3.2  距離的度量 39

3.3.3  特徵歸一化的必要性 41

3.4  K最近鄰算法案例分享 42

3.4.1  電影分類kNN算法實戰 42

3.4.2  使用scikit-learn機器學習庫內置的kNN算法實現水果識別器 44

3.5  KNN算法優缺點 47

第4章  回歸算法 49

4.1  線性回歸 49

4.1.1  什麽是線性回歸 49

4.1.2  最小二乘法 51

4.1.3  梯度下降法 52

4.2  線性回歸案例實戰 57

4.2.1  房價預測線性回歸模型案例一 57

4.2.2  房價預測線性回歸模型案例二 60

4.3  邏輯回歸 62

4.3.1  邏輯回歸概念和原理 62

4.3.2  邏輯回歸案例實戰 64

4.4  回歸算法總結和優缺點 65

第5章  決策樹 66

5.1  決策樹概念 66

5.2  信息熵 68

5.3  信息增益與信息增益比 69

5.4  基尼系數 70

5.5  過擬合與剪枝 70

5.6  決策樹算法案例實戰——預測患者佩戴隱形眼鏡類型 71

5.7  決策樹算法實戰案例——電影喜好預測 73

5.8  總結 77

第6章  K-means聚類算法 78

6.1  何為聚類 78

6.2  K-MEANS算法思想和原理 79

6.3  K-MEANS算法涉及的參數和優缺點 82

6.3.1  K-means涉及參數 82

6.3.2  K-means優缺點 84

6.4  K-MEANS應用場景 84

6.5  K-MEANS聚類算法實現鳶尾花數據的聚類 85

6.6  K-MEANS算法實現客戶價值分析 87

6.7  K-MEANS算法實現對亞洲足球隊做聚類 90

第7章  隨機森林 92

7.1  隨機森林概述 92

7.1.1  什麽是隨機森林 92

7.1.2  隨機森林的優缺點 93

7.2  隨機森林實戰——紅酒數據集案例 94

7.3  隨機森林算法實戰——泰坦尼克號生存預測 97

第8章  樸素貝葉斯算法 101

8.1  樸素貝葉斯算法概念和原理 101

8.2  貝葉斯算法實戰案例——曲奇餅 105

8.3  貝葉斯算法案例實戰——單詞拼寫糾錯 106

8.4  貝葉斯算法案例實戰——識別中文垃圾郵件 109

8.5  貝葉斯算法案例實戰——鳶尾花分類預測 112

第9章  支持向量機SVM 116

9.1  支持向量機概述 116

9.2  工作原理 119

9.2.1  線性分類 119

9.2.2  線性不可分 120

9.2.3  核函數 122

9.3  SVM的核函數選擇和參數的調整 122

9.4  SVM算法案例實戰——波士頓房價分析 124

9.5  SVM算法案例實戰——鳶尾花分類 126

9.6  SVM算法優缺點 128

第10章  神經網絡 130

10.1  神經網絡概念 130

10.1.1  神經元 130

10.1.2  激活函數 132

10.1.3  神經網絡 133

10.2  捲積神經網絡(CNN) 135

10.2.1  電腦識別圖像的過程 135

10.2.2  捲積神經網絡詳解 136

10.3  用PYTHON實現自己的神經網絡案例 138

10.4  多層神經網絡基於SKLEARN的實現案例 141

10.5  使用KERAS框架實現神經網絡案例 145

10.5.1  Keras深度學習框架簡介和安裝 145

10.5.2  Keras實現多層感知器模型MLP 146

10.5.3  Keras實現捲積神經網絡CNN 149

第11章  人臉識別入門實踐 151

11.1  人臉識別簡介 151

11.1.1  什麽是人臉識別 151

11.1.2  人臉識別過程步驟 153

11.2  人臉檢測和關鍵點定位實戰 156

11.3  人臉表情分析——情緒識別實戰 160

11.4  我能認識你——人臉識別實戰 161