Python機器學習實戰

呂雲翔,王淥汀,袁琪,張凡,韓雪婷

  • 出版商: 清華大學
  • 出版日期: 2021-05-01
  • 定價: $359
  • 售價: 8.5$305
  • 語言: 簡體中文
  • 頁數: 228
  • 裝訂: 平裝
  • ISBN: 7302576416
  • ISBN-13: 9787302576419
  • 相關分類: Machine Learning
  • 下單後立即進貨 (約4週~6週)

  • Python機器學習實戰-preview-1
  • Python機器學習實戰-preview-2
  • Python機器學習實戰-preview-3
Python機器學習實戰-preview-1

相關主題

商品描述

本書以機器學習算法為主題,詳細介紹算法的理論細節與應用方法。全書共19章,分別介紹了邏輯回歸與最大熵模型、k-近鄰模型、決策樹模型、樸素貝葉斯模型、支持向量機模型、集成學習框架、EM算法、降維算法、聚類算法、神經網絡模型等基礎模型或算法,以及8個綜合項目實例:汽車運動學片段分類、垃圾信息識別、乳腺癌識別、波士頓房價預測、生成動漫人物、鳶尾花分類、人臉識別、保險行為數據用戶分類器。本書重視理論與實踐相結合,希望為讀者提供全面而細致的學習指導。 本書適合機器學習初學者、相關行業從業人員以及高等院校電腦科學、軟件工程等相關專業的師生閱讀。

作者簡介

呂雲翔,
1986-1992: 北方交通大學講師; 1992-1994: 比利時VUB大學應用信息技術碩士; 1994-1996: 比利時VUB大學MBA; 1996-2003: IT公司項目經理2003-至今: 北航軟件學院副教授。
已出版二十幾本教材(其中“計算機導論實踐教程”一書獲北航2010年教學成果三等獎;

目錄大綱

第1章機器學習概述
*源下載
1.1機器學習的組成
1.2分類問題及回歸問題
1.3監督學習、半監督學習和無監督學習
1.4生成模型及判別模型
1.5模型評估
1.5.1訓練誤差及泛化誤差
1.5.2過擬合及欠擬合
1.6正則化
1.7Scikitlearn模塊
1.7.1數據集
1.7.2模型選擇

第2章邏輯回歸及優選熵模型
2.1線*回歸
2.1.1一元線*回歸
2.1.2多元線*回歸
2.2廣義線*回歸
2.2.1邏輯回歸
2.2.2多分類邏輯回歸
2.2.3交叉熵損失函數
2.3優選熵模型
2.3.1優選熵模型的導出
2.3.2優選熵模型與邏輯回歸之間的關係
2.4評價指標
2.4.1混淆矩陣
2.4.2準確率
2.4.3**率與召回率
2.4.4PR曲線
2.4.5ROC曲線與AUC曲線
2.5實例:基於邏輯回歸實現乳腺癌預測

第3章k近鄰算法
3.1k值的選取
3.2距離的度量
3.3快速檢索
3.4實例:基於k近鄰算法實現鳶尾花分類

第4章決策樹
4.1特徵選擇
4.1.1信息增益
4.1.2信息增益比
4.2決策樹生成算法CART
4.3決策樹剪枝
4.3 .1預剪枝
4.3.2後剪枝
4.4實例:基於決策樹實現葡萄酒分類

第5章樸素貝葉斯分類器
5.1極大似然估計
5.2樸素貝葉斯分類
5.3拉普拉斯平滑
5.4樸素貝葉斯分類器的極大似然估計解釋
5.5實例:基於樸素貝葉斯實現垃圾短信分類

第6章支持向量機
6.1優選間隔及超平面
6.2線*可分支持向量機
6.3線*支持向量機
6.4合頁損失函數
6.5核技巧
6.6二分類問題與多分類問題
6.6.1一對一
6.6.2一對多
6.6.3多對多
6.7實例:基於支持向量機實現葡萄酒分類

第7章集成學習
7.1偏差與方差
7.2Bagging及隨機森林
7.2.1Bagging
7.2.2隨機森林
7.3Boosting及AdaBoost
7.3.1Boosting
7.3.2AdaBoost
7.4提升樹
7.4.1殘差提升樹
7.4.2GBDT
7.4.3XGBoost
7.5Stacking
7.6實例:基於梯度下降樹實現波士頓房價預測

第8章EM算法及其應用
8.1Jensen不等式
8.2EM算法
8.3高斯混合模型GMM
8.4隱馬爾可夫模型
8.4.1計算觀測概率的輸出
8.4.2估計隱馬爾可夫模型的參數
8.4.3隱變量序列預測
8.5實例:基於高斯混合模型實現鳶尾花分類

第9章降維
9.1主成分分析
9.1.1方差即協方差的無偏估計
9.1.2實例:基於主成分分析實現鳶尾花數據降維
9.2奇異值分解
9.2.1奇異值分解的構造
9.2.2奇異值分解用於數據壓縮
9.2.3SVD與PCA的關係
9.2.4奇異值分解的幾何解釋
9.2.5實例:基於奇異值分解實現圖片壓縮

第10章聚類
10.1距離度量
10.1.1閔可夫斯基距離
10.1.2餘弦相似度
10.1.3馬氏距離
10.1.4漢明距離
10.2層次聚類
10.3KMeans聚類
10.4KMedoids聚類
10.5DBSCAN
10.6實例:基於KMeans實現鳶花聚類

第11章神經網絡與深度學習
11.1神經元模型
11.2多層感知機
11.3損失函數
11.4反向傳播算法
11.4.1梯度下降法
11.4.2梯度消失及梯度**
11.5卷積神經網絡
11.5 .1卷積
11.5.2池化
11.5.3網絡架構
11.6循環神經網絡
11.7生成對抗網絡
11.8圖卷積神經網絡
11.9深度學習發展
11.10實例:基於卷積神經網絡實現手寫數字識別
11.10.1MNIST數據集
11.10 .2基於卷積神經網絡的手寫數字識別

第12章實戰:基於KMeans算法的汽車行駛運動學片段的分類
12.1樣本聚類
12.1.1SSE
12.1.2輪廓分析
12.2汽車行駛運動學片段的提取
12.3基於KMeans的汽車行駛運動學片段分類

第13章實戰:從零實現樸素貝葉斯分類器用於垃圾信息識別
13.1算法流程
13.2數據集載入
13.3樸素貝葉斯模型
13.3.1構造函數設計
13.3.2數據預處理
13.3.3模型訓練
13.3.4測試集預測
13.3.5主函數實現

第14章實戰:基於邏輯回歸算法進行乳腺癌的識別
14.1數據集加載
14.2Logistic模塊
14.3模型評價

第15章實戰:基於線*回歸、決策樹和SVM進行鳶尾花分類
15.1使用Logistic實現鳶尾花分類
15.2使用決策樹實現鳶尾花分類
15.3使用SVM實現鳶尾花分類

第16章實戰:基於多層感知機模型和隨機森林模型的波士頓房價預測
16.1使用MLP實現波士頓房價預測
16.2使用隨機森林模型實現波士頓房價預測

第17章實戰:基於生成式對抗網絡生成動漫人物
17.1生成動漫人物任務概述
17.2反捲積網絡
17.3 DCGAN
17.4基於DCGAN的動漫人物生成

第18章實戰:基於主成分分析法、隨機森林算法和SVM算法的人臉識別問題
18.1數據集介紹與分析
18.2LBP算子
18.3提取圖片特徵
18.4基於隨機森林算法的人臉識別問題
18.5基於SVM算法的人臉識別問題

第19章實戰:使用多種機器學習算法實現基於用戶行為數據的用戶分類器
19.1基於機器學習的分類器的技術概述
19.2工程數據的提取聚合和存儲
19.2.1數據整合的邏輯流程
19.2 .2Sqoop數據同步
19.2.3基於Hive的數據倉庫
19.2.4基於Azkaban的數據倉庫的調度任務
19.2.5數據倉庫的數據集成和數據清洗
19.2.6整合後的數據表
19.3數據展示和分析
19.3.1數據集的選取和業務背景的描述
19.3.2各維度信息詳細說明
19.3.3各維度數據的描述*統計
19.3.4各維度數據的可視化
19.4特徵工程
19.4.1標準化
19.4.2區間縮放
19.4.3歸一化
19.4.4對定*特徵進行onehot編碼
19.4.5缺失值填補
19.4.6數據傾斜
19.5模型訓練和結果評價
19.5.1構造模型思路
19.5.2模型訓練的流程
19.5.3K-Fold交*驗* <*r> 19.6各分類器模型的訓練和結果評價
19.6.1利用Python的sklearn包進行模型訓練的過程梳理
19.6.2邏輯斯諦分類模型的訓練和結果評價
19.6.3**近鄰算法模型的訓練和結果評價
19.6.4線*判*分析模型的訓練和結果評價
19.6.5樸素貝葉斯算法的模型的訓練和結果評價
19.6.6決策樹模型的訓練和結果評價
19.6.7支持向量機模型的訓練和結果評價
19.7模型提升——集成分類器
19.7.1Boosting提升算法
19.7.2AdaBoost提升算法
19.7.3AdaBoost實現過程及實驗結果

附錄A用戶歷史充值情況數據表
附錄B用戶各類訂*餘額情況
附錄C各省用戶收到公示消息後的充值情況
參考文獻