機器學習案例驅動教程

張霞,趙磊

  • 出版商: 電子工業
  • 出版日期: 2021-06-01
  • 定價: $294
  • 售價: 7.5$221
  • 語言: 簡體中文
  • 頁數: 260
  • 裝訂: 平裝
  • ISBN: 7121411032
  • ISBN-13: 9787121411038
  • 相關分類: Machine Learning
  • 立即出貨 (庫存 < 3)

商品描述

本書在不涉及大量數學模型與復雜算法實現的前提下,從機器學習概述開始,由“泰坦尼克號數據分析與預處理”“良/惡性乳腺癌腫瘤預測”“波士頓房價預測”“手寫體數字聚類”“人臉特徵降維”“在線旅行社酒店價格異常檢測”6個案例分別引入數據分析、分類、回歸、聚類、特徵降維和異常檢測的應用開發實戰技術及其少量理論,能夠幫助讀者以最快的速度掌握使用Scikit-learn庫進行機器學習開發的實戰技能。書末是學習機器學習時可能用到的附錄。本書適合對機器學習感興趣的初學者、需要快速入門機器學習的高職相關專業學生,以及期望快速進入機器學習任務的研發工程技術人員。

作者簡介

張霞,南京航空航天大學博士,現任南京信息職業技術學院人工智能學院人工智能技術服務教研室主任,2019年江蘇省高校青藍工程優秀青年骨干教師培養對象,江蘇省人工智能學會人工智能教育專業委員會委員,主要研究人工智能技術服務及信息職業教育。發表SCI論文2篇,EI論文1篇,中文核心論文2篇,主持中國電子教育學會課題1項獲一等獎,主持橫向課題2項,主持校社科課題1項,參與橫向課題3項,參與國家骨乾院校重點建設專業等。

目錄大綱

緒論 1 
0.1 機器學習綜述 1 
0.1.1 機器學習的含義 1 
0.1.2 機器學習的應用場景 1 
0.1.3 機器學習類型 3 
0.1.4 相關術語 5 
0.1.5 人工智能、機器學習與深度學習 6 
0.2 開發環境搭建 8 
0.2.1 Windows系統環境 8 
0.2.2 Ubuntu系統環境 17 
0.3 Python編程基礎 17 
0.3.1 Python簡介 17 
0.3.2 Python基本語法 18 
0.3.3 Python數據類型 19 
0.3.4 Python常用語句 28 
0.3.5 Python函數(模塊)設計 33 
0.3.6 Python編程庫(包)的導入 38 

案例1 泰坦尼克號數據分析與預處理 39 
1.1 案例描述及實現 39 
1.2 案例詳解及示例 43 
1.3 支撐技術 45 
1.3.1 Numpy 45 
1.3.2 Matplotlib 52 
1.3.3 Pandas 61 
1.3.4 Scikit-learn 64 

案例2 良/惡性乳腺癌腫瘤預測 66 
2.1 案例描述及實現 66 
2.2 案例詳解及示例 69 
2.2.1 數據預處理 69 
2.2.2 linear_model 71 
2.2.3 KNeighborsClassifier 74 
2.2.4 SVM 76 
2.2.5 naive_bayes 80 
2.2.6 DecisionTreeClassifier 82 
2.2.7 ensemble 85 
2.2.8 classification_report 87 
2.3 支撐知識 88 
2.3.1 分類任務簡介 88 
2.3.2 線性模型 88 
2.3.3 K近鄰分類 90 
2.3.4 支持向量機 91 
2.3.5 樸素貝葉斯 93 
2.3.6 決策樹 95 
2.3.7 集成模型 96 
2.3.8 神經網絡 97 

案例3 波士頓房價預測 98 
3.1 案例描述及實現 98 
3.2 案例詳解及示例 102 
3.2.1 數據預處理 102 
3.2.2 linear_model 104 
3.2.3 KNeighborsRegressor 108 
3.2.4 SVR 110 
3.2.5 DecisionTreeRegressor 111 
3.2.6 ensemble 113 
3.3 支撐知識 119 
3.3.1 回歸任務簡介 119 
3.3.2 線性回歸 120 
3.3.3 K近鄰回歸 121 
3.3.4 支持向量機回歸 122 
3.3.5 決策樹回歸 122 
3.3.6 集成模型回歸 124 

案例4 手寫體數字聚類 125 
4.1 案例描述及實現 125 
4.1.1 案例簡介 125 
4.1.2 數據介紹 125 
4.1.3 案例實現 126 
4.2 案例詳解及示例 129 
4.2.1 load_digits 129 
4.2.2 AgglomerativeClustering 130 
4.2.3 KMeans 131 
4.2.4 MeanShift 133 
4.2.5 DBSCAN 134 
4.2.6 AffinityPropagation 136 
4.2.7 v_measure_score 137 
4.3 支撐知識 140 
4.3.1 聚類任務簡介 140 
4.3.2 層次聚類 140 
4.3.3 K均值聚類 141 
4.3.4 均值漂移聚類 143 
4.3.5 密度聚類 143 
4.3.6 近鄰傳播聚類 144 

案例5 人臉特徵降維 145 
5.1 案例描述 145 
5.1.1 案例簡介 145 
5.1.2 數據介紹 145 
5.1.3 案例實現 145 
5.2 案例詳解及示例 148 
5.2.1 fetch_olivetti_faces 148 
5.2.2 PCA 149 
5.2.3 NMF 155 
5.2.4 FastICA 156 
5.2.5 FactorAnalysis 157 
5.3 支撐知識及示例 158 
5.3.1 特徵降維簡介 158 
5.3.2 主成分分析 158 
5.3.3 非負矩陣分解 159 
5.3.4 獨立成分分析 160 
5.3.5 因子分析 161 

案例6 在線旅行社酒店價格異常檢測 162 
6.1 案例描述 162 
6.1.1 案例簡介 162 
6.1.2 數據介紹 162 
6.1.3 案例實現 163 
6.2 案例詳解及示例 168 
6.2.1 導入數據 168 
6.2.2 基於聚類的異常檢測 168 
6.2.3 基於孤立森林的異常檢測 169 
6.2.4 基於支持向量機的異常檢測 172 
6.2.5 基於高斯分佈的異常檢測 173 
6.3 支撐知識 177 
6.3.1 異常檢測簡介 177 
6.3.2 基於聚類的異常檢測 177 
6.3.3 基於孤立森林的異常檢測 177 
6.3.4 基於支持向量機的異常檢測 179 
6.3.5 基於高斯分佈的異常檢測 179 

附錄A VirtualBox虛擬機軟件與Linux的安裝和配置 180 
附錄B Linux(Ubuntu 14.4)的基本命令與使用 203 
附錄C GitHub代碼托管平臺 208 
附錄D Docker技術與應用 212 
附錄E 人工智能的數學基礎與工具 214 
附錄F 公開數據集介紹與下載 225 
附錄G 人工智能的網絡學習資源 230 
附錄H 人工智能的技術圖譜 233 
附錄I 人工智能技術應用就業崗位與技能需求 237 
附錄J Sklearn常用模塊和函數 242 
參考文獻 248