機器學習原理與實戰

何偉,張良均

  • 出版商: 人民郵電
  • 出版日期: 2021-06-01
  • 定價: $359
  • 售價: 5.5$199
  • 語言: 簡體中文
  • 頁數: 277
  • 裝訂: 平裝
  • ISBN: 7115563993
  • ISBN-13: 9787115563996
  • 相關分類: Machine Learning
  • 立即出貨

  • 機器學習原理與實戰-preview-1
  • 機器學習原理與實戰-preview-2
機器學習原理與實戰-preview-1

商品描述

本書以Python機器學習常用技術與真實案例相結合的方式,深入淺出地介紹了Python機器學習應用的主要內容。全書共11章,分別介紹了機器學習概述、數據準備、特徵工程、有監督學習、無監督學習、智能推薦的相關知識,並介紹了市財政收入分析案例、基於非侵入式電力負荷監測與分解的電力分析案例、航空公司客戶價值分析案例、廣電大數據營銷推薦案例以及基於TipDM數據挖掘建模平臺實現航空公司客戶價值分析案例。每章都包含了課後習題,幫助讀者鞏固所學的內容。

本書可以作為高校數據科學或人工智能的相關專業教材,也可以作為機器學習愛好者的自學用書。

作者簡介

何偉,閩江學院,男,中共黨員,1982年出生,工學博士,副教授,碩士生導師,閩都學者拔尖人才,香港理工訪問學者,入選福建省高校傑出青年科研人才培育計劃。
主要研究領域:智能係統與信息融合、船海裝備與新能源。
近三年,承擔了《系統工程》、《大數據分析與應用》《智能交通系統創新》、《物流技術與設備》等課程教學任務,先後在國內外發表學術論文30餘篇,其中SCI、 EI等檢索收錄論文20餘篇;主持和參與國家自然科學基金、省自然科學基金項目等省部級以上項目十餘項;獲得福建省教學成果特等獎、福建省科技進步二等獎、中國航海學會科學技術一等獎等多項省部級獎項。
現兼任福建省創新創業創造教育指導委員會委員,中國智能交通協會水路交通專業委員會委員,福建省船舶與海洋工程學會委員。


張良均 高級信息系統項目管理師,泰迪杯全國大學生數據挖掘競賽的發起人。
華南師範大學、廣東工業大學兼職教授,廣東省工業與應用數學學會理事。
兼有大型高科技企業和高校的工作經歷,主要從事大數據挖掘及其應用的策劃、研發及諮詢培訓。
全國計算機技術與軟件專業技術資格(水平)考試繼續教育和CDA數據分析師培訓講師。
發表數據挖掘相關論文數二十餘篇,已取得國家發明專利12項,主編圖書《神經網絡實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》等9本暢銷圖書,主持並完成科技項目9項。
獲得SAS、SPSS數據挖掘認證及Hadoop開發工程師證書,具有電力、電信、銀行、製造企業、電子商務和電子政務的項目經驗和行業背景。

目錄大綱

第 1章 機器學習概述 1
1.1 機器學習簡介 1
1.1.1 機器學習的概念 1
1.1.2 機器學習的應用領域 1
1.2 機器學習通用流程 3
1.2.1 目標分析 4
1.2.2 數據準備 5
1.2.3 特徵工程 6
1.2.4 模型訓練 7
1.2.5 性能度量與模型調優 7
1.3 Python機器學習工具庫簡介 7
1.3.1 數據準備相關工具庫 8
1.3.2 數據可視化相關工具庫 8
1.3.3 模型訓練與評估相關工具庫 9
小結 10
課後習題 10

第 2章 數據準備 13
2.1 數據質量校驗 13
2.1.1 一致性校驗 13
2.1.2 缺失值校驗 16
2.1.3 異常值分析 17
2.2 數據分佈與趨勢探查 18
2.2.1 分佈分析 18
2.2.2 對比分析 22
2.2.3 描述性統計分析 26
2.2.4 周期性分析 28
2.2.5 貢獻度分析 30
2.2.6 相關性分析 31
2.3 數據清洗 35
2.3.1 缺失值處理 35
2.3.2 異常值處理 39
2.4 數據合並 39
2.4.1 數據堆疊 40
2.4.2 主鍵合並 43
小結 45
課後習題 45

第3章 特徵工程 48
3.1 特徵變換 48
3.1.1 特徵縮放 48
3.1.2 獨熱編碼 52
3.1.3 離散化 53
3.2 特徵選擇 56
3.2.1 過濾式選擇 57
3.2.2 包裹式選擇 58
3.2.3 嵌入式選擇 58
3.2.4 字典學習 59
小結 64
課後習題 64

第4章 有監督學習 67
4.1 有監督學習簡介 67
4.2 性能度量 67
4.2.1 分類任務性能度量 68
4.2.2 回歸任務性能度量 70
4.3 線性模型 70
4.3.1 線性模型簡介 70
4.3.2 線性回歸 70
4.3.3 邏輯回歸 73
4.4 k近鄰分類 76
4.5 決策樹 78
4.5.1 決策樹簡介 78
4.5.2 ID3算法 79
4.5.3 C4.5算法 81
4.5.4 CART算法 84
4.6 支持向量機 86
4.6.1 支持向量機簡介 86
4.6.2 線性支持向量機 87
4.6.3 非線性支持向量機 91
4.7 樸素貝葉斯 94
4.8 神經網絡 98
4.8.1 神經網絡介紹 98
4.8.2 BP神經網絡 99
4.9 集成學習 103
4.9.1 Bagging 104
4.9.2 Boosting 106
4.9.3 Stacking 109
小結 111
課後習題 111

第5章 無監督學習 113
5.1 無監督學習簡介 113
5.2 降維 113
5.2.1 PCA 114
5.2.2 核化線性降維 116
5.3 聚類任務 119
5.3.1 性能度量 119
5.3.2 距離計算 120
5.3.3 原型聚類 121
5.3.4 密度聚類 128
5.3.5 層次聚類 131
小結 133
課後習題 133

第6章 智能推薦 135
6.1 智能推薦簡介 135
6.1.1 什麽是推薦系統 135
6.1.2 智能推薦的應用 135
6.2 智能推薦性能度量 137
6.2.1 離線實驗評價指標 137
6.2.2 用戶調查評價指標 139
6.2.3 在線實驗評價指標 140
6.3 基於關聯規則的智能推薦 140
6.3.1 關聯規則和頻繁項集 140
6.3.2 Apriori 141
6.3.3 FP-Growth 145
6.4 基於協同過濾的智能推薦 150
6.4.1 基於用戶的協同過濾 150
6.4.2 基於物品的協同過濾 153
小結 157
課後習題 157

第7章 市財政收入分析 160
7.1 目標分析 160
7.1.1 背景 160
7.1.2 數據說明 160
7.1.3 分析目標 161
7.2 數據準備 162
7.3 特徵工程 164
7.3.1 Lasso回歸 164
7.3.2 特徵選擇 164
7.4 模型訓練 165
7.4.1 灰色預測模型 165
7.4.2 關鍵特徵預測 166
7.4.3 SVR模型預測 168
7.5 性能度量 169
小結 171
課後習題 171

第8章 基於非侵入式電力負荷監測與分解的電力分析 172
8.1 目標分析 172
8.1.1 背景 172
8.1.2 數據說明 173
8.1.3 分析目標 175
8.2 數據準備 176
8.2.1 數據探索 176
8.2.2 缺失值處理 179
8.3 特徵工程 181
8.3.1 設備數據 181
8.3.2 周波數據 182
8.4 模型訓練 183
8.5 性能度量 185
小結 189
課後習題 189

第9章 航空公司客戶價值分析 190
9.1 目標分析 190
9.1.1 背景 190
9.1.2 數據說明 191
9.1.3 分析目標 192
9.2 數據準備 192
9.2.1 數據探索 192
9.2.2 數據清洗 193
9.3 特徵工程 193
9.3.1 特徵構造 193
9.3.2 特徵選擇 195
9.3.3 特徵變換 196
9.4 模型訓練 198
9.5 性能度量 199
9.5.1 結果分析 199
9.5.2 客戶價值分析 201
小結 202
課後習題 202

第 10章 廣電大數據營銷推薦 205
10.1 目標分析 205
10.1.1 背景 205
10.1.2 數據說明 206
10.1.3 分析目標 208
10.2 數據準備 209
10.2.1 數據獲取 209
10.2.2 數據清洗 209
10.2.3 數據探索分析 216
10.3 特徵工程 222
10.3.1 特徵構造 222
10.3.2 節目信息的獲取 244
10.4 模型構建 247
10.4.1 基於物品的協同過濾算法的推薦模型 248
10.4.2 基於Simple TagBased TF-IDF算法的標簽推薦模型 250
10.4.3 Popular流行度推薦模型 254
10.5 性能度量 255
10.6 結果分析 258
小結 258
課後習題 259

第 11章 基於TipDM數據挖掘建模平臺實現航空公司客戶價值分析 260
11.1 平臺簡介 260
11.1.1 首頁 261
11.1.2 數據源 261
11.1.3 工程 263
11.1.4 系統組件 263
11.1.5 TipDM數據挖掘建模平臺的本地化部署 264
11.2 快速構建航空公司客戶價值分析工程 267
11.2.1 數據獲取 267
11.2.2 數據準備 270
11.2.3 特徵工程 273
11.2.4 模型訓練 275
小結 277
課後習題 277

參考文獻 278