Scikit-Learn 機器學習核心技術與實踐
譚貞軍
- 出版商: 清華大學
- 出版日期: 2022-03-01
- 定價: $474
- 售價: 8.5 折 $403
- 語言: 簡體中文
- ISBN: 7302599483
- ISBN-13: 9787302599487
-
相關分類:
Machine Learning
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$474$450 -
$350$315 -
$1,000$850 -
$300$270 -
$714$678 -
$580$458 -
$594$564 -
$403BackTrader 量化交易案例圖解
-
$700$462 -
$720$562 -
$356集成學習入門與實戰:原理、算法與應用
-
$1,074$1,020 -
$556人工智能算法基礎
-
$509深度學習原理與PyTorch實戰(第2版)
-
$588$559 -
$327TensorFlow Lite 移動設備深度學習從入門到實踐
-
$704機器學習方法
-
$580$452 -
$620$465 -
$407智能推薦系統開發實戰
-
$880$581 -
$403動手學推薦系統 — 基於 PyTorch 的算法實現 (微課視頻版)
-
$454Scikit-learn機器學習高級進階
-
$556大規模語言模型:從理論到實踐
-
$680$537
相關主題
商品描述
《Scikit-Learn機器學習核心技術與實踐》循序漸進地講解了使用 Scikit-Learn 開發機器學習程序的核心知識,並通過具體實例的實現過程演練了使用 Scikit-Learn 的方法和流程。全書共10章,包括人工智能與Scikit-Learn 簡介,加載數據集,監督學習,無監督學習,模型選擇和評估,數據集轉換,實現大數據計算,英超聯賽比分預測系統(Matplotlib+Scikit-Learn+Flask+Pandas),AI考勤管理系統(face-recognition+Matplotlib+ Django+Scikit-Learn+Dlib),實時電影推薦系統(Scikit-Learn+Flask+Pandas)。本書簡潔而不失其技術深度,內容豐富全面,易於閱讀。 《Scikit-Learn機器學習核心技術與實踐》適用於已經瞭解Python語言基礎語法的讀者,以及想進一步學習機器學習和深度學習技術的讀者,還可以作為大專院校相關專業的師生用書和培訓學校的專業教材。
目錄大綱
第1 章 人工智能與Scikit-Learn 簡介 1
1.1 人工智能技術的興起 2
1.1.1 人工智能介紹 2
1.1.2 人工智能的研究領域 2
1.1.3 和人工智能相關的幾個重要概念 3
1.1.4 人工智能的兩個重要發展階段 4
1.2 機器學習和深度學習 4
1.2.1 機器學習 5
1.2.2 深度學習 5
1.2.3 機器學習和深度學習的區別 6
1.3 初步認識Scikit-Learn 7
1.3.1 Scikit-Learn 介紹 7
1.3.2 使用pip 安裝Scikit-Learn 7
1.3.3 使用Anaconda 安裝Scikit-Learn 8
1.3.4 解決速度過慢的問題 9
1.4 準備開發工具 10
第2 章 加載數據集 11
2.1 標準數據集API 12
2.1.1 波士頓房價數據集(適用於回歸任務) 12
2.1.2 威斯康星州乳腺癌數據集(適用於分類問題) 13
2.1.3 糖尿病數據集(適用於回歸任務) 13
2.1.4 手寫數字數據集(適用於分類任務) 14
2.1.5 Fisher 的鳶尾花數據集(適用於分類問題) 15
2.1.6 紅酒數據集(適用於分類問題) 15
2.2 自定義數據集 16
2.2.1 生成聚類數據 16
2.2.2 生成同心圓樣本點 17
2.2.3 生成模擬分類數據集 18
2.2.4 生成太極型非凸集樣本點 19
第3 章 監督學習 21
3.1 廣義線性模型 22
3.1.1 普通最小二乘法 22
3.1.2 嶺回歸 24
3.1.3 Lasso 回歸 25
3.2 線性判別分析和二次判別分析 27
3.2.1 使用線性判別分析來降維 28
3.2.2 LDA 和QDA 分類器的數學公式 30
3.2.3 收縮 30
3.3 內核嶺回歸 32
3.4 支持向量機 33
3.4.1 分類 34
3.4.2 回歸 36
3.4.3 密度估計和異常檢測 38
3.5 隨機梯度下降 39
3.5.1 分類 40
3.5.2 回歸 42
3.5.3 稀疏數據的隨機梯度下降 42
第4 章 無監督學習 49
4.1 高斯混合模型 50
4.1.1 高斯混合 50
4.1.2 變分貝葉斯高斯混合 53
4.2 流形學習 55
4.3 聚類 57
4.3.1 KMeans 算法 57
4.3.2 MiniBatchKMeans 算法 60
4.4 雙聚類 62
4.4.1 譜聚類算法 63
4.4.2 光譜聯合聚類算法 66
第5 章 模型選擇和評估 69
5.1 交叉驗證:評估估算器的表現 70
5.1.1 計算交叉驗證的指標 71
5.1.2 交叉驗證迭代器 75
5.2 調整估計器的超參數 76
5.2.1 網格追蹤法:窮盡的網格搜索 77
5.2.2 隨機參數優化 80
5.3 模型評估: 量化預測的質量 82
5.3.1 得分參數scoring :定義模型評估規則 83
5.3.2 分類指標 85
第6 章 數據集轉換 89
6.1 Pipeline(管道)和 FeatureUnion(特徵聯合) 90
6.1.1 Pipeline : 鏈式評估器 90
6.1.2 FeatureUnion(特徵聯合):特徵層 93
6.2 特徵提取 95
6.2.1 從字典類型加載特徵 95
6.2.2 特徵哈希 96
6.2.3 提取文本特徵 97
6.2.4 提取圖像特徵 99
6.3 預處理數據 102
6.3.1 標準化處理 102
6.3.2 非線性轉換 103
6.4 無監督降維 106
6.4.1 PCA :主成分分析 106
6.4.2 隨機投影 110
第7 章 實現大數據計算 117
7.1 計算擴展策略 118
7.1.1 使用外核學習實例進行拓展 118
7.1.2 使用外核方法進行分類 119
7.2 計算性能 129
7.2.1 預測延遲 129
7.2.2 預測吞吐量 137
第8 章 英超聯賽比分預測系統(Matplotlib+Scikit-Learn+Flask+Pandas) 143
8.1 英超聯賽介紹 144
8.2 系統模塊介紹 144
8.3 數據集 144
8.3.1 獲取api-football 密鑰 145
8.3.2 獲取數據 145
8.3.3 收集最新數據 150
8.4 特徵提取和數據可視化 152
8.4.1 提取數據 153
8.4.2 數據可視化 154
8.5 模型選擇和訓練 161
8.5.1 機器學習函數 161
8.5.2 數據降維 172
8.5.3 MLP 神經網絡 175
8.6 模型評估 178
8.6.1 近鄰模型和混淆矩陣模型 179
8.6.2 隨機森林模型和混淆矩陣模型 186
8.6.3 SVM 模型和混淆矩陣模型 190
8.7 Web 可視化 197
8.7.1 獲取預測數據 197
8.7.2 Flask Web 主頁 200
第9 章 AI 考勤管理系統(face-recognition+Matplotlib+Django+Scikit-Learn+Dlib) 203
9.1 背景介紹 204
9.2 系統需求分析 204
9.2.1 可行性分析 204
9.2.2 系統操作流程分析 204
9.2.3 系統模塊設計 204
9.3 系統配置 205
9.3.1 Django 配置文件 205
9.3.2 路徑導航文件 206
9.4 用戶註冊和登錄驗證 207
9.4.1 登錄驗證 207
9.4.2 添加新用戶 208
9.4.3 設計數據模型 210
9.5 採集照片和機器學習 210
9.5.1 設置採集對象 210
9.5.2 採集照片 212
9.5.3 訓練照片模型 214
9.6 考勤打卡 216
9.6.1 上班打卡簽到 216
9.6.2 下班打卡 218
9.7 可視化考勤數據 220
9.7.1 統計最近兩周員工的考勤數據 220
9.7.2 查看本人在指定時間段內的考勤信息 225
9.7.3 查看某員工在指定時間段內的考勤信息 229
第10 章 實時電影推薦系統(Scikit-Learn+Flask+Pandas) 233
10.1 系統介紹 234
10.1.1 背景介紹 234
10.1.2 推薦系統和搜索引擎 234
10.1.3 項目介紹 235
10.2 系統模塊 235
10.3 數據採集和整理 235
10.3.1 數據整理 236
10.3.2 電影詳情數據 239
10.3.3 提取電影特徵 247
10.4 情感分析和序列化操作 252
10.5 Web 端實時推薦 253
10.5.1 Flask 啟動頁面 253
10.5.2 模板文件 256
10.5.3 後端處理 263