自動機器學習入門與實踐:使用 Python (Hands-On Automated Machine Learning: A beginner's guide to building automated machine learning systems using AutoML and Python)

Sibanjan Das, Umit Mert Cakmak

買這商品的人也買了...

商品描述

AutoML可以將部分機器學習過程自動化,減輕數據科學從業者的工作負擔,深受高級分析人員的喜愛。
本書介紹搭建AutoML模塊的基礎知識,並通過練習幫助讀者消化這些知識。
讀者將學習使用機器學習流水線自動實現數據預處理、特徵選擇、模型訓練、模型優化等任務,
學習應用auto-sklearn和MLBox等已有的自動化庫,並且創建和擴展自定義的AutoML環節。
閱讀本書,你將對AutoML有更清晰的認識,能利用真實數據集完成自動化任務。
書中知識可運用到實際的機器學習項目中,或者在機器學習競賽中助你一臂之力。 

作者簡介

SibanjaDas

是業界資深數據科學顧問,是廣獲好評的《Data Science Using Oracle Data Miner and Oracle R Enterprise》一書作者。

目錄大綱

目錄:

第1章AutoML簡介1
1.1機器學習的範圍2
1.2什麼是AutoML 4
1.3為什麼和怎麼用AutoML 10
1.4何時需要將機器學習自動化11
1.5能學到什麼11
1.6 AutoML庫概述13
1.7總結23

第2章Python機器學習簡介25
2.1技術要求26
2.2機器學習26
2.3線性回歸28
2.4重要評估指標——回歸算法37
2.5邏輯回歸39
2.6重要評估指標——分類算法44
2.7決策樹46
2.8支持向量機49
2.9 K近鄰算法52
2.10集成方法54
2.11分類器結果對比59
2.12交叉驗證60
2.13聚類61
2.14總結66

第3章數據預處理67
3.1技術要求68
3.2數據轉換68
3.3特徵選擇97
3.4特徵生成103
3.5總結105

第4章自動化算法選擇107
4.1技術要求108
4.2計算複雜度108
4.3訓練時間和推理時間的區別110
4.4線性與非線性119
4.5必要特徵轉換124
4.6監督機器學習125
4.7無監督AutoML 132
4.8總結157

第5章超參數優化159
5.1技術要求160
5.2超參數161
5.3熱啟動173
5.4貝葉斯超參數優化174
5.5示例係統175
5.6總結178

第6章創建AutoML流水線179
6.1技術要求180
6.2機器學習流水線簡介180
6.3簡單的流水線182
6.4函數轉換器184
6.5複雜流水線187
6.6總結190

第7章深度學習探究191
7.1技術要求192
7.2神經網絡概覽192
7.3使用Keras的前饋神經網絡198
7.4自編碼器201
7.5卷積神經網絡205
7.6總結210

第8章機器學習和數據科學項目的重點211
8.1機器學習搜索211
8.2機器學習的權衡221
8.3典型數據科學項目的參與模型222
8.4參與模型的階段223
8.5總結228
作者簡介230
索引231