動手學 AutoML 從NAS到大語言模型優化實戰
賀鑫
- 出版商: 機械工業
- 出版日期: 2026-05-01
- 售價: $774
- 語言: 簡體中文
- ISBN: 7111803647
- ISBN-13: 9787111803645
-
相關分類:
Machine Learning
下單後立即進貨 (約4週~6週)
相關主題
商品描述
《動手學 AutoML:從 NAS 到大語言模型化實戰》聚焦機器學習自動化的發展趨勢,系統介紹了 AutoML 的核心原理、關鍵方法、系統架構與典型應用,輔以多個完整項目,幫助讀者實現從理解到實戰的過渡。
《動手學 AutoML:從 NAS 到大語言模型化實戰》內容涵蓋傳統流程自動化(如模型選擇與參數調)、深度學習架構搜索(如 NAS)、大語言模型與 LLM Agent 系統化,展現 AutoML 技術的全景圖譜。
《動手學 AutoML:從 NAS 到大語言模型化實戰》分為四個分:第一分介紹機器學習流程的工程覆雜性,提出自動建模的需求,並建立AutoML 的基本定義、化目標與系統流程框架;第二分聚焦 NAS,講解搜索空間、搜索策略與模型評估方法,全面解析結構搜索自動化技術;第三分聚焦 AutoML 在模型組件、數據策略與大語言模型上的自動化應用,括損失函數搜索、激活函數搜索、數據增強策略、LLM 模型壓縮與融合,以及 LLM Agent 與 AutoML 的融合方式;第四分提供實戰項目,括基於隨機搜索的 NAS 入門實踐、可微分搜索與進化壓縮開發,以及 LLM 剪枝化的研究示例,配有代碼與完整流程。
《動手學 AutoML:從 NAS 到大語言模型化實戰》適合有一定機器學習基礎的研究生、與數據科學實踐者,兼顧原理講解與實戰指導,是深入掌握 AutoML 技術的實用讀物。
目錄大綱
前 言
第一分 基礎篇:AutoML 基礎介紹
第 1 章 機器學習與 AutoML 基礎 / 2
1.1 機器學習概述 / 2
1.1.1 機器學習定義與範式 / 2
1.1.2 機器學習應用的自動化需求 / 4
1.2 AutoML 定義與化目標 / 7
1.3 AutoML 的技術演進 / 9
1.3.1 傳統機器學習時代 / 9
1.3.2 深度學習時代 / 10
1.3.3 大語言模型時代 / 11
1.4 AutoML 的系統流程 / 13
1.4.1 數據準備自動化 / 14
1.4.2 征工程自動化 / 17
1.5 經架構搜索(NAS)基礎 / 21
1.5.1 NAS 核心組件 / 22
1.5.2 NAS 思想的多領域延伸 / 24
參考文獻 / 25
第 2 章 AutoML 框架與平臺 / 26
2.1 傳統機器學習自動化框架 / 26
2.1.1 Auto-WEKA:貝葉斯化自動選參框架 / 26
2.1.2 AutoSklearn:基於集成學習的自動建模 / 27
2.1.3 TPOT:基於遺傳算法化流水線 / 28
2.2 深度學習自動化框架 / 29
2.2.1 微軟 NNI 框架 / 29
2.2.2 華為 Vega 框架 / 31
2.2.3 Hyperbox 框架 / 33
2.2.4 AutoGluon 框架 / 34
2.2.5 Auto-Keras 框架 / 35
2.3 AutoML 雲服務平臺 / 35
2.3.1 谷歌 Cloud AutoML / 36
2.3.2 微軟 Azure AutoML / 38
2.3.3 百度 EasyDL / 39
2.3.4 阿裏雲 PAI / 41
2.3.5 Autopilot / 43
2.3.6 Databricks AutoML / 44
2.4 AutoML 業服務公司 / 46
2.4.1 H2O.ai 公司 / 46
2.4.2 第四範式 / 49
2.4.3 九章雲 DataCanvas / 51
第二分 進篇:NAS 技術詳解
第 3 章 NAS 搜索空間 / 56
3.1 NAS 搜索空間基礎 / 56
3.1.1 模型架構的形式化表達 / 56
3.1.2 常用候選作集 / 57
3.2 基於整體結構的搜索空間 / 58
3.3 基於單元結構的搜索空間 / 59
3.3.1 設計範式簡介 / 59
3.3.2 單元內結構 / 59
3.3.3 覆雜度分析 / 60
3.3.4 模型不一性問題 / 61
3.4 基於層級結構的搜索空間 / 62
3.4.1 內層:基於單元層級的網絡結構設計 / 62
3.4.2 外層:基於網絡層級的網絡結構設計 / 63
3.5 基於網絡態射的搜索空間 / 64
3.5.1 網絡態射 / 64
3.5.2 恒等網絡態射 / 65
3.5.3 改進的網絡態射算法 / 68
3.6 基於基礎數學運算的搜索空間 / 70
3.6.1 AutoML-Zero 基本原理 / 70
3.6.2 搜索難度分析 / 71
3.6.3 搜索策略 / 72
參考文獻 / 73
第 4 章 NAS 搜索策略 / 75
4.1 基礎搜索策略 / 75
4.1.1 網格搜索 / 75
4.1.2 隨機搜索 / 76
4.2 進化搜索策略 / 77
4.2.1 進化算法基本原理 / 77
4.2.2 架構編碼策略 / 79
4.2.3 進化算子設計 / 82
4.2.4 進化算法 NAS 實踐 / 85
4.3 貝葉斯化策略 / 88
4.3.1 貝葉斯化的基本原理 / 89
4.3.2 代理模型 / 90
4.3.3 采集函數 / 93
4.3.4 貝葉斯化 NAS 實踐 / 95
4.4 強化學習策略 / 100
4.4.1 強化學習基本原理 / 100
4.4.2 貝爾曼方程 / 102
4.4.3 強化學習算法分類 / 103
4.4.4 策略梯度算法 / 104
4.4.5 策略梯度 NAS 實踐 / 106
4.5 可微分經架構搜索策略 / 112
4.5.1 可微分搜索算法原理 / 113
4.5.2 改進的可微分搜索算法 / 114
參考文獻 / 118
第 5 章 NAS 模型評估 / 119
5.1 完整訓練評估 / 120
5.2 代理模型評估 / 120
5.3 早停法模型評估 / 121
5.3.1 基於資源分配的高效評估框架 / 121
5.3.2 基於學習曲線預測的智能評估 / 122
5.4 權重共享評估 / 122
5.4.1 權重共享的基本原理與勢 / 123
5.4.2 實現策略與關鍵技術 / 123
5.5 訓練評估 / 124
5.6 約束條件下的模型評估 / 131
5.6.1 常見的約束條件 / 131
5.6.2 單目標化 / 132
5.6.3 多目標化 / 132
5.7 NAS 基準測試評估 / 134
5.7.1 基於圖像的 NAS-Bench-101 數據集 / 135
5.7.2 基於圖像的 NAS-Bench-201 數據集 / 138
5.7.3 基於文本的 NAS-Bench-NLP 數據集 / 140
5.7.4 基於語音的 NAS-Bench-ASR 數據集 / 141
參考文獻 / 145
第三分 應用篇:AutoML 高級應用
第 6 章 模型組件自動化 / 148
6.1 損失函數搜索 / 148
6.1.1 基於強化學習的損失函數搜索 / 150
6.1.2 基於進化算法的損失函數搜索 / 151
6.2 激活函數搜索 / 154
6.2.1 常見的激活函數 / 154
6.2.2 基於強化學習的激活函數搜索 / 157
參考文獻 / 160
第 7 章 數據策略自動化 / 161
7.1 數據增強搜索 / 161
7.1.1 基於強化學習的數據增強搜索算法 / 162
7.1.2 基於種群進化的數據增強搜索算法 / 165
7.2 代理數據集搜索 / 166
7.2.1 無監督采樣方法 / 167
7.2.2 有監督采樣方法 / 168
7.2.3 基於動態指標調整的自動代理數據集選擇方法 / 169
參考文獻 / 173
第 8 章 大語言模型(LLM)自動化 / 174
8.1 大語言模型技術基礎 / 174
8.1.1 從統計語言模型到大語言模型 / 174
8.1.2 Transformer 架構解析 / 176
8.2 架構創新自動化 / 179
8.2.1 基於模塊內結構的搜索 / 180
8.2.2 基於模塊連接方式的搜索 / 182
8.3 計算效率化自動化 / 186
8.3.1 大語言模型壓縮 / 186
8.3.2 大語言模型量化 / 191
8.4 模型融合自動化 / 196
8.4.1 模型融合的應用值 / 196
8.4.2 主流模型融合策略 / 197
8.4.3 基於進化算法的自動模型融合策略 / 199
參考文獻 / 202
第 9 章 LLM 驅動的 AutoML / 204
9.1 基於自然語言和 LLM 引導的經架構搜索 / 204
9.1.1 GENIUS:卷積經網絡搜索的性探索 / 205
9.1.2 GPT4GNAS:拓展到圖經網絡領域 / 206
9.1.3 EvoPrompting:代碼層面的架構搜索指導 / 207
9.2 LLM 增強的自動征工程 / 211
9.2.1 LLM 上下文感知的自動征工程 / 212
9.2.2 LLM 知識驅動的征調生成 / 213
9.3 LLM Agent 與 AutoML 系統的雙向融合 / 215
9.3.1 LLM Agent 關鍵 / 215
9.3.2 AutoM3L:多模態數據處理化框架 / 216
9.3.3 MLCopilot:經驗與知識覆用的智能系統 / 218
9.3.4 AutoML-Agent:多智能體協作的全流程化 / 219
9.3.5 MaAS:多智能體架構搜索 / 221
參考文獻 / 224
第四分 實戰篇:AutoML 項目實戰
第 10 章 從零開始構建 NAS 系統:隨機搜索入門項目 / 226
10.1 NAS 基礎算子實現原理 / 226
10.1.1 Hyperbox 框架簡介 / 226
10.1.2 可搜索模塊(Mutable) / 227
10.1.3 搜索器(Mutator) / 236
10.1.4 可搜索模型基類 (BaseNASNetwork) / 242
10.2 基於隨機搜索的 NAS 代碼實戰 / 247
10.2.1 MNIST 數據集的獲取與預處理 / 247
10.2.2 CNN 網結構設計與實現 / 249
10.2.3 隨機搜索算法實現 / 251
10.2.4 模型訓練與評估函數實現 / 252
10.2.5 網訓練與子網評估 / 254
10.2.6 提取子網 / 256
第 11 章 進 AutoML 技術實戰:可微分搜索、進化壓縮與LLM剪枝 / 258
11.1 基於可微分算法的架構搜索 / 258
11.1.1 CIFAR-10 數據集的獲取與預處理 / 258
11.1.2 DARTS 算法實現 / 260
11.1.3 基於 MobileNetV2 的搜索空間設計 / 263
11.1.4 模型訓練與架構搜索 / 268
11.1.5 模型評估與微調 / 272
11.2 基於進化算法的模型壓縮 / 273
11.2.1 ResNet 搜索空間設計 / 274
11.2.2 NSGA-II 算法概述 / 278
11.2.3 非支配排序 / 279
11.2.4 擁擠度距離 / 282
11.2.5 進化算子實現 / 284
11.2.6 訓練和搜索模型 / 290
11.3 基於遺傳算法的 LLM 後訓練剪枝算法實戰 / 294
11.3.1 模型剪枝技術概述 / 295
11.3.2 基於遺傳算法的 LLM 剪枝框架概覽 / 296
11.3.3 符號樹搜索空間 / 298
11.3.4 符號樹代碼實現 / 300
11.3.5 遺傳算法實現 / 308
11.3.6 剪枝指標有效性驗證 / 313
