元學習:基礎與應用

彭慧民

  • 出版商: 電子工業
  • 出版日期: 2021-05-01
  • 售價: $534
  • 貴賓價: 9.5$507
  • 語言: 簡體中文
  • 頁數: 272
  • 裝訂: 平裝
  • ISBN: 7121409844
  • ISBN-13: 9787121409844
  • 立即出貨 (庫存 < 4)

買這商品的人也買了...

商品描述

本書介紹了元學習方法的發展歷史、起源、思想、近來流行的元學習方法,以及這些方法的組織思路、改進方案、相互繼承、如何應用。本書共11章,分為兩部分:元學習方法思想的介紹和元學習應用場景中模型的介紹。這些內容介紹瞭如何在元學習框架下融入強化學習、模仿學習、在線學習、無監督學習、遷移學習等,實現對實際應用中深度模型的改進,以適應復雜多變的實際任務。

作者簡介

彭慧民,2012年畢業於清華大學水利水電工程系,獲工程學學士、經濟學學士雙學位;2017年畢業於美國北卡羅萊納州立大學統計系,獲統計學博士學位,研究方向是高維數據和因果推斷;2019年完成在清華大學金融系的博士後工作,研究方向是公募基金業績評價。之後在浪潮(北京)電子信息產業有限公司做國家重點實驗室研究員,從事機器學習的研究工作。

目錄大綱

前言1
目錄3
1元學習介紹8
1.1研究背景13
1.1.1元學習與深度學習的區別和聯繫15
1.1.2元學習應用舉例19
1.2元學習起源21
1.2 .1 1987年的Jürgen Schmidhuber 21
1.2.2 1990年的Stuart Russell和Eric H.Wefald 24
1.3近期發展25
1.3.1 1997年長短期記憶網絡LSTM 26
1.3.2 2001年LSTM元學習系統27
1.3.3 2017年MAML算法28
1.3.4 2019年基於LSTM的元學習器28
1.3.5 2019年基於高效基礎學習器的元學習29
1.4參考文獻和擴展閱讀30

2元學習框架32
2.1元學習研究常用數據集33
2.2定義任務36
2.2.1元學習任務的定義37
2.2.2元強化學習任務的定義38
2.2.3任務分解39
2.3元學習訓練框架40
2.4元學習方法分類42
2.4.1神經網絡適應法42
2.4.2度量學習適應法43
2.4.3基礎學習器和元學習器適應法44
2.4.4貝葉斯元學習適應法44
2.4.5元學習與其他學習框架結合45
2.5元學習方法比較46
2.6參考文獻和擴展閱讀48

3元學習神經網絡方法49
3.1神經網絡51
3.1.1神經元51
3.1.2權重、偏差和激活函數52
3.1.3網絡反向傳播算法54
3.1.4學習率、批尺寸、動量和權值衰減56
3.1.5神經網絡模型的正則化58
3.1.6批歸一化59
3.1.7隨機失活61
3.2卷積神經網絡62
3.2.1卷積層和濾波器62
3.2.2池化層和下採樣層64
3.2.3全連接層和上採樣層66
3.2.4經典卷積神經網絡67
3.3殘差網絡69
3.3.1殘差網絡模塊69
3.3. 2高速路神經網絡70
3.3.3寬殘差網絡70
3.4元學習神經網絡模型71
3.4.1學會學習的神經網絡學習器72
3.4.2預訓練深度神經網絡的適應73
3.4.3具有適應性的神經元設計75
3.5自動化機器學習80
3.5.1超參數優化80
3.5.2元學習和自動化機器學習81
3.5.3加速自動化機器學習84
3.5.4決策式自動化機器學習88
3.5.5漸進式自動化機器學習90
3.6總結95
3.7參考文獻和擴展閱讀95

4基於度量的元學習方法98
4.1基於度量的學習99
4.1.1度量的定義100
4.1.2度量學習的應用102
4.1.3有監督度量學習103
4.1.4半監督度量學習106
4.1.5無監督度量學習108
4.2注意力模型108
4.3記憶模塊109
4.4 SNAIL算法113
4.5 Relation Network算法115
4.6 Prototypical Network算法118
4.7 TADAM算法120
4.8 Dynamic Few-Shot算法123
4 .9 mAP算法128
4.10總結132
4.11參考文獻和擴展閱讀133

5基礎學習器和元學習器結合的元學習134
5.1基礎學習器137
5.2元學習器138
5.3 MAML算法139
5.4 Reptile算法145
5.5 Recurrent Neural Network 149
5.5.1 RNN基礎結構149
5.5.2 Bidirectional RNN 152
5.5.3 Long Short-Term Memory 153
5.5.4 Gated Recurrent Unit 156
5.6 RNN元學習算法158
5.7 Meta-LSTM算法160
5.8 R2D2算法164
5.9 LR2D2算法167
5.10 MetaOptNet算法170
5.11 Transductive Propagation Network算法173
5.12 Latent Embedding Optimization算法178
5.13參考文獻和擴展閱讀182

6貝葉斯思想下的元學習方法184
6. 1 Bayesian Program Learning算法186
6.2 Neural Statistician算法189
6.3 LLAMA算法192
6.4 BMAML算法197
6.5 PLATIPUS算法202
6.6 VERSA算法204
6.7參考文獻和擴展閱讀207

7元學習的應用場景208
7.1元遷移學習211
7.2元強化學習212
7.3元模仿學習213
7.4在線元學習213
7.5無監督元學習214
7.6參考文獻和擴展閱讀215

8元強化學習216
8.1強化學習216
8.2基於MAML的元強化學習218
8.3 GrBAL算法219
8.4參考文獻和擴展閱讀222

9元模仿學習223
9.1模仿學習223
9.2 MAML算法用於元模仿學習225
9.3 MetaMimic算法226
9.4參考文獻和擴展閱讀229

10在線元學習229
10.1在線學習229
10.2 FTML算法231
10 .3參考文獻和擴展閱讀233

11無監督元學習233
11.1無監督學習233
11.2 CACTUs算法235
11.3參考文獻和擴展閱讀236