機器學習導論

王東

  • 出版商: 清華大學
  • 出版日期: 2021-02-01
  • 售價: $768
  • 貴賓價: 9.5$730
  • 語言: 簡體中文
  • 頁數: 488
  • 裝訂: 平裝
  • ISBN: 7302546053
  • ISBN-13: 9787302546054
  • 相關分類: Machine Learning 機器學習

立即出貨 (庫存 < 3)

  • 機器學習導論-preview-1
  • 機器學習導論-preview-2
  • 機器學習導論-preview-3
機器學習導論-preview-1

買這商品的人也買了...

相關主題

商品描述

本書分類《機器學習導論》面向機器學習領域的主要模型和算法,重點闡述不同方法背後的基本假設以及它們之間的相關性,幫助讀者建立機器學習的基礎理論功底,為從事該領域的相關工作打下基礎。具體內容包括機器學習研究的總體思路、發展歷史與關鍵問題,線性模型,神經網絡及深度學習,核方法,圖模型,無監督學習,非參數模型,演化學習,強化學習,數值優化方法等。 本書可作為高等學校相關課程的教材,也可作為研究生及對機器學習感興趣的科技、工程技術人員的參考用書。本書封面貼有清華大學出版社防偽標簽,無標簽者不得銷售。

作者簡介

王東, 1995-2002年清華本科、碩士,2010年英國愛丁堡大學博士,歷任Oracle 中國軟件工程師,IBM中國高級軟件工程師,英國愛丁堡大學Marie Curie 研究員,法國EURECOM博士後研究員,美國Nuance公司高級研究科學家。
現任清華大學語音語言中心副研究員,中心常務副主任,FreeNeb公司首席科學家。
王東博士是全國人機語音通訊會議常設機構秘書長,是亞太信號信息處理聯盟(APASIPA)語音專委會副主席、傑出講師,是國際標準與語音數據資源委員會(COCOSDA)大陸區代表。
王東博士自1997年開始從事語音識別、自然語言處理方面的研究,在相關領域發表學術論文120餘篇,公開專利20餘項,其專利技術在日本軟銀、新松、智能管家等多家國內外著名公司應用,創造了良了的社會效益和經濟效益。

目錄大綱

目錄

第1章機器學習概述…………………………………………………………1
1.1什麽是機器學習…………………………………………………………1
1.2機器學習的基本框架……………………………………………………2
1.3機器學習發展簡史………………………………………………………5
1.4機器學習的流派…………………………………………………………7
1.4.1符號學派…………………………………………………………8
1.4.2貝葉斯學派………………………………………………………8
1.4.3連接學派………………………………………………………10
1.4.4進化仿生學派…………………………………………………11
1.4.5哪個學派更占主流……………………………………………12
1.5讓人驚訝的學習…………………………………………………………13
1.5.1從猴子摘香蕉到星際大戰……………………………………13
1.5.2集體學習的機器人……………………………………………14
1.5.3圖片理解………………………………………………………16
1.5.4金融市場量化分析……………………………………………18
1.5.5AlphaGo………………………………………………………20
1.6機器學習技術的前沿……………………………………………………21
1.7機器智能會超過人類智能嗎……………………………………………22
1.8機器學習基礎……………………………………………………………23
1.81訓練、驗證與測試………………………………………………23
1.8.2參數過擬合、交叉驗證與正則化………………………………24
1.8.3結構過擬合與模型選擇………………………………………24 
1.8.4機器學習方法分類……………………………………………27
1.9開始你的機器學習之旅…………………………………………………29
1.9.1如何開始一個機器學習任務…………………………………29
1.9.2如何學習機器學習……………………………………………30
1.10相關資源………………………………………………………………30

第2章線性模型………………………………………………………………33
2.1線性預測模型……………………………………………………………33
2.1.1從多項式擬合說起……………………………………………34
2.1.2線性回歸………………………………………………………36
2.1.3Fisher準則與線性分類………………………………………39
2.1.4Logistic回歸…………………………………………………42
2.1.5小結……………………………………………………………44
2.2線性概率模型……………………………………………………………45
2.2.1主成分分析……………………………………………………46
2.2.2概率主成分分析………………………………………………47
2.2.3概率線性判別分析……………………………………………50
2.3貝葉斯方法………………………………………………………………52
2.4本章小結…………………………………………………………………54
2.5相關資源…………………………………………………………………55

第3章神經模型………………………………………………………………56
3.1神經網絡概述……………………………………………………………57
3.1.1什麽是人工神經網絡…………………………………………58
3.1.2神經模型與其他方法…………………………………………58
3.2基於映射的神經模型……………………………………………………59
3.2.1從線性模型開始………………………………………………59
3.2.2多層感知器……………………………………………………62
3.2.3徑向基函數網絡………………………………………………67
3.2.4神經網絡模型與先驗知識……………………………………69
3.3基於記憶的神經模型……………………………………………………72
3.3.1Kohonen網絡…………………………………………………73
3.3.2Hopfield網絡…………………………………………………75
3.3.3玻爾茲曼機……………………………………………………78
3.3.4受限玻爾茲曼機………………………………………………81
3.3.5自編碼器………………………………………………………84
3.4基於過程的模型…………………………………………………………87
3.4.1ElmanRNN……………………………………………………88
3.4.2門網絡…………………………………………………………89
3.4.3序列對序列網絡………………………………………………93
3.4.4基於Attention模型的詩詞生成………………………………95
3.5神經圖靈機………………………………………………………………97
3.6本章小結…………………………………………………………………99
3.7相關資源………………………………………………………………100

第4章深度學習……………………………………………………………101
4.1從淺層學習到深度學習………………………………………………101
4.1.1網絡表達能力…………………………………………………102
4.1.2層次表示與特徵學習…………………………………………103
4.1.3顯著特徵的非監督學習………………………………………104
4.1.4復雜結構與數據驅動…………………………………………109
4.2深度神經網絡訓練……………………………………………………110
4.2.1基礎訓練算法…………………………………………………110
4.2.2DNN訓練的困難……………………………………………116
4.2.3DNN訓練技巧………………………………………………125
4.3神經網絡的正則化……………………………………………………134
4.3.1結構化網絡與參數共享………………………………………135
4.3.2範式約束與稀疏網絡…………………………………………137
4.3.3加噪訓練與數據增強…………………………………………140
4.3.4聯合訓練………………………………………………………140
4.3.5知識遷移………………………………………………………143
4.4生成模型下的深度學習………………………………………………145
4.4.1神經網絡的簡單概率表達……………………………………145
4.4.2後驗擬合與VariationalAE…………………………………147
4.4.3VariationalRNN……………………………………………151
4.5計算圖與復雜神經網絡………………………………………………153
4.5.1由ChainRule到計算圖……………………………………154
4.5.2基於計算圖的參數優化………………………………………156
4.5.3計算圖的模塊化………………………………………………157
4.5.4計算圖與深度神經網絡………………………………………157
4.6計算平臺與方法………………………………………………………160
4.6.1GPU與TPU…………………………………………………160
4.6.2並行計算………………………………………………………161
4.6.3模型壓縮………………………………………………………167
4.7深度學習的應用………………………………………………………169
4.7.1語音信號處理…………………………………………………169
4.7.2自然語言處理…………………………………………………173
4.7.3電腦視覺……………………………………………………176
4.8本章小結………………………………………………………………179
4.9相關資源………………………………………………………………180

第5章核方法…………………………………………………………………181
5.1從線性回歸到核方法…………………………………………………183
5.2核函數的性質…………………………………………………………184
5.2.1再生核希爾伯特空間與Mercer定理………………………184
5.2.2核函數的基本性質……………………………………………186
5.3常用核函數……………………………………………………………186
5.3.1簡單核函數……………………………………………………187
5.3.2概率核…………………………………………………………188
5.3.3復雜對象上的核函數…………………………………………189
5.4KernelPCA……………………………………………………………195
5.5高斯過程………………………………………………………………197
5.6支持向量機……………………………………………………………199
5.6.1線性可分的SVM……………………………………………200
5.6.2線性不可分的SVM…………………………………………202
5.6.3v-SVM………………………………………………………204
5.6.4SVM的若乾討論……………………………………………205
5.7相關向量機……………………………………………………………206
5.8本章小結………………………………………………………………208
5.9相關資源………………………………………………………………209

第6章圖模型…………………………………………………………………210
6.1概率圖模型簡介………………………………………………………211
6.2有向圖模型……………………………………………………………212
6.2.1典型模型………………………………………………………212
6.2.2有向圖變量相關性判斷………………………………………214
6.3無向圖模型……………………………………………………………217
6.3.1無向圖變量相關性判斷………………………………………218
6.3.2有向圖向無向圖轉化…………………………………………219
6.3.3有向圖和無向圖對比…………………………………………221
6.4常用概率圖模型………………………………………………………221
6.4.1高斯混合模型…………………………………………………221
6.4.2隱馬爾可夫模型………………………………………………225
6.4.3線性條件隨機場………………………………………………229
6.5EM算法………………………………………………………………232
6.6精確推理算法…………………………………………………………235
6.6.1加和—乘積算法………………………………………………235
6.6.2樹狀圖的加和—乘積算法……………………………………237
6.6.3聯合樹算法……………………………………………………238
6.7近似推理算法…………………………………………………………240
6.7.1採樣法…………………………………………………………241
6.7.2變分法…………………………………………………………246
6.7.3採樣法和變分法比較…………………………………………250
6.8本章小結………………………………………………………………250
6.9相關資源………………………………………………………………251

第7章無監督學習…………………………………………………………252
7.1無監督學習任務………………………………………………………253
7.1.1聚類概述………………………………………………………253
7.1.2流形學習概述…………………………………………………254
7.1.3因子學習………………………………………………………255
7.2聚類方法………………………………………………………………256
7.2.1基於劃分的聚類方法…………………………………………256
7.2.2基於連接的聚類方法…………………………………………258
7.2.3基於密度的聚類方法…………………………………………262
7.2.4基於模型的聚類方法…………………………………………263
7.3流形學習………………………………………………………………264
7.3.1主成分分析……………………………………………………266
7.3.2多維標度………………………………………………………268
7.3.4自組織映射……………………………………………………271
7.3.5局部線性嵌入…………………………………………………273
7.3.6譜嵌入…………………………………………………………276
7.3.7t-SNE…………………………………………………………276
7.3.8流形學習方法比較……………………………………………279
7.4圖模型與無監督學習…………………………………………………279
7.4.1圖模型下的聚類任務…………………………………………279
7.4.2圖模型下的流形學習…………………………………………280
7.4.3圖模型下的因子學習…………………………………………281
7.5神經模型與無監督學習………………………………………………282
7.5.1特徵學習任務中的因子學習…………………………………282
7.52生成任務中的因子學習………………………………………283
7.5.3分類/回歸任務中的因子學習………………………………283
7.6本章小結………………………………………………………………285
7.7相關資源………………………………………………………………286

第8章非參數模型…………………………………………………………287
8.1簡單非參數模型………………………………………………………288
8.2回顧高斯過程…………………………………………………………290
8.2.1高斯過程定義…………………………………………………290
8.2.2高斯過程回歸…………………………………………………292
8.2.3高斯過程用於分類任務………………………………………296
8.3狄利克雷過程…………………………………………………………296
8.3.1回顧高斯混合模型……………………………………………297
8.3.2中國餐館問題…………………………………………………298
8.3.3狄利克雷分佈及性質…………………………………………300
8.3.4狄利克雷過程的定義…………………………………………302
8.3.5狄利克雷過程的表示…………………………………………303
8.3.6狄利克雷過程的構造…………………………………………307
8.3.7推理方法………………………………………………………309
8.3.8HierarchicalDP(HDP)………………………………………311
8.4本章小結………………………………………………………………312
8.5相關資源………………………………………………………………313

第9章演化學習……………………………………………………………315
9.1基於採樣的優化方法…………………………………………………316
9.1.1演化學習………………………………………………………316
9.1.2群體學習與隨機優化…………………………………………317
9.2遺傳算法………………………………………………………………318
9.2.1算法框架………………………………………………………319
9.2.2算法細節………………………………………………………320
9.2.3進化理論………………………………………………………324
9.3遺傳編程………………………………………………………………328
9.3.1算法基礎………………………………………………………328
9.3.2GP高級話題…………………………………………………333
9.3.3其他演化學習方法……………………………………………335
9.4群體學習方法…………………………………………………………336
9.4.1蟻群優化算法…………………………………………………337
9.4.2人工蜂群算法…………………………………………………338
9.4.3粒子群算法……………………………………………………340
9.4.4捕獵者搜索……………………………………………………341
9.4.5螢火蟲算法……………………………………………………342
9.5隨機優化方法…………………………………………………………342
9.5.1模擬退火算法…………………………………………………342
9.5.2杜鵑搜索………………………………………………………343
9.5.3和聲搜索………………………………………………………344
9.5.4禁忌搜索………………………………………………………344
9.6本章小節………………………………………………………………345
9.7相關資源………………………………………………………………347

第10章強化學習……………………………………………………………348
10.1強化學習概述…………………………………………………………349
10.1.1什麽是強化學習……………………………………………349
10.1.2與其他學習方法的區別……………………………………350
10.1.3強化學習的應用……………………………………………3
10.2強化學習的基本要素…………………………………………………353
10.2.1強化學習三元素……………………………………………353
10.2.2長期收益……………………………………………………353
10.2.3值函數與策略優化…………………………………………354
10.2.4通用策略迭代………………………………………………355
10.2.5強化學習算法分類…………………………………………356
10.3值函數學習:基於模型的規劃算法…………………………………358
10.3.1馬爾可夫決策過程…………………………………………358
10.3.2MDP中的值函數……………………………………………360
10.3.3策略估值:動態規劃算法……………………………………361
10.3.4策略優化:策略迭代和值迭代………………………………362
10.4值函數學習:基於採樣的蒙特卡羅方法……………………………365
10.4.1學習任務與採樣方法………………………………………365
10.4.2蒙特卡羅策略估值…………………………………………365
10.4.3蒙特卡羅策略優化…………………………………………367
10.5值函數學習:基於採樣的時序差分方法……………………………370
10.5.1基於TD的策略估值………………………………………370
10.5.2基於TD的策略優化………………………………………372
10.5.3N-stepTD與TD(λ)………………………………………374
10.5.4三種值函數學習方法總結…………………………………375
10.6模型學習………………………………………………………………377
10.6.1值函數學習與模型學習……………………………………377
10.6.2模型學習方法………………………………………………378
10.6.3Dyna:混合學習方法………………………………………379
10.7函數近似與策略學習…………………………………………………380
10.7.1值函數近似…………………………………………………381
10.7.2基於梯度的參數優化………………………………………383
10.7.3基於函數近似的策略學習…………………………………383
10.7.4Actor-Critic方法……………………………………………385
10.8深度強化學習方法……………………………………………………386
10.8.1Atari游戲……………………………………………………387
10.8.2AlphaGo……………………………………………………388
10.9本章小結………………………………………………………………391
10.10相關資源……………………………………………………………391

第11章優化方法……………………………………………………………393
11.1函數優化………………………………………………………………394
11.1.1優化問題定義………………………………………………394
11.1.2優化問題分類………………………………………………395
11.1.3基礎定理……………………………………………………395
11.2無約束優化問題………………………………………………………396
11.2.1線性搜索……………………………………………………396
11.2.2置信域優化…………………………………………………401
11.3帶約束優化問題………………………………………………………404
11.3.1拉格朗日乘子法……………………………………………405
11.3.2對偶問題……………………………………………………407
11.3.3線性規劃……………………………………………………409
11.3.4二階規劃……………………………………………………415
11.3.5一般非線性優化……………………………………………420
11.4本章小結………………………………………………………………425
11.5相關資源………………………………………………………………426
參考文獻…………………………………………………………………………427