全解深度學習——九大核心算法

於浩文

  • 出版商: 清華大學
  • 出版日期: 2025-03-01
  • 定價: $474
  • 售價: 8.5$403
  • 語言: 簡體中文
  • ISBN: 730267910X
  • ISBN-13: 9787302679103
  • 相關分類: DeepLearning
  • 下單後立即進貨 (約4週~6週)

  • 全解深度學習——九大核心算法-preview-1
  • 全解深度學習——九大核心算法-preview-2
  • 全解深度學習——九大核心算法-preview-3
全解深度學習——九大核心算法-preview-1

商品描述

"本書專註於介紹基於深度學習的算法。從探索深度學習的數學基礎和理論架構,到九大經典的深度學習算法,旨在為讀者提供一個從基礎到高級的全方位指導。截至2024年,書中介紹的9個算法幾乎涵蓋了整個深度學習領域的經典和前沿算法。 本書在第1章和第2章介紹了深度學習的基礎:數學基礎與神經網絡算法。從第3章開始,書籍逐步引領讀者進入深度學習的核心領域,即一些基於神經網絡的變體算法:捲積神經網絡、循環神經網絡、編碼器-解碼器模型,以及目前火熱的變形金剛算法、生成對抗網絡和擴散模型。這些章節不僅講解了各個模型的基礎理論和關鍵技術,還詳細介紹了這些模型在自然語言處理、電腦視覺等領域的應用案例。書籍的後半部分聚焦於圖神經網絡和強化學習這些前沿算法,深入淺出地講解了它們的基礎知識、算法變體及經典模型等高級話題。這些內容為讀者理解和應用深度學習技術提供了堅實的理論基礎。 本書適合對深度學習領域感興趣的本科生、研究生及相關行業的從業者閱讀。本書旨在幫助讀者掌握深度學習的核心技術,激發創新思維,推動個人和行業的發展。 "

目錄大綱

 

 

 

配套資源

 

 

 

第1章深度學習數學基礎

 

1.1高等數學之微積分

 

1.1.1重識微分

 

1.1.2微分的解讀

 

1.1.3微分與函數的單調性和凹凸性

 

1.1.4微分的鏈式法則

 

1.1.5偏微分與全微分

 

1.1.6梯度與方向導數

 

1.1.7泰勒公式與麥克勞林公式

 

1.1.8拉格朗日乘子法

 

1.1.9重識積分

 

1.1.10不定積分和反導數

 

1.1.11定積分與牛頓萊布尼茨公式

 

1.1.12微積分的基本定理

 

1.2線性代數

 

1.2.1線性方程組

 

1.2.2線性方程組的矩陣求解法

 

1.2.3矩陣乘法

 

1.2.4向量的數乘

 

1.2.5向量的加法

 

1.2.6向量的線性組合

 

1.2.7向量空間

 

1.2.8向量的線性相關和線性無關

 

1.2.9向量乘法

 

1.2.10向量的正交

 

1.2.11向量與矩陣

 

1.2.12特徵值和特徵向量

 

1.3概率論

 

1.3.1頻數

 

1.3.2數據位置

 

1.3.3數據散佈

 

1.3.4隨機變量的類型和概率分佈

 

1.3.5理論概率分佈之常見的離散型分佈

 

1.3.6理論概率分佈之常見的連續型分佈

 

1.3.7經驗概率分佈

 

1.4統計學

 

1.4.1大數定律與中心極限定理

 

1.4.2參數估計

 

1.4.3統計量和抽樣分佈

 

1.4.4假設檢驗

 

1.4.5相關性分析

 

第2章神經網絡理論基礎

 

2.1線性模型

 

2.1.1線性模型的定義

 

2.1.2損失函數

 

2.1.3梯度下降算法

 

2.1.4廣義線性模型

 

2.2回歸與分類

 

2.2.1回歸和分類問題的定義與聯系

 

2.2.2線性模型解決回歸和分類問題

 

2.3感知機模型

 

2.3.1感知機模型定義與理解

 

2.3.2神經網絡算法與深度學習模型

 

2.3.3反向傳播算法

 

2.4激活函數

 

2.4.1激活函數的定義與作用

 

2.4.2常用激活函數

 

2.5維度詛咒

 

2.5.1神經網絡的層級結構

 

2.5.2維度詛咒與過擬合

 

2.6過擬合與欠擬合

 

2.6.1過擬合和欠擬合現象的定義

 

2.6.2過擬合和欠擬合現象的產生原因

 

2.7正則

 

2.7.1L1和L2正則

 

2.7.2DropOut

 

2.8數據增強

 

2.9數值不穩定性

 

第3章捲積神經網絡

 

3.1捲積神經網絡基礎

 

3.1.1捲積神經網絡的計算

 

3.1.2捲積的設計思想

 

3.1.3捲積進行特徵提取的過程

 

3.1.4池化與採樣

 

3.1.5捲積神經網絡的感受野

 

3.1.6捲積模型實現圖像識別

 

3.1.7第1個捲積神經網絡模型: LeNet

 

3.2捲積的變體算法

 

3.2.1逐通道捲積

 

3.2.2逐點捲積

 

3.2.3深度可分離捲積

 

3.2.4組捲積

 

3.2.5空間可分離捲積

 

3.2.6空洞捲積

 

3.2.7轉置捲積

 

3.2.8稀疏捲積

 

3.2.9多維捲積

 

第4章循環神經網絡

 

4.1循環神經網絡基礎

 

4.1.1序列數據

 

4.1.2RNN模型

 

4.1.3語言模型

 

4.1.4文本預處理

 

4.1.5建模和預測

 

 

4.2循環神經網絡的變體模型

 

4.2.1門控循環單元

 

4.2.2長短期記憶網絡

 

4.2.3深度循環神經網絡

 

4.2.4雙向循環神經網絡

 

4.2.5基於註意力的循環神經網絡

 

第5章編碼器解碼器模型

 

5.1編碼器解碼器模型基礎

 

5.1.1編碼器解碼器模型的基本結構

 

5.1.2編碼器解碼器模型在自然語音處理領域的應用

 

5.1.3編碼器解碼器模型在電腦視覺領域的應用

 

5.1.4自編碼器模型

 

5.2CV中的編碼器解碼器: VAE模型

 

5.2.1VAE模型簡明指導

 

5.2.2潛空間

 

5.2.3最大似然估計

 

5.2.4隱變量模型

 

5.2.5蒙特卡洛採樣

 

5.2.6變分推斷

 

5.3NLP中的編碼器解碼器: Seq2Seq模型

 

5.3.1Seq2Seq編碼器

 

5.3.2Seq2Seq解碼器

 

5.3.3Seq2Seq的Attention機制

 

5.3.4Seq2Seq的Teacher Forcing策略

 

5.3.5Seq2Seq評價指標BLEU

 

5.3.6Seq2Seq模型小結

 

第6章變形金剛算法

 

6.1算法基礎

 

6.1.1算法概況

 

6.1.2自註意力層

 

6.1.3多頭自註意力層

 

6.1.4編碼器結構

 

6.1.5解碼器結構

 

6.1.6線性頂層和Softmax層

 

6.1.7輸入數據的向量化

 

 

6.2NLP中的Transformer模型

 

6.2.1BERT

 

6.2.2GPT

 

6.3CV中的Transformer模型

 

6.3.1Vision Transformer

 

6.3.2Swin Transformer

 

6.4Transformer小結

 

第7章生成對抗網絡

 

7.1生成對抗網絡基礎

 

7.1.1GAN的模型結構

 

7.1.2GAN模型的訓練

 

7.2改進的GAN

 

7.2.1模式崩潰

 

7.2.2模式崩潰的解決方法

 

7.3fGAN

 

7.3.1GAN模型損失與散度

 

7.3.2GAN損失的通用框架f散度

 

7.4WGAN

 

7.4.1傳統的GAN模型梯度消失的分析

 

7.4.2Wasserstein距離

 

7.4.3由Wasserstein距離推導WGAN的損失

 

7.4.4使用梯度懲罰

 

7.5CycleGAN

 

7.5.1循環一致性

 

7.5.2對抗訓練

 

7.5.3損失函數

 

7.5.4訓練流程

 

7.5.5小結

 

第8章擴散模型

 

8.1擴散模型基礎

 

8.1.1擴散模型的基本原理

 

8.1.2DDPM擴散模型與變分自編碼器的比較

 

8.2去噪擴散概率模型(DDPM) 

 

8.2.1DDPM前向擴散簡明指導

 

8.2.2DDPM反向去噪過程

 

 

8.2.3DDPM擴散模型的損失函數

 

8.2.4DDPM擴散模型的使用

 

第9章圖神經網絡

 

9.1圖神經網絡算法基礎

 

9.1.1圖的表示

 

9.1.2圖數據的任務類型

 

9.1.3圖數據的嵌入

 

9.2圖神經網絡模型

 

9.2.1消息傳遞神經網絡

 

9.2.2圖神經網絡的層結構與連接性

 

9.2.3圖神經網絡模型的訓練

 

9.3圖神經網絡算法基礎的變體

 

9.3.1GCN

 

9.3.2GraphSAGE

 

9.3.3GAT

 

第10章強化學習

 

10.1強化學習基礎概念

 

10.1.1概述

 

10.1.2強化學習基本概念

 

10.1.3理解強化學習中的隨機性

 

10.2基於價值的深度強化學習(DQN)

 

10.2.1DQN介紹

 

10.2.2貝爾曼方程與時序差分學習

 

10.2.3訓練神經網絡

 

10.2.4估計網絡與目標網絡

 

10.3基於策略的深度強化學習

 

10.3.1算法介紹: 基於策略的強化學習

 

10.3.2策略優化

 

10.3.3對比梯度上升和時序差分

 

10.4演員評論家模型

 

10.4.1算法介紹: 演員評論家模型

 

10.4.2演員評論家模型算法訓練

 

10.4.3演員評論家模型算法的優缺點

 

10.4.4對比生成對抗網絡和演員評論家模型算法