深度學習精粹與 PyTorch 實踐 Inside Deep Learning: Math, Algorithms, Models

[美] 愛德華·拉夫（Edward Raff）著郭濤譯

預覽內頁

出版商: 清華大學
出版日期: 2024-08-01
售價: $1,368
貴賓價: 9.5 折 $1,299
語言: 簡體中文
頁數: 516
ISBN: 7302669112
ISBN-13: 9787302669111
相關分類: DeepLearning
此書翻譯自: Inside Deep Learning: Math, Algorithms, Models (Paperback)

立即出貨

買這商品的人也買了...

~~$420~~ $327

PyTorch 深度學習與自然語言中文處理
~~$474~~ $450

統計強化學習：現代機器學習方法 (Statistical Reinforcement Learning: Modern Machine Learning Approaches)
~~$594~~ $564

深度強化學習：學術前沿與實戰應用
$714

Python 金融大數據風控建模實戰：基於機器學習
$453

智能風控：Python 金融風險管理與評分卡建模
$448

金融科技人工智能實戰(以Python為工具)
$351

機器學習在量化金融中的應用
$453

智能風控與反欺詐：體系、算法與實踐
$378

金融信用評估 — 大數據背景下的統計學與機器學習應用
~~$534~~ $507

智能風控：評分卡建模原理、方法與風控策略構建
~~$534~~ $507

Python 金融量化分析
$611

Python 圖像處理經典實例
$400

Python 金融風控策略實踐
~~$720~~ $360

ChatGPT X Keras X PyTorch 全方位應用實踐指南：從零開始的 AI 程式設計養成之路
$657

機器學習與因子投資 — 從基礎到實踐
~~$980~~ $774

新範式來臨 - 用 PyTorch 了解 LLM 開發微調 ChatGLM 全過程
$708

強化學習與最優控制
~~$300~~ $270

機器學習入門 ─ Weka
~~$650~~ $507

LLM 大型語言模型的絕世祕笈：27路獨步劍法，帶你闖蕩生成式 AI 的五湖四海（iThome鐵人賽系列書）
$504

動手學 PyTorch 建模與應用：從深度學習到大模型
~~$690~~ $545

輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可
$708

算法設計與分析基礎, 3/e (詳解版)
~~$880~~ $695

全格局使用 PyTorch - 深度學習和圖神經網路 - 基礎篇, 2/e
$402

優化理論與算法基礎
$445

個人化機器學習

簡體書拿來曬2本75折詳見活動內容 »

VIP 95折
~~$534~~ $507

編譯原理, 2/e (Compilers : Principles, Techniques, and Tools, 2/e)
VIP 95折
~~$594~~ $564

深度學習之 TensorFlow：入門、原理與進階實戰
85折
$402

Essential C++ (簡體中文版)
VIP 95折
~~$774~~ $735

TCP/IP 詳解 (捲1)：協議 (TCP/IP Illustrated, Volume 1 : The Protocols, 2/e)
85折
$402

Go 並發編程實戰, 2/e
VIP 95折
~~$474~~ $450

機器人學導論, 4/e (Introduction to Robotics: Mechanics and Control, 4/e)
85折
$402

深入淺出 Vue.js
85折
$351

實用機器學習 (Real-world Machine Learning)
85折
$504

深度探索 C++ 對像模型 (Inside the C++ Object Model)
85折
$300

區塊鏈項目開發指南
85折
$402

原子教你玩 STM32 (庫函數版第2版)
85折
$402

Spring Security 實戰
85折
$611

嵌入式 Linux 基礎教程, 2/e (Embedded Linux Primer: A Practical Real-World Approach, 2/e)
85折
$504

MySQL 技術內幕－InnoDB 存儲引擎, 2/e
85折
$448

PADS 9.5 實戰攻略與高速 PCB 設計
85折
$244

基於 Bootstrap 和 Knockout.js 的 ASP.NET MVC 開發實戰 (ASP.Net MVC 5 with Bootstrap and Knockout.Js: Building Dynamic, Responsive Web Applications)
85折
$265

深入淺出 USB 系統開發 : 基於 ARM Cortex-M3
85折
$402

Redis 設計與實現
VIP 95折
~~$354~~ $336

FPGA 原理和結構
VIP 95折
~~$474~~ $450

TCP/IP 網絡編程
75折
$445

數據分析與機器學習(基於R語言)
85折
$652

深度學習推薦系統 2.0
75折
$400

移動通信系統架構設計
VIP 95折
~~$528~~ $501

自動駕駛汽車 BEV 感知算法
50折
$207

區塊鏈技術進階與實戰

商品描述

"深度學習絕非不可窺探的黑箱!深入理解其模型和算法的實際運作機制，是駕馭並優化結果的關鍵。你無需成為數學專家或資深數據科學家,同樣能夠掌握深度學習系統內部的工作原理。本書旨在通過深入淺出的方式，為你揭示這些原理，讓你在理解和解釋自己的工作時更加自信與從容。《深度學習精粹與PyTorch實踐》以淺顯易懂的方式揭示了深度學習算法的內部運作機制，即使是機器學習初學者也能輕松理解。本書通過平實的語言解析、詳盡的代碼註釋,以及數十個基於PyTorch框架的實戰示例，逐步引導你探索深度學習的核心概念與實用工具。本書避免了復雜的數學公式堆砌，而是採用直觀易懂的方式闡述每種神經網絡類型的運作邏輯。更令人興奮的是，書中提供的所有解決方案均可在現有的GPU硬件上順暢運行! 主要內容 ●　選擇正確的深度學習組件 ●　訓練和評估深度學習模型 ●　微調深度學習模型以實現性能**化瞭解深度學習術語"

作者簡介

愛德華·拉夫（Edward Raff）博士是Booz Allen Hamilton公司的首席科學家，也是戰略創新集團機器學習研究團隊的共同負責人。他的工作涉及監督內部研究、招聘和培養技術人才、與高校合作夥伴合作以及專門從事高端機器學習的業務開發。Raff博士還協助幾位客戶開展高級研究。

目錄大綱

目　錄

第1章　學習的機制 3

1.1　Colab入門 7

1.2　張量 7

1.3　自動微分 15

1.3.1　使用導數將損失降至最低 17

1.3.2　使用自動微分計算導數 18

1.3.3　知識整合：使用導數最小化函數 19

1.4　優化參數 21

1.5　加載數據集對象 23

1.6　練習 26

1.7　小結 27

第2章　全連接網絡 29

2.1　優化神經網絡 30

2.1.1　訓練神經網絡的符號 30

2.1.2　建立線性回歸模型 32

2.1.3　訓練循環 32

2.1.4　定義數據集 34

2.1.5　定義模型 36

2.1.6　定義損失函數 37

2.1.7　知識整合：在數據上訓練線性回歸模型 38

2.2　構建第一個神經網絡 40

2.2.1　全連接網絡的符號 40

2.2.2　PyTorch中的全連接網絡 41

2.2.3 　增加非線性 43

2.3　分類問題 46

2.3.1　分類簡單問題 46

2.3.2　分類損失函數 48

2.3.3　訓練分類網絡 51

2.4　更好地訓練代碼 53

2.4.1　自定義指標 53

2.4.2　訓練和測試階段 54

2.4.3　保存檢查點 55

2.4.4　知識整合：更好的模型訓練函數 56

2.5　批量訓練 61

2.6　練習 64

2.7　小結 65

第3章　捲積神經網絡 67

3.1　空間結構先驗信念 68

3.2　什麼是捲積 74

3.2.1　一維捲積 75

3.2.2　二維捲積 76

3.2.3　填充 77

3.2.4　權重共享 78

3.3　捲積如何有益於圖像處理 79

3.4　付諸實踐：我們的第一個CNN 82

3.4.1　使用多個過濾器生成捲積層 83

3.4.2　每層使用多個過濾器 84

3.4.3　通過展平將捲積層與線性層混合 84

3.4.4　第一個CNN的PyTorch代碼 86

3.5　添加池化以減少對象移動 88

3.6　數據增強 93

3.7　練習 97

3.8　小結 97

第4章　循環神經網絡 99

4.1　作為權重共享的循環神經網絡 100

4.1.1　全連接網絡的權重共享 101

4.1.2　隨時間共享權重 105

4.2　在PyTorch中實現RNN 107

4.2.1　一個簡單的序列分類問題 108

4.2.2　嵌入層 112

4.2.3　使用最後一個時間步長進行預測 114

4.3　通過打包減短訓練時間 119

4.3.1　填充和打包 120

4.3.2　可打包嵌入層 122

4.3.3　訓練批量RNN 122

4.3.4　同時打包和解包輸入 124

4.4　更為復雜的RNN 125

4.4.1　多層 126

4.4.2　雙向RNN 127

4.5　練習 129

4.6　小結 130

第5章　現代訓練技術 131

5.1　梯度下降分兩部分進行 132

5.1.1　添加學習率調度器 133

5.1.2　添加優化器 134

5.1.3　實現優化器和調度器 135

5.2　學習率調度器 139

5.2.1　指數衰減：平滑不穩定訓練 140

5.2.2　步長下降調整：更平滑 143

5.2.3　餘弦退火：準確率更高但穩定性較差 144

5.2.4　驗證平臺：基於數據的調整 147

5.2.5　比較調度器 151

5.3　更好地利用梯度 152

5.3.1　SGD與動量：適應梯度一致性 153

5.3.2　Adam：增加動量變化 159

5.3.3　梯度修剪：避免梯度爆炸 162

5.4　使用Optuna進行超參數優化 164

5.4.1　Optuna 164

5.4.2　使用PyTorch的Optuna 167

5.4.3　使用Optuna修剪試驗 171

5.5　練習 173

5.6　小結 174

第6章　通用設計構建塊 175

6.1　更好的激活函數 179

6.1.1　梯度消失 179

6.1.2　校正線性單位(ReLU)：避免梯度消失 181

6.1.3　使用LeakyReLU激活訓練 184

6.2　歸一化層：神奇地促進收斂 186

6.2.1　歸一化層用於何處 187

6.2.2　批量歸一化 188

6.2.3　使用批量歸一化進行訓練 190

6.2.4　層歸一化 192

6.2.5　使用層歸一化進行訓練 192

6.2.6　使用哪個歸一化層 195

6.2.7　層歸一化的特點 195

6.3　跳躍連接：網絡設計模式 198

6.3.1　實施全連接的跳躍 200

6.3.2　實現捲積跳躍 203

6.4　1×1捲積：在通道中共享和重塑信息 206

6.5　殘差連接 208

6.5.1　殘差塊 208

6.5.2　實現殘差塊 210

6.5.3　殘差瓶頸 210

6.5.4　實現殘差瓶頸 212

6.6　長短期記憶網絡RNN 214

6.6.1　RNN：快速回顧 214

6.6.2　LSTM和門控機制 215

6.6.3　LSTM訓練 217

6.7　練習 220

6.8　小結 220

第Ⅱ部分　構建高級網絡

第7章　自動編碼和自監督 225

7.1　自動編碼的工作原理 227

7.1.1　主成分分析是自動編碼器的瓶頸 228

7.1.2　實現PCA 229

7.1.3　使用PyTorch實現PCA 232

7.1.4　可視化PCA結果 233

7.1.5　簡單的非線性PCA 235

7.2　設計自動編碼神經網絡 238

7.2.1　實現自動編碼器 239

7.2.2　可視化自動編碼器結果 240

7.3　更大的自動編碼器 242

7.4　自動編碼器去噪 247

7.5　時間序列和序列的自回歸模型 252

7.5.1　實現char-RNN自回歸文本模型 254

7.5.2　自回歸模型是生成模型 261

7.5.3　隨著溫度調整採樣 263

7.5.4　更快地採樣 266

7.6　練習 268

7.7　小結 269

第8章　目標檢測 271

8.1　圖像分割 272

8.1.1　核檢測：加載數據 273

8.1.2　在PyTorch中表示圖像分割問題 275

8.1.3　建立第一個圖像分割網絡 277

8.2　用於擴展圖像大小的轉置捲積 279

8.3　U-Net：查看精細和粗糙的細節 284

8.4　帶邊界框的目標檢測 289

8.4.1　Faster R-CNN 290

8.4.2　在PyTorch中實現Faster R-CNN 295

8.4.3　抑制重疊框 303

8.5　使用預訓練的Faster R-CNN 305

8.6　練習 307

8.7　小結 308

第9章　生成對抗網絡 309

9.1　理解生成對抗網絡 310

9.1.1　損失計算 312

9.1.2　GAN博弈 314

9.1.3　實現第一個GAN 316

9.2　模式崩潰 324

9.3　Wasserstein GAN：緩解模式崩潰 327

9.3.1　WGAN判別器損失 327

9.3.2　WGAN生成器損失 328

9.3.3　實現WGAN 329

9.4　捲積GAN 334

9.4.1　設計捲積生成器 334

9.4.2　設計捲積判別器 336

9.5　條件GAN 339

9.5.1　實現條件GAN 340

9.5.2　訓練條件GAN 341

9.5.3　使用條件GAN控制生成 342

9.6　GAN潛在空間概覽 343

9.6.1　從Hub獲取模型 343

9.6.2　對GAN輸出進行插值 344

9.6.3　標記潛在維度 346

9.7　深度學習中的倫理問題 349

9.8　練習 350

9.9　小結 351

第10章　註意力機制 353

10.1　註意力機制學習相對輸入重要性 354

10.1.1　訓練基線模型 355

10.1.2　註意力機制 357

10.1.3　實現簡單的註意力機制 359

10.2　添加上下文 363

10.2.1　點分數 365

10.2.2　總分數 366

10.2.3　附加註意力 367

10.2.4　計算註意力權重 369

10.3　知識整合：一種有上下文的完整註意力機制 371

10.4　練習 375

10.5　小結 376

第11章　序列到序列 377

11.1　序列到序列作為一種去噪自動編碼器 378

11.2　機器翻譯和數據加載器 380

11.3　序列到序列的輸入 385

11.3.1　自回歸法 386

11.3.2　教師強製法 386

11.3.3　教師強製法與自回歸法的比較 387

11.4　序列到序列註意力 387

11.4.1　實現序列到序列 389

11.4.2　訓練和評估 394

11.5　練習 400

11.6　小結 400

第12章　RNN的網絡設計替代方案 401

12.1　TorchText：處理文本問題的工具 402

12.1.1　安裝TorchText 402

12.1.2　在TorchText中加載數據集 402

12.1.3　定義基線模型 405

12.2　隨時間平均嵌入 406

12.3　隨時間池化和一維CNN 413

12.4　位置嵌入為任何模型添加序列信息 417

12.4.1　實現位置編碼模塊 421

12.4.2　定義位置編碼模型 422

12.5　Transformer：大數據的大模型 425

12.5.1　多頭註意力 425

12.5.2　transformer模塊 430

12.6　練習 433

12.7　小結 434

第13章　遷移學習 435

13.1　遷移模型參數 436

13.2　遷移學習和使用CNN進行訓練 440

13.2.1　調整預訓練網絡 442

13.2.2　預處理預訓練的ResNet 446

13.2.3　熱啟動訓練 447

13.2.4　使用凍結權重進行訓練 449

13.3　用較少的標簽學習 451

13.4　文本預訓練 454

13.4.1　帶有Hugging Face庫的transformer 455

13.4.2　無梯度的凍結權重 457

13.5　練習 459

13.6　小結 460

第14章　高級構件 461

14.1　池化問題 462

14.1.1　鋸齒損害了平移不變性 464

14.1.2　通過模糊實現抗鋸齒 469

14.1.3　應用抗鋸齒池化 473

14.2　改進後的殘差塊 476

14.2.1　有效深度 477

14.2.2　實現ReZero 478

14.3　混合訓練減少過擬合 481

14.3.1　選擇混合率 483

14.3.2　實現MixUp 484

14.4　練習 489

14.5 　小結 489

附錄A　設置Colab 491

深度學習精粹與 PyTorch 實踐 Inside Deep Learning: Math, Algorithms, Models

[美] 愛德華·拉夫（Edward Raff）著郭濤譯

買這商品的人也買了...

簡體書拿來曬2本75折詳見活動內容 »

相關主題

商品描述

作者簡介

目錄大綱

類似商品

深度學習精粹與 PyTorch 實踐 Inside Deep Learning: Math, Algorithms, Models

[美] 愛德華·拉夫（Edward Raff）著 郭濤 譯

買這商品的人也買了...

簡體書拿來曬2本75折 詳見活動內容 »

相關主題

商品描述

作者簡介

目錄大綱

類似商品

[美] 愛德華·拉夫（Edward Raff）著郭濤譯

簡體書拿來曬2本75折詳見活動內容 »