現代深度學習教程
焦李成 趙嘉璇 李玲玲 劉旭 祖巖巖 劉芳 馬文萍 陳璞花
- 出版商: 人民郵電
- 出版日期: 2026-01-01
- 定價: $539
- 售價: $538
- 語言: 簡體中文
- 頁數: 387
- ISBN: 711569186X
- ISBN-13: 9787115691866
-
相關分類:
DeepLearning
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書旨在提供從理論基礎到前沿探索的系統學習框架。全書共11章,兼具通識性與學術深度:第1~5章系統講解人工智能歷史、機器學習及神經網絡原理與實踐(如圖像分類、序列標註),夯實學術基礎;第6、7章聚焦Transformer與生成式模型,剖析註意力機制、生成對抗網絡、擴散模型等前沿技術;第8~10章解析GPT、BERT、ChatGPT等大模型,詳解RLHF與提示學習,助力深入研究;第11章展望基礎模型在多模態智能、生物醫學、遙感等領域的跨學科應用,激發創新熱情。本書將案例與實踐(如語義分割、機器翻譯)緊密結合理論與應用,助力讀者將知識轉化為研究能力,是通向人工智能學術與技術前沿的可靠指南。 本書既可用於人工智能、計算機科學與技術、智能科學與技術、電子科學與技術及智能機器人等相關專業學生的實踐教學,也可作為相關專業技術人員的參考指南。
作者簡介
焦李成,歐洲科學院院士,IEEE Fellow。現任西安電子科技大學華山傑出教授、人工智能研究院院長,國家級領軍人才首批入選者、“一帶一路”人工智能創新聯盟理事長,中國人工智能學會第六-七屆副理事長,亞洲計算智能學會主席,IEEE/IET/CAAI/CAA/CIE/CCF/CSIG/AAIA/ACIS/AIIA Fellow,入選多個高被引學者榜單。曾獲國家自然科學獎二等獎、吳文俊人工智能傑出貢獻獎及省部級一等獎以上科技獎勵十余項。
目錄大綱
第 一章 人工智能的前世今生 8
1.1人工智能發展歷程 8
1.2 機器學習及經典算法 10
1.2.1 數據集、樣本及標簽 11
1.2.2 監督學習 14
1.2.3 無監督學習 17
1.2.4 強化學習 20
1.2.5 半監督學習 28
1.2.6 自監督學習 30
1.2.7 遷移學習 38
1.3 深度學習 42
本章小結 44
第二章 神經網絡基礎 46
2.1 神經網絡基本原理 46
2.1.1 生物神經元模型 46
2.1.2 人工神經元 48
2.1.3 感知機 52
2.2 卷積神經網絡基本原理 54
2.2.1 卷積神經網絡構造 54
2.2.2 卷積層 55
2.2.3 非線性激活函數 67
2.2.4 池化 75
2.2.5 全連接層 82
2.2.6 歸一化層 83
2.3 神經網絡優化方法 86
2.3.1 前向傳播與網絡初始化 86
2.3.2 損失函數與代價函數 93
2.3.3 反向傳播 96
2.3.4 隨機梯度下降算法 104
2.3.5 動量梯度下降算法 107
2.3.6 牛頓法 111
2.4 簡單卷積神經網絡實踐 114
本章小結 121
第三章 卷積神經網絡進階 122
3.1 經典CNN架構 122
3.1.1 LeNet-5 123
3.1.2 AlexNet與Dropout 125
3.1.3 VGG 131
3.2 新穎CNN架構 133
3.2.1 Network in network(NIN) 134
3.2.2 ResNet 136
3.2.3 Inception 140
3.2.4 DenseNet 143
3.2.5 MobileNet 146
3.2.6 EfficientNet 148
3.2.7 ConvNext 150
3.3 新型卷積 152
3.3.1 空洞卷積 153
3.3.2 可行變卷積 155
3.3.3 深度可分離卷積 158
3.3.4 MBConv 161
3.3.5 反卷積 163
3.3.6 可逆卷積 164
3.4 分類案例與實踐 166
3.4.1 分類常用數據集 168
3.4.2 分類任務的評價指標 173
3.4.3 基於ResNet34的分類 180
3.5 語義分割案例與實踐 184
3.5.1 語義分割常用數據集 187
3.5.2 語義分割任務的評價指標 191
3.5.3 FCN網絡 195
3.5.4 U-net網絡 202
3.5.5 DeepLabV3 205
3.6 目標檢測案例與實踐 208
3.6.1 目標檢測常用數據集 211
3.6.2 常用指標 213
3.6.3 Faster R-CNN 217
3.6.4 Yolo 223
本章小結 226
第四章 循環神經網絡 228
4.1循環神經網絡的結構和原理 228
4.2 長短時記憶網絡(LSTM) 236
4.3 門控循環單元(GRU) 240
4.4 時序數據處理案例與實踐 243
4.4.1 機器翻譯 244
4.4.2 序列標註 261
4.4.3 GloVe和BERT詞向量編碼器 269
本章小結 272
第五章 圖神經網絡 274
5.1圖神經網絡結構和原理 274
5.1.1 圖結構 274
5.1.2 圖神經網絡的基本結構 278
5.2 經典圖神經網絡基礎模型 281
5.2.1 圖卷積網絡 281
5.2.2 GraphSAGE 285
5.3 圖數據處理案例與實踐 289
本章小結 302
第六章 TRANSFORMER網絡 303
6.1 經典註意力機制 303
6.2 TRANSFORMER基本結構 314
6.3 視覺TRANSFORMER模型 318
6.3.1 Vision Transformer模型 319
6.3.2 Swin Transformer模型 326
6.3.3 DETR 模型 331
6.3.4 SegFormer模型 335
本章小結 338
第七章 生成式學習網絡 339
7.1自編碼器模型 339
7.1.1 傳統自編碼器 340
7.1.2 去噪自編碼器 342
7.1.3 卷積自編碼器 344
7.1.4 變分自編碼器 347
7.2生成對抗模型 352
7.2.1 生成對抗網絡 353
7.2.2 DCGAN網絡 360
7.2.3 CycleGAN模型 362
7.3 擴散模型 367
7.3.1 擴散過程 367
7.3.2 DDPM模型 369
7.3.3 DiT模型 371
本章小結 374
第八章 GPT系列大模型 376
8.1 大規模預訓練模型 376
8.1.1 發展歷程 378
8.1.2 大模型的優勢 380
8.1.3 應用場景 381
8.2 大型預訓練語言模型 383
8.3 GPT系列模型 385
8.3.1 GPT系列介紹 386
8.3.2 數據集及參數量 387
8.3.3 預訓練 388
8.3.4 優勢及局限性 390
8.4 BERT 391
8.4.1 BERT的結構 391
8.4.2 BERT的數據集及參數量 393
8.4.3 BERT的預訓練 393
8.4.4 BERT的微調 394
8.4.5 優勢及局限性 395
8.5 CHATGPT模型 396
8.6 OPENAI-O1系列 396
本章小結 400
第九章 基礎大模型核心技術——基於人類反饋的強化學習 402
9.1 近端策略優化 402
9.1.1 策略梯度 403
9.1.2 信賴域策略優化算法 405
9.1.3 PPO算法 409
9.2 基於人類反饋的強化學習 412
9.3 強化TRANSFORMER 415
本章小結 417
第十章 基礎大模型核心技術——提示學習 418
10.1 提示學習的基本流程 418
10.2 提示學習主要構造 420
10.2.1 預訓練模型的選擇 420
10.2.2 提示工程 420
10.2.3 答案工程 424
10.3 提示學習示例 426
10.3.1 ZeroShot提示學習 427
10.3.2 Few-Shot提示學習 427
10.3.3 COT提示學習 428
10.3.4 自一致性提示學習 430
10.4 提示微調 433
10.5 自我微調 437
本章小結 439
第十一章 基礎模型進階與應用 441
11.1 NLP基礎模型 441
11.1.1 AudioLM大模型 441
11.1.2 PaLM系列大語言模型 443
11.1.3 LLaMA系列大語言模型 446
11.1.4 GLM大語言模型 450
11.1.5 騰訊混元大模型 453
11.1.6 DeepSeek大語言模型 454
11.2 視覺基礎模型 460
11.2.1 ViT-22B視覺大模型 460
11.2.2 SAM分割大模型 464
11.2.3 Painter及SegGPT視覺大模型 469
11.2.4 SEEM分割大模型 472
11.2.5 LVM視覺大模型 477
11.3 多模態基礎模型 479
11.3.1 CLIP多模態大模型 479
11.3.2 GLIP 多模態大模型 481
11.3.3 VisualGPT模型 483
11.3.4 Gemini系列大模型 487
11.3.5 ImageBind 大模型 491
11.3.6 文心大模型 494
11.3.7 “通義千問”大模型 499
11.3.8 訊飛星火認知大模型 503
11.3.9 Sora視頻生成大模型 506
11.4 生物醫學基礎模型 510
11.4.1 AlphaFold模型 511
11.4.2 Geneformer模型 513
11.4.3 Med-PaLM2 模型 514
11.4.4 RadFM模型 516
11.4.5 慧影:醫學影像智慧解譯基礎模型 517
11.5 材料科學基礎模型 521
11.5.1 GNoME模型 521
11.5.2 DARWIN模型 523
11.6 遙感解譯基礎模型 524
11.6.1 悟瞳:遙感大模型理論研究與應用框架 525
11.6.2 RVSA遙感大模型 528
11.6.3 SkyEyeGPT遙感大模型 531
11.6.4 AIE-SEG遙感大模型 534
11.6.5 盤古氣象大模型 537
11.7 具身智能機器人 540
11.7.1 RT系列機器人模型 540
11.7.2 VoxPoser機器人模型 544
本章小結 546

