大模型應用開發
鮑亮、李倩
- 出版商: 清華大學
- 出版日期: 2025-09-01
- 售價: $714
- 語言: 簡體中文
- ISBN: 7302700834
- ISBN-13: 9787302700838
-
相關分類:
Large language model
下單後立即進貨 (約4週~6週)
相關主題
商品描述
作者簡介
目錄大綱
目 錄
第1章 大模型基礎 1
1.1 語言模型基礎 1
1.1.1 基於統計方法的語言模型 2
1.1.2 基於循環神經網絡的語言模型 5
1.1.3 基於Transformer架構的語言模型 10
1.2 大模型發展歷史 14
1.2.1 統計語言模型奠基期 14
1.2.2 神經網絡語言模型探索期 15
1.2.3 Transformer架構革命期 15
1.2.4 大模型爆發增長期 15
1.3 大模型的特點 18
1.3.1 大模型的快思慢考 18
1.3.2 大模型的優勢與不足 20
1.4 大模型行業應用場景中的優勢與挑戰 21
1.4.1 教育領域:智能教育的革新與困境 21
1.4.2 醫療領域:精準醫療的希望與隱憂 22
1.4.3 金融領域:智能金融的變革與挑戰 22
1.4.4 電商領域:智能營銷的機遇與難題 23
1.5 本章小結 23
1.6 參考文獻 24
第2章 大模型架構 28
2.1 Encoder-Only架構 28
2.1.1 BERT模型 29
2.1.2 RoBERTa模型 33
2.1.3 ALBERT模型 34
2.1.4 ELECTRA語言模型 34
2.2 Decoder-Only架構 35
2.2.1 GPT系列語言模型 36
2.2.2 LLaMA模型 38
2.2.3 PaLM模型 39
2.3 Encoder-Decoder架構 40
2.3.1 T5模型 41
2.3.2 BART語言模型 43
2.3.3 GLM模型 45
2.3.4 Switch Transformer 46
2.4 編碼器、解碼器、編解碼器架構對比 47
2.5 本章小結 49
2.6 參考文獻 49
第3章 多模態大模型 53
3.1 多模態大模型基礎 53
3.1.1 多模態大模型的定義與特征 54
3.1.2 多模態學習與單模態學習的區別 55
3.1.3 多模態大模型的基本架構 57
3.1.4 多模態對齊與融合技術簡述 61
3.2 多模態大模型的發展歷程 63
3.2.1 特征拼接與淺層交互模型階段 63
3.2.2 融合與對齊階段 64
3.2.3 大規模預訓練階段 64
3.2.4 通用多模態大模型階段 65
3.3 多模態大模型介紹 66
3.3.1 CLIP 66
3.3.2 ALIGN 67
3.3.3 Flamingo 68
3.3.4 PaLI 69
3.3.5 BLIP2 70
3.3.6 LLaVA 71
3.3.7 VisCPM 72
3.3.8 ChatGPT-4V和GPT-4o 73
3.3.9 Qwen-VL和Qwen-VL-Max 74
3.3.10 Gemini+2.5 75
3.4 多模態大模型的應用場景 76
3.4.1 智能問答與對話系統 76
3.4.2 智能推薦與搜索 76
3.4.3 醫療影像與輔助診斷 77
3.4.4 內容生成與編輯 77
3.5 本章小結 77
3.6 參考文獻 77
第4章 提示詞工程 81
4.1 技術介紹 81
4.1.1 提示詞工程的概念和作用 81
4.1.2 提示詞應用示例 83
4.2 研究進展 85
4.2.1 零樣本提示 86
4.2.2 少樣本提示——以例示教的智慧 89
4.2.3 思維鏈提示 91
4.2.4 思維樹——多路徑探索的高級推理 93
4.2.5 檢索增強生成——知識外掛的智能問答 95
4.2.6 ReAct框架——推理與行動的協同範式 98
4.3 框架對比 101
4.3.1 開源框架 101
4.3.2 商用框架 105
4.3.3 框架對比全景表 106
4.3.4 小結與展望 106
4.4 本章小結 107
4.5 參考文獻 107
第5章 大模型微調 109
5.1 大模型微調基礎 109
5.1.1 微調定義 109
5.1.2 微調分類 110
5.1.3 微調技術歷史沿革 111
5.2 微調流程 113
5.2.1 數據集準備 114
5.2.2 模型初始化 114
5.2.3 訓練環境配置 114
5.2.4 模型微調 115
5.2.5 評估驗證 115
5.2.6 部署上線 116
5.2.7 監控維護 116
5.3 微調的主流平臺和框架 116
5.3.1 Hugging Face Transformers 116
5.3.2 LLaMA-Factory 117
5.3.3 Unsloth 118
5.3.4 MS-SWIFT 119
5.3.5 百度千帆平臺 120
5.3.6 阿裏雲PAI 121
5.3.7 訊飛星辰 122
5.3.8 對比分析 123
5.4 本章小結 126
5.5 參考文獻 126
第6章 檢索增強生成 129
6.1 概念與內涵剖析 129
6.1.1 RAG定義 130
6.1.2 關鍵組件與工作原理 130
6.1.3 與傳統生成模型的區別與優勢 132
6.1.4 應用領域與實際案例 133
6.2 技術演進與研究進展 134
6.3 相關商用與開源框架對比 140
6.3.1 LangFlow 141
6.3.2 LlamaIndex 142
6.3.3 Haystack 144
6.3.4 LangChain 145
6.3.5 Amazon Kendra 146
6.3.6 Google Cloud Search 148
6.3.7 框架優缺點對比 149
6.3.8 RAG框架總結 150
6.4 本章小結 150
6.5 參考文獻 152
第7章 AI智能體 155
7.1 AI智能體的概念與內涵 156
7.1.1 AI智能體時代的開啟 156
7.1.2 AI智能體的核心概念與特征 158
7.2 AI智能體核心技術與發展 161
7.2.1 智能體的構建:核心模塊與基本架構 162
7.2.2 單智能體系統研究進展 167
7.2.3 多智能體系統研究進展 170
7.2.4 智能體的演進:自主優化與自我學習 175
7.3 智能體構建與實踐 180
7.3.1 智能體構建框架的必要性與分類 180
7.3.2 LangGraph:基於圖結構的Agent編排框架 181
7.3.3 AutoGen:多智能體協作的利器 183
7.3.4 CrewAI:通過協作提升團隊效率 184
7.3.5 Dify:LLM應用一站式開發平臺 185
7.3.6 n8n:強大的工作流自動化與集成工具 186
7.3.7 扣子:一站式AI Agent/Bot開發平臺 188
7.3.8 框架對比 189
7.4 本章小結 192
7.5 參考文獻 192
第8章 大模型應用 195
8.1 大模型應用概念解析 195
8.1.1 大模型應用的定義 195
8.1.2 與傳統應用系統的比較分析 198
8.1.3 大模型應用內涵:基本結構與關鍵組件 201
8.1.4 大模型應用外延與分類視角 204
8.2 大模型應用範式 208
8.2.1 嵌入式 209
8.2.2 協同式 210
8.2.3 自主式 211
8.3 大模型應用開發流程 213
8.3.1 需求理解與問題建模 213
8.3.2 系統架構與模型接口設計 216
8.3.3 智能模塊設計與行為調控 218
8.3.4 測試與質量評估 221
8.3.5 部署上線與模型服務策略 224
8.3.6 監控與運維反饋 227
8.4 大模型應用典型產品 232
8.4.1 智能檢索工具 232
8.4.2 編程輔助與代碼生成 235
8.4.3 文檔處理與寫作輔助 238
8.4.4 多模態內容生成 241
8.5 大模型應用面臨的關鍵挑戰 244
8.5.1 模型能力的不確定性與幻覺問題 244
8.5.2 交互控制與響應可解釋性 246
8.5.3 安全性、合規性與倫理問題 247
8.5.4 應用部署的資源與算力瓶頸 249
8.6 本章小結 251
8.7 參考文獻 252
第9章 大模型應用架構 255
9.1 大模型應用架構概述 255
9.2 大模型應用架構層次 256
9.3 基礎設施層和運行環境層 258
9.3.1 基礎設施層 259
9.3.2 運行環境層 259
9.4 數據層 260
9.4.1 核心組件 260
9.4.2 管理和支撐機制 261
9.5 模型層 261
9.5.1 大模型 262
9.5.2 向量模型 263
9.5.3 重排序模型 265
9.5.4 圖像識別模型 267
9.5.5 語言-語言模型 268
9.5.6 模型微調 272
9.6 推理部署層 273
9.7 能力層 275
9.7.1 流程控制 275
9.7.2 核心功能 276
9.8 安全層 278
9.9 應用層 279
9.9.1 智能問答 280
9.9.2 智能運維 280
9.9.3 智能客服 280
9.9.4 數字員工 281
9.10 本章小結 281
9.11 參考文獻 282
第10章 大模型開發框架 284
10.1 開發框架整體結構 284
10.2 數據層 286
10.2.1 向量數據庫 287
10.2.2 文檔解析引擎 298
10.2.3 數據處理工具 303
10.3 模型層 304
10.3.1 開源模型 305
10.3.2 微調技術棧 307
10.4 推理層 313
10.4.1 推理引擎 314
10.4.2 本地化部署 319
10.5 工具鏈層 323
10.5.1 開發框架 325
10.5.2 增強組件 329
10.6 接口層 331
10.6.1 API網關 332
10.6.2 通信協議 333
10.7 應用層 336
10.7.1 低代碼開發平臺 337
10.7.2 具體開發平臺 338
10.8 本章小結 342
10.9 參考文獻 342
第11章 法律咨詢智能助手 345
11.1 需求分析 345
11.2 系統架構 346
11.2.1 系統功能模塊 346
11.2.2 系統架構設計 347
11.3 關鍵技術 348
11.3.1 法規文檔預處理 348
11.3.2 自動構建法律法規知識圖譜 349
11.3.3 案例特征要素提取 351
11.3.4 實體對齊 352
11.3.5 法條檢索 352
11.3.6 法條檢查 353
11.3.7 歷史案例庫構建算法 354
11.3.8 案件審理結構化報告生成 356
11.4 系統實現 357
11.4.1 法規文檔預處理的實現 357
11.4.2 自動構建法律法規知識圖譜的實現 358
11.4.3 案例特征要素提取的實現 364
11.4.4 實體對齊的實現 365
11.4.5 法條檢索的實現 367
11.4.6 法條檢查的實現 369
11.4.7 歷史案例庫構建算法的實現 372
11.4.8 案件審理結構化報告生成 373
11.5 本章小結 374
11.6 參考文獻 374
第12章 代碼修復智能助手 376
12.1 需求分析 376
12.2 系統架構 378
12.2.1 業務架構 378
12.2.2 技術架構 381
12.3 關鍵技術 383
12.3.1 代碼問題精確定位技術 384
12.3.2 深度代碼語義理解技術 385
12.3.3 多模態信息智能融合技術 386
12.3.4 增量學習與知識遷移技術 387
12.3.5 基於強化學習的修復策略優化技術 388
12.3.6 智能代碼生成技術 389
12.3.7 基於程序分析的漏洞檢測技術 389
12.4 系統實現 390
12.4.1 Issue智能解析模塊 390
12.4.2 代碼依賴關系分析模塊 392
12.4.3 智能修復策略生成模塊 395
12.4.4 自動化測試驗證模塊 396
12.4.5 持續學習與優化模塊 397
12.5 本章小結 399
12.6 參考文獻 400