大模型應用開發

鮑亮、李倩

  • 出版商: 清華大學
  • 出版日期: 2025-09-01
  • 售價: $714
  • 語言: 簡體中文
  • ISBN: 7302700834
  • ISBN-13: 9787302700838
  • 相關分類: Large language model
  • 下單後立即進貨 (約4週~6週)

  • 大模型應用開發-preview-1
  • 大模型應用開發-preview-2
  • 大模型應用開發-preview-3
  • 大模型應用開發-preview-4
  • 大模型應用開發-preview-5
  • 大模型應用開發-preview-6
  • 大模型應用開發-preview-7
大模型應用開發-preview-1

相關主題

商品描述

"《大模型應用開發》系統梳理大模型應用開發的全鏈條知識,詳解大模型應用開發過程中涉及的理論、技術、方法、過程、工具和分析案例,為開發者搭建從理論到實踐的橋梁,助力解決技術落地中的實際問題,推動大模型在工業、科研、服務等領域的規模化應用,配套示例源碼、PPT課件、配圖PDF文件、讀者微信交流群。 《大模型應用開發》共分12章,內容包括大模型基礎、大模型架構、多模態大模型、提示詞工程、大模型微調、檢索增強生成、AI智能體、大模型應用、大模型應用架構、大模型開發框架、法律咨詢智能助手、代碼修復智能助手。 《大模型應用開發》既適合大模型應用開發初學者、大模型應用開發工程師、大模型應用開發研究人員、行業AI解決方案提供商,也適合高等院校及高職高專院校學習大模型應用開發的學生。"

作者簡介

"鮑亮,西安電子科技大學教授,博導,計算機學會高級會員。研究方向為大數據分析和大模型應用技術。主持各類科研項目50余項,科研成果轉化直接經濟效益2億元,發表高水平論文30余篇,出版相關專著4本。李倩,西安交通大學教授,博導。研究方向為金融大數據、金融科技、公司金融。主持國家及省部級課題10余項,發表高水平論文40余篇。"

目錄大綱

目    錄

第1章  大模型基礎 1

1.1  語言模型基礎 1

1.1.1  基於統計方法的語言模型 2

1.1.2  基於循環神經網絡的語言模型 5

1.1.3  基於Transformer架構的語言模型 10

1.2  大模型發展歷史 14

1.2.1  統計語言模型奠基期 14

1.2.2  神經網絡語言模型探索期 15

1.2.3  Transformer架構革命期 15

1.2.4  大模型爆發增長期 15

1.3  大模型的特點 18

1.3.1  大模型的快思慢考 18

1.3.2  大模型的優勢與不足 20

1.4  大模型行業應用場景中的優勢與挑戰 21

1.4.1  教育領域:智能教育的革新與困境 21

1.4.2  醫療領域:精準醫療的希望與隱憂 22

1.4.3  金融領域:智能金融的變革與挑戰 22

1.4.4  電商領域:智能營銷的機遇與難題 23

1.5  本章小結 23

1.6  參考文獻 24

第2章  大模型架構 28

2.1  Encoder-Only架構 28

2.1.1  BERT模型 29

2.1.2  RoBERTa模型 33

2.1.3  ALBERT模型 34

2.1.4  ELECTRA語言模型 34

2.2  Decoder-Only架構 35

2.2.1  GPT系列語言模型 36

2.2.2  LLaMA模型 38

2.2.3  PaLM模型 39

2.3  Encoder-Decoder架構 40

2.3.1  T5模型 41

2.3.2  BART語言模型 43

2.3.3  GLM模型 45

2.3.4  Switch Transformer 46

2.4  編碼器、解碼器、編解碼器架構對比 47

2.5  本章小結 49

2.6  參考文獻 49

第3章  多模態大模型 53

3.1  多模態大模型基礎 53

3.1.1  多模態大模型的定義與特征 54

3.1.2  多模態學習與單模態學習的區別 55

3.1.3  多模態大模型的基本架構 57

3.1.4  多模態對齊與融合技術簡述 61

3.2  多模態大模型的發展歷程 63

3.2.1  特征拼接與淺層交互模型階段 63

3.2.2  融合與對齊階段 64

3.2.3  大規模預訓練階段 64

3.2.4  通用多模態大模型階段 65

3.3  多模態大模型介紹 66

3.3.1  CLIP 66

3.3.2  ALIGN 67

3.3.3  Flamingo 68

3.3.4  PaLI 69

3.3.5  BLIP2 70

3.3.6  LLaVA 71

3.3.7  VisCPM 72

3.3.8  ChatGPT-4V和GPT-4o 73

3.3.9  Qwen-VL和Qwen-VL-Max 74

3.3.10  Gemini+2.5 75

3.4  多模態大模型的應用場景 76

3.4.1  智能問答與對話系統 76

3.4.2  智能推薦與搜索 76

3.4.3  醫療影像與輔助診斷 77

3.4.4  內容生成與編輯 77

3.5  本章小結 77

3.6  參考文獻 77

第4章  提示詞工程 81

4.1  技術介紹 81

4.1.1  提示詞工程的概念和作用 81

4.1.2  提示詞應用示例 83

4.2  研究進展 85

4.2.1  零樣本提示 86

4.2.2  少樣本提示——以例示教的智慧 89

4.2.3  思維鏈提示 91

4.2.4  思維樹——多路徑探索的高級推理 93

4.2.5  檢索增強生成——知識外掛的智能問答 95

4.2.6  ReAct框架——推理與行動的協同範式 98

4.3  框架對比 101

4.3.1  開源框架 101

4.3.2  商用框架 105

4.3.3  框架對比全景表 106

4.3.4  小結與展望 106

4.4  本章小結 107

4.5  參考文獻 107

第5章  大模型微調 109

5.1  大模型微調基礎 109

5.1.1  微調定義 109

5.1.2  微調分類 110

5.1.3  微調技術歷史沿革 111

5.2  微調流程 113

5.2.1  數據集準備 114

5.2.2  模型初始化 114

5.2.3  訓練環境配置 114

5.2.4  模型微調 115

5.2.5  評估驗證 115

5.2.6  部署上線 116

5.2.7  監控維護 116

5.3  微調的主流平臺和框架 116

5.3.1  Hugging Face Transformers 116

5.3.2  LLaMA-Factory 117

5.3.3  Unsloth 118

5.3.4  MS-SWIFT 119

5.3.5  百度千帆平臺 120

5.3.6  阿裏雲PAI 121

5.3.7  訊飛星辰 122

5.3.8  對比分析 123

5.4  本章小結 126

5.5  參考文獻 126

第6章  檢索增強生成 129

6.1  概念與內涵剖析 129

6.1.1  RAG定義 130

6.1.2  關鍵組件與工作原理 130

6.1.3  與傳統生成模型的區別與優勢 132

6.1.4  應用領域與實際案例 133

6.2  技術演進與研究進展 134

6.3  相關商用與開源框架對比 140

6.3.1  LangFlow 141

6.3.2  LlamaIndex 142

6.3.3  Haystack 144

6.3.4  LangChain 145

6.3.5  Amazon Kendra 146

6.3.6  Google Cloud Search 148

6.3.7  框架優缺點對比 149

6.3.8  RAG框架總結 150

6.4  本章小結 150

6.5  參考文獻 152

第7章  AI智能體 155

7.1  AI智能體的概念與內涵 156

7.1.1  AI智能體時代的開啟 156

7.1.2  AI智能體的核心概念與特征 158

7.2  AI智能體核心技術與發展 161

7.2.1  智能體的構建:核心模塊與基本架構 162

7.2.2  單智能體系統研究進展 167

7.2.3  多智能體系統研究進展 170

7.2.4  智能體的演進:自主優化與自我學習 175

7.3  智能體構建與實踐 180

7.3.1  智能體構建框架的必要性與分類 180

7.3.2  LangGraph:基於圖結構的Agent編排框架 181

7.3.3  AutoGen:多智能體協作的利器 183

7.3.4  CrewAI:通過協作提升團隊效率 184

7.3.5  Dify:LLM應用一站式開發平臺 185

7.3.6  n8n:強大的工作流自動化與集成工具 186

7.3.7  扣子:一站式AI Agent/Bot開發平臺 188

7.3.8  框架對比 189

7.4  本章小結 192

7.5  參考文獻 192

第8章  大模型應用 195

8.1  大模型應用概念解析 195

8.1.1  大模型應用的定義 195

8.1.2  與傳統應用系統的比較分析 198

8.1.3  大模型應用內涵:基本結構與關鍵組件 201

8.1.4  大模型應用外延與分類視角 204

8.2  大模型應用範式 208

8.2.1  嵌入式 209

8.2.2  協同式 210

8.2.3  自主式 211

8.3  大模型應用開發流程 213

8.3.1  需求理解與問題建模 213

8.3.2  系統架構與模型接口設計 216

8.3.3  智能模塊設計與行為調控 218

8.3.4  測試與質量評估 221

8.3.5  部署上線與模型服務策略 224

8.3.6  監控與運維反饋 227

8.4  大模型應用典型產品 232

8.4.1  智能檢索工具 232

8.4.2  編程輔助與代碼生成 235

8.4.3  文檔處理與寫作輔助 238

8.4.4  多模態內容生成 241

8.5  大模型應用面臨的關鍵挑戰 244

8.5.1  模型能力的不確定性與幻覺問題 244

8.5.2  交互控制與響應可解釋性 246

8.5.3  安全性、合規性與倫理問題 247

8.5.4  應用部署的資源與算力瓶頸 249

8.6  本章小結 251

8.7  參考文獻 252

第9章  大模型應用架構 255

9.1  大模型應用架構概述 255

9.2  大模型應用架構層次 256

9.3  基礎設施層和運行環境層 258

9.3.1  基礎設施層 259

9.3.2  運行環境層 259

9.4  數據層 260

9.4.1  核心組件 260

9.4.2  管理和支撐機制 261

9.5  模型層 261

9.5.1  大模型 262

9.5.2  向量模型 263

9.5.3  重排序模型 265

9.5.4  圖像識別模型 267

9.5.5  語言-語言模型 268

9.5.6  模型微調 272

9.6  推理部署層 273

9.7  能力層 275

9.7.1  流程控制 275

9.7.2  核心功能 276

9.8  安全層 278

9.9  應用層 279

9.9.1  智能問答 280

9.9.2  智能運維 280

9.9.3  智能客服 280

9.9.4  數字員工 281

9.10  本章小結 281

9.11  參考文獻 282

第10章  大模型開發框架 284

10.1  開發框架整體結構 284

10.2  數據層 286

10.2.1  向量數據庫 287

10.2.2  文檔解析引擎 298

10.2.3  數據處理工具 303

10.3  模型層 304

10.3.1  開源模型 305

10.3.2  微調技術棧 307

10.4  推理層 313

10.4.1  推理引擎 314

10.4.2  本地化部署 319

10.5  工具鏈層 323

10.5.1  開發框架 325

10.5.2  增強組件 329

10.6  接口層 331

10.6.1  API網關 332

10.6.2  通信協議 333

10.7  應用層 336

10.7.1  低代碼開發平臺 337

10.7.2  具體開發平臺 338

10.8  本章小結 342

10.9  參考文獻 342

第11章  法律咨詢智能助手 345

11.1  需求分析 345

11.2  系統架構 346

11.2.1  系統功能模塊 346

11.2.2  系統架構設計 347

11.3  關鍵技術 348

11.3.1  法規文檔預處理 348

11.3.2  自動構建法律法規知識圖譜 349

11.3.3  案例特征要素提取 351

11.3.4  實體對齊 352

11.3.5  法條檢索 352

11.3.6  法條檢查 353

11.3.7  歷史案例庫構建算法 354

11.3.8  案件審理結構化報告生成 356

11.4  系統實現 357

11.4.1  法規文檔預處理的實現 357

11.4.2  自動構建法律法規知識圖譜的實現 358

11.4.3  案例特征要素提取的實現 364

11.4.4  實體對齊的實現 365

11.4.5  法條檢索的實現 367

11.4.6  法條檢查的實現 369

11.4.7  歷史案例庫構建算法的實現 372

11.4.8  案件審理結構化報告生成 373

11.5  本章小結 374

11.6  參考文獻 374

第12章  代碼修復智能助手 376

12.1  需求分析 376

12.2   系統架構 378

12.2.1  業務架構 378

12.2.2  技術架構 381

12.3  關鍵技術 383

12.3.1  代碼問題精確定位技術 384

12.3.2  深度代碼語義理解技術 385

12.3.3  多模態信息智能融合技術 386

12.3.4   增量學習與知識遷移技術 387

12.3.5  基於強化學習的修復策略優化技術 388

12.3.6  智能代碼生成技術 389

12.3.7  基於程序分析的漏洞檢測技術 389

12.4  系統實現 390

12.4.1  Issue智能解析模塊 390

12.4.2  代碼依賴關系分析模塊 392

12.4.3  智能修復策略生成模塊 395

12.4.4  自動化測試驗證模塊 396

12.4.5  持續學習與優化模塊 397

12.5  本章小結 399

12.6  參考文獻 400