復合型AI Agent開發:從理論到實踐
陳禎民、李春燕
相關主題
商品描述
《復合型AI Agent開發:從理論到實踐》以“讓Agent真正落地”為核心目標,系統梳理復合型AI Agent的完整開發路徑。從理論原理到工程實踐,全書通過可運行示例為驅動,幫助讀者在理解架構理念的同時掌握真實可用的落地方案。《復合型AI Agent開發:從理論到實踐》共分為8章,內容涵蓋復合型AI Agent的設計與工程化實現,包括Agent核心三要素解析(LLM、Prompt、Action)、檢索增強生成(RAG)技術、模型上下文協議(MCP)、LangChain框架生態、ChatUI前端交互組件、Coze低代碼平臺,以及系統級架構優化策略等。每章均配備可獨立運行的完整示例,幫助讀者從零構建具備多場景適配與多角色協作能力的現代智能體。 《復合型AI Agent開發:從理論到實踐》適合希望深入理解並實踐AI Agent開發的工程師、AI產品開發者、算法研究者及技術創業者。無論是剛接觸大模型應用的入門者,還是期望構建具備真實業務落地能力的工程實踐者,都能從中獲得完整的技術路徑與系統化的實現思維,在生成式AI的時代浪潮中搶占先機。
作者簡介
陳禎民,頭部大廠資深前端工程師,前抖音與TraeIDE 工程師,大模型時代首批AI應用開發者,字節跳動青訓營講師、掘金簽約作者。著有《生成式AI應用開發:基於OpenAl實現》
李春燕,世界前500強外企高級測試工程師,長期深耕軟件質量與自動化體系建設,專註於測試與AI的融合實踐,在智能化測試工具及自動化平臺方面積累了豐富經驗。
目錄大綱
目 錄
第1章 緒論 1
1.1 AI Agent演進之路 1
1.1.1 開幕:LLM與ChatGPT 1
1.1.2 前傳:Transformer架構 2
1.1.3 初見端倪:單向自回歸解碼 6
1.1.4 問世:ChatGPT 8
1.1.5 風波再起:DeepSeek 13
1.1.6 百花齊放:Agent 18
1.2 復合型AI Agent的市場前景 26
1.3 本書的內容安排 28
第2章 Agent開發基礎 31
2.1 Agent三要素:LLM、Prompt、Action 31
2.2 LLM:以DeepSeek API為例 34
2.2.1 基礎調用 34
2.2.2 請求參數 38
2.2.3 流式請求 39
2.2.4 system message 43
2.2.5 深度思考標簽 48
2.3 Prompt:工程化提示詞 50
2.3.1 思維鏈 51
2.3.2 結構化提示詞 52
2.3.3 正反面示例引導 55
2.3.4 分治法 57
2.3.5 復雜響應的數據結構轉換 59
2.4 Action:Function Calling 61
2.5 本章小結 64
第3章 RAG:檢索增強生成技術 66
3.1 什麼是RAG 66
3.1.1 RAG架構鏈路 66
3.1.2 RAG的優勢 67
3.2 RAG底層實現 69
3.2.1 向量化 69
3.2.2 長文本切割 78
3.2.3 向量存儲 & 相似匹配 85
3.3 RAGAS召回評估 98
3.4 自我矯正:CRAG 103
3.5 示例:從RAG到復合型Agent 107
3.6 本章小結 113
第4章 MCP:模型上下文協議 115
4.1 初探MCP 115
4.2 MCP基礎開發 117
4.2.1 MCP服務端 117
4.2.2 客戶端 120
4.2.3 MCP Inspector 123
4.3 MCP通信類型 127
4.3.1 STDIO 127
4.3.2 HTTP SSE & Streamable HTTP 128
4.4 MCP應用 135
4.4.1 連接本地/遠程MCP服務端 135
4.4.2 與Memory/Rules聯動 136
4.5 本章小結 138
第5章 LangChain:復合型Agent開發框架 140
5.1 LangChain框架總覽 140
5.2 langchain模塊 142
5.2.1 項目初始化 142
5.2.2 Runnable接口 143
5.2.3 LLM 146
5.2.4 文檔加載 157
5.2.5 RAG 160
5.2.6 多模態 165
5.2.7 SQL聯動 167
5.3 langgraph模塊 176
5.3.1 編排能力 177
5.3.2 記憶 184
5.3.3 Human-in-the-Loop 190
5.3.4 路徑回放 194
5.3.5 工具調用 199
5.3.6 子圖嵌套 203
5.4 典型Agent示例 208
5.4.1 CRAG 208
5.4.2 ReAct 215
5.4.3 Supervisor 219
5.5 本章小結 223
第6章 ChatUI:對話式交互組件庫 226
6.1 ChatUI與對話式交互 226
6.2 ChatUI核心組件 228
6.2.1 對話容器 229
6.2.2 氣泡 235
6.2.3 打字氣泡 237
6.2.4 思考區域 239
6.2.5 輸入態 241
6.2.6 消息狀態 242
6.2.7 系統消息 244
6.3 主題定制 245
6.4 示例:具備圖形界面的復合型Agent 248
6.5 本章小結 254
第7章 Coze:低代碼AI應用搭建 256
7.1 Coze是什麼 256
7.2 自主規劃模式 258
7.2.1 人設與回復邏輯 259
7.2.2 模型 263
7.2.3 插件 264
7.2.4 知識庫 266
7.2.5 記憶 267
7.3 對話流模式 268
7.3.1 開始和結束 270
7.3.2 大模型 270
7.3.3 插件 272
7.3.4 工作流 273
7.3.5 代碼 274
7.3.6 選擇器與意圖識別 275
7.3.7 知識庫 277
7.3.8 記憶 279
7.4 發布為API調用 280
7.5 本章小結 282
第8章 Agent設計範式:原子化與鏈路可控 284
8.1 框架設計 284
8.1.1 ReAct 284
8.1.2 Supervisor 285
8.1.3 Hierarchical 287
8.2 通信設計 288
8.2.1 SSE:輕量式流式推送 288
8.2.2 WebSocket:全雙工實時通信 291
8.3 狀態設計 296
8.3.1 狀態管理 297
8.3.2 上下文跟蹤 298
8.4 渲染設計 299
8.4.1 組件原子的Function Calling 300
8.4.2 渲染管道隔離 300
8.5 工作流優化範式 302
8.5.1 意圖識別 302
8.5.2 Human in the Loop 307
8.5.3 自回歸機制 310
8.5.4 記憶機制 312
8.5.5 安全邊界 314
8.6 成本優化策略 316
8.6.1 Prompt token消耗優化 316
8.6.2 上下文與工具緩存 318
8.6.3 合理使用不同模型 319
8.7 本章小結 320



