GraphRAG 實踐:使用知識圖譜提升 LLM 和 RAG 應用性能
[美] 托馬茲·布拉塔尼奇(Toma? Bratanic)奧斯卡·哈內(Oskar Hane)著 茹炳晟 殷海英 譯
- 出版商: 清華大學
- 出版日期: 2026-05-01
- 定價: $359
- 售價: $358
- 語言: 簡體中文
- 頁數: 202
- ISBN: 7302712824
- ISBN-13: 9787302712824
-
相關分類:
Large language model
- 此書翻譯自: Essential Graphrag: Knowledge Graph-Enhanced Rag (Paperback)
下單後立即進貨 (約4週~6週)
買這商品的人也買了...
-
$426特徵工程的藝術:通用技巧與實用案例 -
商業分析全攻略:用數據分析解決商業問題 (全彩)$888$843 -
跟 NVIDIA 學深度學習!從基本神經網路到 ......、GPT、BERT...,紮穩機器視覺與大型語言模型 (LLM) 的建模基礎$880$748 -
$402Llama 大模型實踐指南 -
先整理一下?|個人層面的軟體設計考量 (Tidy First?: A Personal Exercise in Empirical Software Design)$480$379 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 -
版本控制使用 Git, 3/e (Version Control with Git: Powerful Tools and Techniques for Collaborative Software Development, 3/e)$880$695 -
LLM 竟然這麼靠近 - 使用 llama 模型建立大模型本機系統$980$774 -
你的第一本 Git 與 GitHub 入門書:輕鬆實作本機與遠端儲存庫的版本控制$620$483 -
AI 應用程式開發|活用 ChatGPT 與 LLM 技術開發實作, 2/e (Developing Apps with GPT-4 and ChatGPT: Build Intelligent Chatbots, Content Generators, and More, 2/e)$680$537 -
電子商務:8堂一點就通的基礎活用課 (暢銷回饋版)$360$149 -
Python 原力爆擊:OpenAI / Gemini / AWS / Ollama 生成式 AI 應用新手指南$650$507 -
$959機器學習從入門到入行:24個項目實踐 AI -
GitHub Copilot 讓你寫程式快 10 倍!AI 程式開發大解放$690$545 -
$504GitHub Copilot 編程指南 -
因果推論的商業應用:用 Python 解鎖科技產業的精準行銷 (Causal Inference in Python)$880$695 -
$981深度學習:基礎與概念 -
深度學習詳解|台大李宏毅老師機器學習課程精粹$750$563 -
業界實戰親授 - 大型語言模型微調、最佳化、佈署一次到位$980$774 -
OpenAI API 開發手冊 - 用 Responses API、Realtime API、MCP、Agents SDK、Function calling 打造即時語音、RAG、Agent 應用$790$624 -
生成式 AI 提示工程|以前瞻性的設計打造穩定、可信任的 AI 解決方案 (Prompt Engineering for Generative AI: Future-Proof Inputs for Reliable AI Outputs)$880$695 -
$538上頭 Obsidian:手把手教你用 AI 做好知識管理 -
Sutskever 大神推薦 - 建構 AI 世界最重要的 30篇論文 : 用 PyTorch 完整實作$1,080$853 -
$420Harness 工程:從上下文管理到 Agent 系統構建 -
$594LLaMA + ChatGLM 大模型實戰
相關主題
商品描述
"檢索增強生成 (Retrieval Augmented Generation,RAG) 系統能夠自動選擇領域特定的上下文供大語言模型(Large Language Model,LLM)使用,這大幅提升了LLM生成準確且內容真實的響應的能力。GraphRAG模式采用知識圖譜構建RAG的輸入,巧妙利用數據中的現有關系,生成內容豐富且相關性高的提示詞。 《GraphRAG實踐:使用知識圖譜提升LLM和RAG應用性能》一書詳細介紹了如何構建和部署生產級別的GraphRAG系統,如何從文本中提取結構化知識,以及如何融合基於向量與圖的檢索方法。另外,還涵蓋了構建向量相似性搜索檢索工具、開發Agentic RAG應用及評估性能與準確性等諸多內容的實踐案例。 核心內容: ?嵌入技術、向量相似性搜索與混合搜索 ?將自然語言轉換為Cypher數據庫查詢語句 ?微軟的GraphRAG管道 ?Agentic RAG "
作者簡介
"托馬茲???布拉塔尼奇(Toma? Bratani?)是Manning出版社Graph Algorithms for Data Science(中文譯本《數據科學的圖算法》)一書的作者,也是LangChain和LlamaIndex的貢獻者,他在圖技術、機器學習和生成式AI領域擁有豐富的經驗。奧斯卡???哈內(Oskar Hane)擔任Neo4j生成式AI工程團隊負責人。"
目錄大綱
目 錄
第1章 提升LLM的準確性 1
1.1 大語言模型(LLM)介紹 2
1.2 LLM的局限性 6
1.2.1 知識時限問題 6
1.2.2 信息過時 7
1.2.3 純粹幻覺 8
1.2.4 缺乏私有信息 9
1.3 克服LLM的局限性 10
1.3.1 監督微調 10
1.3.2 檢索增強生成(RAG) 12
1.4 知識圖譜:RAG應用的數據存儲方案 16
1.5 本章小結 17
第2章 向量相似性搜索與混合搜索 19
2.1 RAG架構的組件 20
2.1.1 檢索器 20
2.1.2 生成器 22
2.2 使用向量相似性搜索的RAG 23
2.2.1 RAG應用的數據準備階段 24
2.2.2 文本語料庫 24
2.2.3 文本分塊函數 24
2.2.4 嵌入模型 26
2.2.5 具備向量相似性搜索函數的數據庫 27
2.2.6 執行向量搜索 28
2.2.7 使用LLM生成答案 30
2.3 為RAG應用添加全文搜索以啟用混合搜索 31
2.3.1 全文搜索索引 31
2.3.2 執行混合搜索 32
2.4 總結性思考 34
2.5 本章小結 34
第3章 高級向量檢索策略 37
3.1 “後退提示”提示詞 42
3.2 父文檔檢索器 44
3.3 完整的RAG管道 51
3.4 本章小結 53
第4章 從自然語言問題生成Cypher查詢 55
4.1 查詢語言生成的基礎知識 56
4.2 查詢語言生成在RAG管道中的定位 57
4.3 查詢語言生成的實用實踐 58
4.3.1 使用少樣本示例進行上下文學習 58
4.3.2 在提示詞中使用數據庫模式向LLM展示知識圖譜的結構 59
4.3.3 添加術語映射,將用戶問題語義映射到模式 62
4.3.4 格式指令 63
4.4 使用基礎模型實現text2cypher生成器 63
4.5 專門用於text2cypher的(微調)LLM 67
4.6 我們的學習收獲與text2cypher的作用 67
4.7 本章小結 68
第5章 Agentic RAG 69
5.1 什麼是Agentic RAG 70
5.1.1 檢索器智能體 71
5.1.2 檢索器路由器 71
5.1.3 答案評估器 72
5.2 為什麼需要Agentic RAG 72
5.3 如何實現Agentic RAG 73
5.3.1 實現檢索器工具 73
5.3.2 實現檢索器路由器 77
5.3.3 實現答案評估器 82
5.3.4 整合所有組件 84
5.4 本章小結 85
第6章 使用大語言模型構建知識圖譜 87
6.1 從文本中提取結構化數據 88
6.1.1 結構化輸出模型定義 91
6.1.2 結構化輸出提取請求 97
6.1.3 CUAD數據集 98
6.2 構建圖譜 100
6.2.1 數據導入 102
6.2.2 實體解析 104
6.2.3 向圖譜添加非結構化數據 106
6.3 本章小結 107
第7章 微軟的GraphRAG實現 109
7.1 數據集選擇 110
7.2 圖索引 111
7.2.1 分塊 112
7.2.2 實體與關系提取 114
7.2.3 實體和關系總結 120
7.2.4 社區檢測與總結 126
7.3 圖檢索器 132
7.3.1 全局搜索 132
7.3.2 局部搜索 143
7.4 本章小結 152
第8章 RAG應用評估 153
8.1 設計基準數據集 155
8.2 評估 160
8.2.1 上下文召回率 160
8.2.2 忠實度 161
8.2.3 答案正確性 162
8.2.4 加載數據集 163
8.2.5 進行評估 163
8.2.6 觀察結果 165
8.3 下一步計劃 167
8.4 本章小結 167
附錄A Neo4j環境 169
參考文獻 201



