大模型RAG生成式AI開發:使用LlamaIndex、Deep Lake和 Pinecone

[法] 丹尼斯·羅斯曼 林潤

相關主題

商品描述

RAG生成式AI為構建 兼顧性能與成本的高效大 模型、計算機視覺及生成 式AI系統指明了方向。 本書深入剖析RAG, 詳解多模態AI流水線的設 計、管理與把控。RAG通 過將輸出與可追溯的源文 檔關聯,提升了輸出的準 確性與上下文相關性,為 海量信息管理提供了一種 動態思路。書中不僅展示 RAG框架的搭建方法,介 紹關於向量存儲、切塊、 索引及排序等方面的實用 知識,還傳授優化項目性 能、加深對數據理解的技 巧,例如,運用自適應 RAG與人類反饋來提高檢 索準確性,平衡RAG與微 調的關系,實施動態RAG 以增強實時決策能力,以 及借助知識圖譜可視化覆 雜數據。 讀者可親自上手,實 踐LlamaIndex和Deep Lake等框架、Pinecone和 Chroma等向量數據庫, 以及來自Hugging Face和 OpenAI的模型。學完本 書,讀者將掌握智能解決 方案的實施技能,在生產 、客戶服務等各類項目中 穩占競爭優勢。

作者簡介

丹尼斯·羅斯曼Denis Rothman,畢業於索邦大學和巴黎一狄德羅大學,寫過 早的word2vector embedding解決方案之一。他創作了 批AI認知自然語言處理(NLP)聊天機器人之一,這個聊天機器人開啟了他的職業生涯。它是一個語言教學應用程序,應用於Moet et Chandon和其他公司。他為IBM和服裝生產商編寫了一個AI資源優化器。然後,他還編寫了一個在 範圍內使用的 計劃和排程(APS)解決方案。

目錄大綱

第1章 RAG入門
1.1 RAG的定義
1.2 簡易、 和模塊化RAG
1.3 RAG對比微調
1.4 RAG生態
1.4.1 檢索器(D)
1.4.2 生成器(G)
1.4.3 評估器(E)
1.4.4 訓練器(T)
1.5 簡易、 和模塊化RAG代碼
1.5.1 部分:搭建環境與基本實現
1.5.2 第2部分: 方法與評估
1.6 小結
1.7 問題
1.8 參考文獻
1.9 擴展閱讀
第2章 基於Deep Lake和OpenAI的RAG嵌入向量庫
2.1 從原始數據到嵌入
2.2 按流水線組織RAG
2.3 RAG生成式AI流水線
2.4 搭建RAG流水線
2.4.1 配置環境
2.4.2 流水線組件1:數據采集與準備
2.4.3 流水線組件2:數據嵌入與存儲
2.4.4 流水線組件3:增強輸入生成
2.5 小結
2.6 問題
2.7 參考文獻
2.8 擴展閱讀
第3章 使用LlamaIndex、Deep Lake和OpenAI構建基於索引的RAG
3.1 使用基於索引RAG的原因
3.2 為無人機創建語義搜索引擎和生成式智能體
3.2.1 安裝環境
3.2.2 流水線組件1:采集並準備文檔
3.2.3 流水線組件2:創建並填充Deep Lake向量庫
3.2.4 流水線組件3:基於索引的RAG
3.3 向量庫索引查詢引擎
3.3.1 查詢響應和來源
3.3.2 優化組塊
3.3.3 性能指標
3.4 樹索引查詢引擎
3.5 列表索引查詢引擎
3.6 關鍵詞索引查詢引擎
3.7 小結
3.8 問題
3.9 參考文獻
3.10 擴展閱讀
第4章 無人機技術中的多模態模塊化RAG
4.1 多模態模塊化RAG
4.2 編寫無人機技術多模態模塊化RAG程序
4.2.1 加載LLM數據集
4.2.2 加載和可視化多模態數據集
4.2.3 多模態數據集導航
4.2.4 創建多模態查詢引擎
4.2.5 多模態模塊化RAG小結
4.2.6 性能指標
4.3 小結
4.4 問題
4.5 參考文獻
4.6 擴展閱讀
第5章 使用專家人類反饋提升RAG性能
5.1 自適應RAG
5.2 使用Python創建混合自適應RAG
5.2.1 檢索器
5.2.2 生成器
5.2.3 評估器
5.3 小結
5.4 問題
5.5 參考文獻
5.6 擴展閱讀
第6章 使用Pinecone擴展RAG銀行客戶數據
6.1 使用Pinecone進行擴展
6.2 流水線組件1:采集並準備數據集
6.2.1 采集和處理數據集
6.2.2 探索性數據分析
6.2.3 訓練機器學習模型
6.3 流水線組件2:擴展Pinecone索引(向量庫)
6.3.1 管理向量庫所面臨的挑戰
6.3.2 安裝環境
6.3.3 處理數據集
6.3.4 切塊並嵌入數據集
6.3.5 創建Pinecone索引
6.3.6 新插入
6.3.7 查詢Pinecone索引
6.4 流水線組件3:RAG生成式AI
6.4.1 基於GPT - 4的RAG
6.4.2 提取相關文本
6.4.3 增強提示詞
6.4.4 增強生成
6.5 小結
6.6 問題
6.7 參考文獻
6.8 擴展閱讀
第7章 使用維基百科API和LlamaIndex創建可擴展的知識圖譜RAG
7.1 基於知識圖譜語義搜索的RAG架構
7.2 流水線組件1:采集並準備文檔
7.2.1 檢索維基百科數據及元數據
7.2.2 準備數據以執行 新插入
7.3 流水線組件2:創建並填充Deep Lake向量庫
7.4 流水線組件3:基於知識圖譜索引的RAG
7.4.1 生成知識圖譜索引
7.4.2 展示圖譜
7.4.3 與知識圖譜索引交互
7.4.4 安裝相似度分數計算庫並定義函數
7.4.5 重排
7.4.6 示例指標
7.5 小結
7.6 問題
7.7 參考文獻
7.8 擴展閱讀
第8章 基於Chroma和Hugging Face Llama創建動態RAG
8.1 動態RAG架構
8.2 安裝環境
8.2.1 Hugging Face
8.2.2 Chroma
8.3 激活會話時間
8.4 下載並準備數據集
8.5 嵌入並向Chroma插入數據
8.5.1 選擇模型
8.5.2 嵌入並存儲
8.5.3 展示嵌入
8.6 查詢集合
8.7 提示與檢索
8.8 使用Llama開發RAG
8.9 總會話時長
8.10 小結
8.11 問題
8.12 參考文獻
8.13 擴展閱讀
第9章 賦能AI模型:微調RAG數據和人類反饋
9.1 微調靜態RAG數據的架構
9.2 安裝環境
9.3 準備微調數據集
9.3.1 下載並可視化數據集
9.3.2 準備微調數據集
9.4 微調模型
9.5 使用經過微調的OpenAI模型
9.6 指標
9.7 小結
9.8 問題
9.9 參考文獻
9.10 擴展閱讀
0章 使用Pinecone和OpenAI實現視頻生成RAG
10.1 視頻生成RAG架構
10.2 搭建視頻生成環境
10.2.1 導入模塊和庫
10.2.2 GitHub
10.2.3 OpenAI
10.2.4 Pinecone
10.3 流水線組件1:生成器和註釋器
10.3.1 AI視頻數據集
10.3.2 生成器和註釋器
10.4 流水線組件2:向量庫管理器
10.5 流水線組件3:視頻專家
10.6 小結
10.7 問題
10.8 參考文獻