RAG 再深入研究 - 向量資料庫智慧檢索及應用
梁楠 著
- 出版商: 深智
- 出版日期: 2026-01-19
- 定價: $880
- 售價: 7.9 折 $695
- 語言: 繁體中文
- 頁數: 480
- ISBN: 6267757706
- ISBN-13: 9786267757703
-
相關分類:
Data-visualization、Web-crawler 網路爬蟲
尚未上市,歡迎預購
買這商品的人也買了...
-
$700Professional Scrum Development with Microsoft Visual Studio 2012 (Paperback) -
$958深度學習 -
C Traps and Pitfalls (中文版)$380$296 -
深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)$580$493 -
Raspberry Pi 樹莓派:Python x AI 超應用聖經$699$594 -
系統程式設計 (上册)$880$695 -
Martin Fowler 的企業級軟體架構模式:軟體重構教父傳授 51個模式,活用設計思考與架構決策 (Patterns of Enterprise Application Architecture)$800$624 -
我懂了!專案管理 (暢銷紀念版)$400$316 -
電腦視覺機器學習實務|建立端到端的影像機器學習 (Practical Machine Learning for Computer Vision: End-To-End Machine Learning for Images)$780$616 -
全格局使用 PyTorch -- 深度學習和圖神經網路 -- 基礎篇$880$695 -
$2,185Learning Blazor: Build Single-Page Apps with Webassembly and C# (Paperback) -
$2,052ASP.NET Core Razor Pages in Action (Paperback) -
凡人也能懂的白話人工智慧演算法 (Grokking Artificial Intelligence Algorithms)$580$458 -
TinyML 經典範例集$520$411 -
完全 OS 核心精修 - 熟稔 Windows API 基礎篇$980$774 -
自己開發 ChatGPT - LLM 從頭開始動手實作$720$569 -
無瑕的程式碼 軟體工匠篇:程式設計師必須做到的紀律、標準與倫理 (Clean Craftsmanship: Disciplines, Standards, and Ethics)$720$562 -
讓 AI 好好說話!從頭打造 LLM (大型語言模型) 實戰秘笈$680$537 -
從源頭就優化 - 動手開發自己的編譯器實戰$880$695 -
動手做 AI Agent:LLM 應用開發實戰力$650$514 -
LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)$980$774 -
UX 商業價值實現之道|打造成功的數位產品服務 (UX for Business: How to Design Valuable Digital Companies)$780$616 -
建構可擴展系統|設計分散式架構 (Foundations of Scalable Systems: Designing Distributed Architectures)$780$616 -
高效的 Rust|提升 Rust 程式的 35招具體做法 (Effective Rust: 35 Specific Ways to Improve Your Rust Code)$680$537 -
不再是 ChatBot - 最新 AI Agent 代理建構$880$695
相關主題
商品描述
【書籍特點】
★解構高維資料儲存與「維度詛咒」問題
★比較向量資料庫與傳統關聯式資料庫設差異
★探索靜態與動態向量嵌入的生成與應用
★分析距離度量失效與高維相似度計算方法
★實作HNSW與LSH等近似最近鄰搜尋演算法
★評估Annoy與BallTree在不同檢索場景的效能
★解析FAISS向量索引類型與GPU加速技術
★建構Milvus系統並實現分散式與容器化部署
★支援中繼資料條件查詢與多維混合檢索
★結合語義嵌入技術進行語義搜尋系統開發
★完整實作自動駕駛場景的資料檢索系統
★導入預訓練模型與微調生成高品質語義向量
★實現RESTful API與雲端語義檢索服務整合
★全面覆蓋語義搜索性能調校與異常診斷模組
【內容簡介】
這是一本針對高維向量資料檢索技術所編寫的系統性實務指南,涵蓋從理論基礎、核心演算法到主流工具與應用部署的完整脈絡。內容不僅說明向量資料庫的設計必要性,也具體分析傳統資料庫在高維資料處理上的限制,進而引入HNSW、LSH、Annoy等近似最近鄰搜尋演算法的實作方法。對於工程應用層面,書中詳細介紹FAISS與Milvus兩大系統的架構設計、索引建構、GPU最佳化與容器化部署流程,並輔以自動駕駛、語義檢索等真實場景的完整案例。實作細節包括語義嵌入生成、向量預處理、多條件查詢與RESTful介面開發,對需要建構語義搜索或高效推薦引擎的開發者而言具有極高參考價值。本書適合AI開發者、搜尋系統工程師、推薦系統實作者及研究高維向量檢索的學術人員使用,是串接模型應用與資料系統的關鍵橋樑。
作者簡介
梁楠 博士
畢業於北京航空航太大學,高級職稱,長期從事模式識別、機器學習、統計理論的研究與應用,負責或參與科研項目多項,專注於人工智慧、大語言模型的應用與開發,對深度學習、資料分析與預測等有獨到見解。
目錄大綱
▌第一部分 理論基礎
►第1 章 為何需要向量資料庫
1.1 大語言模型的缺陷
1.1.1 高維向量表示中的資訊遺失問題
1.1.2 嵌入空間對語義相似度的誤差影響
1.2 高維資料儲存與檢索的技術瓶頸
1.2.1 高維資料的特性與儲存困難分析
1.2.2 高維空間中的「維度詛咒」問題簡介
1.2.3 高效檢索:索引結構與搜尋演算法簡介
1.3 傳統資料庫與向量資料庫的對比分析
1.3.1 傳統資料庫的設計原理與局限性
1.3.2 高維向量檢索在傳統資料庫中的實現困難
1.3.3 傳統資料庫與向量資料庫的性能對比分析
1.4 向量資料庫的優勢
1.5 本章小結
1.6 思考題
►第2 章 向量資料庫基礎
2.1 向量資料庫的核心概念與基本資料結構
2.1.1 向量資料庫的定義與發展背景
2.1.2 向量資料庫常見的資料結構:倒排索引、圖索引與分區技術
2.1.3 向量資料庫與傳統資料庫邏輯對比
2.2 特徵提取與向量表示:從資料到高維座標系
2.2.1 特徵提取的基本方法
2.2.2 嵌入向量生成
2.2.3 資料前置處理對向量品質的影響
2.3 高維空間特性與「維度詛咒」問題解析
2.3.1 高維空間中的稀疏性與資料分佈特性
2.3.2 距離度量的退化:歐幾里得距離與餘弦相似度
2.3.3 維度詛咒:降維與索引最佳化
2.4 本章小結
2.5 思考題
▌第二部分 核心技術與演算法原理
►第3 章 向量嵌入
3.1 靜態向量嵌入
3.1.1 傳統詞向量模型:Word2Vec 與GloVe
3.1.2 靜態嵌入的局限性:語義多義性與上下文缺失
3.1.3 靜態向量嵌入在特定領域的應用
3.2 動態向量嵌入
3.2.1 動態詞向量的生成:BERT 與GPT 的嵌入機制
3.2.2 動態嵌入的優勢:上下文敏感性與語義一致性
3.2.3 動態向量嵌入的即時生成與最佳化
3.3 均勻分佈與空間覆蓋率
3.3.1 高維向量分佈分析
3.3.2 嵌入向量的均勻性測量方法
3.3.3 空間覆蓋率對檢索性能的影響
3.4 嵌入向量最佳化
3.4.1 主成分分析與奇異值分解的降維應用
3.4.2 t-SNE 與UMAP 降維技術
3.4.3 降維對嵌入語義保留與性能的權衡分析
3.5 本章小結
3.6 思考題
►第4 章 向量相似性搜尋初步
4.1 基於暴力搜尋的向量相似性檢索
4.1.1 暴力搜尋的原理與實現
4.1.2 暴力搜尋最佳化
4.2 歐幾里得距離與餘弦相似度
4.2.1 距離與相似度的數學定義
4.2.2 不同相似度指標的適用場景分析
4.3 向量搜尋的精度與召回率
4.3.1 精度、召回率與F1 評分的計算方法
4.3.2 向量搜尋性能提升方案
4.4 本章小結
4.5 思考題
►第5 章 分層定位與局部敏感雜湊
5.1 HNSW 的核心原理:圖結構與分層搜尋路徑最佳化
5.1.1 基於圖結構的近鄰搜尋模型
5.1.2 分層搜尋路徑的建構與更新
5.1.3 HNSW 索引時間複雜度分析
5.2 局部敏感雜湊的設計與性能調優
5.2.1 雜湊函式的設計與向量分區原理
5.2.2 LSH 桶化與參數調優
5.2.3 LSH 的記憶體佔用與計算性能分析
5.3 HNSW 與LSH 的具體應用
5.3.1 HNSW 在推薦系統中的應用
5.3.2 LSH 在文字和影像檢索中的應用
5.3.3 HNSW 與LSH 的組合應用:多模態檢索實例
5.4 本章小結
5.5 思考題
►第6 章 LSH 搜尋最佳化
6.1 BallTree 演算法的工作原理
6.1.1 BallTree 的節點分割與索引建構
6.1.2 BallTree 查詢過程與複雜度分析
6.2 Annoy 搜尋演算法
6.2.1 Annoy 的索引結構設計與分區原理
6.2.2 Annoy 在大規模向量檢索中的性能最佳化
6.3 隨機投影在LSH 中的應用
6.3.1 隨機投影的數學基礎
6.3.2 隨機投影在高維資料降維與檢索中的實際應用
6.3.3 隨機投影在人物誌降維與檢索中的應用
6.4 本章小結
6.5 思考題
▌第三部分 工具與系統建構
►第7 章 相似性測量初步
7.1 從曼哈頓距離到切比雪夫距離
7.1.1 曼哈頓距離的幾何意義與公式推導
7.1.2 切比雪夫距離在棋盤模型中的應用
7.1.3 不同距離度量的適用場景分析
7.2 相似性測量的時間複雜度與最佳化
7.2.1 向量間距離計算的時間複雜度分析
7.2.2 減少距離計算的分區最佳化技術
7.2.3 並行化與硬體加速在相似性測量中的應用
7.2.4 廣告分發系統案例:基於相似性測量的高效推薦
7.3 本章小結
7.4 思考題
►第8 章 測量進階:點積相似度與雅卡爾相似係數
8.1 點積相似度測量
8.1.1 點積相似度測量實現
8.1.2 點積相似度在推薦系統中的應用案例
8.1.3 點積相似度在醫療領域的應用案例:患者治療方案匹配
8.2 雅卡爾相似係數在稀疏向量中的應用
8.2.1 稀疏向量的構造與稀疏性分析
8.2.2 雅卡爾相似係數案例分析
8.2.3 基於雅卡爾相似係數的犯罪嫌犯關係網絡分析
8.3 跨模態醫療資料相似性分析與智慧診斷系統
8.4 本章小結
8.5 思考題
►第9 章 中繼資料過濾與犯罪行為分析系統
9.1 中繼資料與向量檢索
9.1.1 中繼資料在混合檢索中的作用
9.1.2 中繼資料標籤的定義與標準化
9.1.3 智慧多條件推薦系統
9.2 多條件檢索實現
9.2.1 多維度條件組合檢索
9.2.2 基於中繼資料優先順序的排序演算法
9.2.3 基於中繼資料的酒店智慧化推薦案例分析
9.3 中繼資料索引的建構與最佳化
9.3.1 中繼資料索引建構
9.3.2 動態中繼資料的更新與重建
9.4 即時檢索與中繼資料快取
9.4.1 基於快取的高性能檢索架構
9.4.2 中繼資料快取失效與一致性管理
9.5 基於中繼資料的犯罪行為分析與即時預警系統
9.5.1 模組開發劃分
9.5.2 逐模組開發
9.5.3 犯罪分析與預警系統綜合測試
9.6 本章小結
9.7 思考題
►第10 章 FAISS 向量資料庫開發基礎
10.1 FAISS 庫的安裝與快速上手
10.1.1 FAISS 初步開發以及CPU、GPU 的版本差異
10.1.2 載入資料與基本查詢範例
10.2 基於FAISS 的索引建構與參數調整
10.2.1 不同索引類型:Flat、IVF 與HNSW
10.2.2 參數調整對搜尋精度與速度的影響
10.3 大規模向量搜尋的分片與分散式實現
10.3.1 資料分片與動態分片
10.3.2 基於分散式框架的FAISS 部署
10.4 FAISS 中的記憶體最佳化與GPU 加速
10.4.1 壓縮索引與量化技術
10.4.2 多GPU 的並行處理
10.5 本章小結
10.6 思考題
►第11 章 Milvus 向量資料庫開發基礎
11.1 Milvus 的架構設計與功能模組解析
11.1.1 Milvus 的初步使用及叢集架構與元件通訊
11.1.2 資料分區與高可用設計
11.2 使用Milvus 進行向量插入、檢索與過濾
11.2.1 向量資料前置處理與批次插入
11.2.2 複雜查詢準則實現
11.3 Milvus 的索引類型與性能調優
11.3.1 索引類型的選擇與適用場景分析
11.3.2 並行最佳化與索引更新
11.4 Milvus 在企業級應用中的部署與擴充方案
11.4.1 基於容器化的高可用部署
11.4.2 動態擴充與監控整合方案
11.5 本章小結
11.6 思考題
▌第四部分 實戰與案例分析
►第12 章 基於FAISS 的自動駕駛泊車資料檢索系統
12.1 項目背景介紹
12.1.1 系統架構
12.1.2 應用流程
12.1.3 案例特色
12.2 模組劃分
12.3 模組化開發
12.3.1 資料前置處理模組
12.3.2 向量生成模組
12.3.3 索引建構與儲存模組
12.3.4 即時檢索模組
12.3.5 動態更新模組
12.3.6 系統監控與最佳化模組
12.4 系統綜合測試
12.5 API 介面開發與雲端部署
12.5.1 API 介面開發
12.5.2 雲端部署完整系統
12.6 本章小結
12.7 思考題
►第13 章 基於語義搜尋的向量資料庫開發實戰
13.1 語義嵌入生成與最佳化
13.1.1 使用預訓練模型生成語義向量嵌入
13.1.2 動態分詞與文字前置處理
13.1.3 領域微調技術
13.2 建構向量索引與語義檢索框架
13.2.1 選擇合適的向量索引類型
13.2.2 建構Milvus 向量索引
13.2.3 語義向量檢索與關鍵字過濾
13.2.4 結合中繼資料與篩選條件實現多維度語義搜尋
13.3 語義搜尋系統的性能調優
13.3.1 GPU 加速最佳化檢索
13.3.2 批次查詢與非同步IO 技術
13.3.3 實現基於分散式架構的語義搜尋系統
13.4 企業級語義搜尋應用整合與部署
13.4.1 建構語義搜尋RESTful 介面
13.4.2 使用Docker 與Kubernetes 實現語義搜尋系統的容器化
13.4.3 日誌監控與錯誤診斷模組
13.4.4 基於語義搜尋的文件檢索系統集成與部署
13.4.5 大型圖書館圖書檢索的測試案例
13.5 本章小結
13.6 思考題








