NLP大模型詳解:基於LangChain、RAGs與Python

郝艷傑

  • 出版商: 清華大學
  • 出版日期: 2025-06-01
  • 售價: $714
  • 語言: 簡體中文
  • 頁數: 298
  • ISBN: 7302692475
  • ISBN-13: 9787302692478
  • 相關分類: LangChainText-mining
  • 下單後立即進貨 (約4週~6週)

商品描述

本書詳細闡述了與NLP大 模型相關的基本解決方案, 主要包括自然語言處理領域 探索,線性代數、概率和統 計學,釋放機器學習在自然 語言處理中的潛力,進行有 效文本預處理以實現 NLP性能,利用傳統機器學 習技術增強文本分類能力, 重新構想文本分類,揭開大 語言模型的神秘面紗,訪問 大語言模型的強大功能,大 語言模型推動的 應用和 創新,分析大語言模型和人 工智能的過去、現在和未來 趨勢,來自 專家的觀 點和預測等內容。此外,本 書還提供了相應的示例、代 碼,以幫助讀者進一步理解 相關方案的實現過程。 本書適合作為高等院校 計算機及相關專業的教材和 教學參考書,也可作為相關 開發人員的自學用書和參考 手冊。

目錄大綱

第1章 自然語言處理領域探索
1.1 本書目標讀者
1.2 自然語言處理的定義
1.3 NLP的歷史和演變
1.4 自然語言機器處理的初步策略
1.5 成功的協同效應——自然語言處理與機器學習的結合
1.6 自然語言處理中的數學和統計學簡介
1.7 理解語言模型——以ChatGPT為例
1.8 小結
1.9 問答
第2章 掌握與機器學習和自然語言處理相關的線性代數、概率和統計學
2.1 線性代數簡介
2.1.1 標量和向量的基本運算
2.1.2 矩陣的基本運算
2.1.3 矩陣定義
2.1.4 行列式
2.2 特征值和特征向量
2.2.1 尋找特征向量的數值方法
2.2.2 特征值分解
2.2.3 奇異值分解
2.3 機器學習的概率基礎
2.3.1 統計獨立
2.3.2 離散隨機變量及其分布
2.3.3 概率密度函數
2.3.4 似然估計
2.3.5 單詞預測
2.3.6 貝葉斯估計
2.4 小結
2.5 延伸閱讀
2.6 參考文獻
第3章 釋放機器學習在自然語言處理中的潛力
3.1 技術要求
3.2 數據探索
3.2.1 數據探索的意義
3.2.2 數據探索常用技術
3.3 數據可視化
3.4 數據清洗
3.4.1 處理缺失值
3.4.2 刪除重覆項
3.4.3 數據標準化和轉換
3.4.4 處理離群值
3.4.5 糾正錯誤
3.5 特征選擇
3.5.1 篩選方法
3.5.2 包裝器方法
3.5.3 嵌入方法
3.5.4 降維技術
3.6 特征工程
3.6.1 特征縮放
3.6.2 特征構建
本書詳細闡述了與NLP大 模型相關的基本解決方案, 主要包括自然語言處理領域 探索,線性代數、概率和統 計學,釋放機器學習在自然 語言處理中的潛力,進行有 效文本預處理以實現 NLP性能,利用傳統機器學 習技術增強文本分類能力, 重新構想文本分類,揭開大 語言模型的神秘面紗,訪問 大語言模型的強大功能,大 語言模型推動的 應用和 創新,分析大語言模型和人 工智能的過去、現在和未來 趨勢,來自 專家的觀 點和預測等內容。此外,本 書還提供了相應的示例、代 碼,以幫助讀者進一步理解 相關方案的實現過程。 本書適合作為高等院校 計算機及相關專業的教材和 教學參考書,也可作為相關 開發人員的自學用書和參考 手冊。