理解大語言模型:學習其基本思想和技術
何明 鄒明光 董經緯
- 出版商: 西安交通大學
- 出版日期: 2024-09-01
- 定價: $450
- 售價: 7.5 折 $337
- 語言: 簡體中文
- 頁數: 180
- ISBN: 7569338812
- ISBN-13: 9787569338812
-
相關分類:
Large language model
立即出貨 (庫存 < 4)
LLM 大語言模型|2書75折 詳見活動內容 »
-
78折
零基礎玩轉 LLM 應用全攻略:Python × No-Code 實作 AI 開發超簡單(iThome鐵人賽系列書)$690$538 -
79折
大型語言模型應用實戰:從 Prompt Engineering 到 Agentic RAG 與 MCP$790$624 -
78折
大模型時代:從 ChatGPT 一枝獨秀到全面開戰的 AI 賽局$500$390 -
79折
業界實戰親授 - 大型語言模型微調、最佳化、佈署一次到位$980$774 -
79折
深度學習最佳入門與專題實戰:自然語言處理、大型語言模型與強化學習篇$880$695 -
79折
AIGC 大型語言模型 - 個人應用到企業實戰立刻上手$780$616 -
79折
讓 LLM 飛起來的工具使用 - AI Agent MCP 協議開發、標準、應用$790$624 -
79折
AI Agent 手刻首選 - 使用 LangChain 親手實作 LLM 大型商業專案$880$695 -
79折
LLMOps 打造穩定運行的大型語言模型系統 (LLMOps: Managing Large Language Models in Production)$620$489 -
79折
實用 DeepSeek 技術 - 開發真正可用的 LLM 應用程式$880$695 -
78折
AI 程式設計、深度學習與 LLM 入門到精通:PyTorch × GPT × Transformer × LLaMA 實作指南(iThome鐵人賽系列書)$650$507 -
79折
LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)$1,250$987 -
79折
AI Agent 智能工作流:設計與自動化全實戰$760$600 -
79折
不再是 ChatBot - 最新 AI Agent 代理建構$880$695 -
79折
最新 AI 開發範式 - Agent 多重智慧體自動產生應用$680$537 -
79折
LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具$680$537 -
79折
LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)$980$774 -
79折
LLM × 網路爬蟲終極實戰:n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent$980$774 -
79折
Node.js 與 LLM 原理與實務:AI 應用程式開發$780$616 -
79折
知道你的下一筆訂單 - 使用 LLM$980$774 -
79折
更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練$980$774 -
79折
AI Agent 自動化流程超 Easy -- 不寫程式 No Code 聰明完成樣樣事$750$592 -
79折
Ollama 本地 AI 全方位攻略:命令列功能、五大主題測試、RAG、Vibe Coding、MCP,一本搞定所有實戰應用$750$592 -
VIP 95折
AI傳媒學:大模型助力傳媒行業應用與創新$588$558 -
78折
深談 AWS 雲端上的 AI Agent:系統化學習 AWS-AI 證照,協助企業管理 AI Agent$680$530
商品描述
隨著人工智能技術飛速發展,近兩年出現了以chatGPT為代表的智能化程度極高的處理工具,支撐它們的關鍵技術就是大語言模型(LLM)。大語言模型(LLM)是人工智能在自然語言處理領域的應用,也是人工智能的最新前沿,源於自然語言處理(NLP)和深度學習的研究發展。本書首先介紹了大語言模型的基本情況,講述了自然語言處理的發展歷史、基本概念和主要任務。以一種重要的大語言模型Transformer模型為例介紹了大建模語言的基礎模型、應用方法、過擬合問題等。最後介紹了生成式預訓練Transformer模型、Meta人工智能大語言模型等幾種常用的大語言模型。
作者簡介
他是培生集團斯裏蘭卡公司的高級軟件架構師,擁有超過15年的行業經驗。他也是人工智能、機器學習、教育深度學習和計算機視覺領域的發明家、作家和研究員。蒂姆拉擁有斯裏蘭卡科倫坡大學計算機科學理學碩士學位和信息技術學士學位。他也是TOGAF認證的企業架構師。他為在線學習平臺申請了三項專利(動態神經網絡和語義學領域)。他出版了三本關於深度學習和計算機視覺的書。
目錄大綱
第1章 緒 論
1.1 人工智能簡史
1.2 大語言模型所處的地位
1.3 小結
第2章 自然語言處理的前世今生
2.1 自然語言處理的歷史
形式語法
轉換語法與生成語法
句法解析
語境與語義
語言理解
知識工程
概率模型
隱馬爾可夫模型
統計語言模型
最大熵模型
條件隨機場
大型註釋語料庫
詞義消歧
機器翻譯
信息檢索
統計方法
大型文本語料庫的可用性
自然語言處理任務的監督學習
命名實體識別
情感分析
詞嵌入簡介
深度學習與神經網絡
在現實世界的應用中部署
2.2 自然語言處理的任務
2.3 自然語言處理的基本概念
詞元化
語料庫與詞庫
詞嵌入
2.4 語言建模
N元語言模型
神經語言模型
2.5 小結
第3章 Transformer模型
3.1 註意力機制
3.2 Transformer架構
編碼器
解碼器
縮放點積
多頭註意力
3.3 小結
第4章 大語言模型大在哪?
4.1 如何使Transformer模型成為大語言模型
參數數量
數據規模
計算能力
微調和任務自適應
能力
為什麼參數很重要
計算需求
過擬合的風險
模型大小
數據的規模
4.2 大語言模型的類型
基於架構的分類
基於訓練目標的分類
基於使用的分類
4.3 基礎模型
在廣泛數據上進行預訓練
微調和靈活性
遷移學習
規模經濟
通用能力
微調功能
遷移學習
規模經濟
快速部署
跨學科應用
減少訓練開銷
持續適應性
人工智能的民主化
4.4 應用大語言模型
提示工程
微調
4.5 小結
第5章 流行的大語言模型
5.1 生成式預訓練Transformer模型
5.2 基於Transformer模型的雙向編碼器表示
5.3 Pathways語言模型
5.4 大語言模型Meta AI
5.5 小結
第6章 挑戰、機遇和誤區
6.1 大語言模型與超人工智能的挑戰
人工智能的級別
超人工智能帶來的人類存亡風險
大語言模型適用的場景
6.2 誤解與濫用
6.3 機遇
6.4 小結
