大模型導論

張成文

預覽內頁

出版商: 人民郵電
出版日期: 2024-07-01
定價: $419
售價: 8.5 折 $356
語言: 簡體中文
頁數: 262
裝訂: 平裝
ISBN: 7115637989
ISBN-13: 9787115637987
相關分類: Large language model

立即出貨 (庫存 < 4)

買這商品的人也買了...

~~$520~~ $410

輕鬆學量子程式設計｜從量子位元到量子演算法
~~$420~~ $378

量子科技入門
$458

深度學習與醫學圖像處理
~~$600~~ $468

零基礎學會 Python 程式交易：一本讀懂 Python 實作金融資產配置
~~$768~~ $729

機器學習圖解
$580

數據科學：基本概念、技術及應用
~~$294~~ $279

矩陣論及其應用
~~$359~~ $341

算法設計與實踐
$305

大模型入門：技術原理與實戰應用
$662

深度學習高手筆記捲2：經典應用
$351

Linux實戰——從入門到精通
$504

電網可靠度評估—模型與方法
$445

推薦系統全連結設計：原始理解與業務實踐
$453

矽谷 Python 工程師面試指南：資料結構、演算法與系統設計
$657

數據驅動的進化優化
~~$419~~ $398

量子機器學習理論與實戰
$580

大數據演算法
$469

AIGC 大語言模型輕鬆學：從個人應用到企業實踐
$509

基於機器學習的個性化推薦算法及應用
$606

多模態大模型：算法、應用與微調
~~$650~~ $507

LLM 大型語言模型的絕世祕笈：27路獨步劍法，帶你闖蕩生成式 AI 的五湖四海（iThome鐵人賽系列書）
~~$594~~ $564

我在矽谷管芯片：芯片設計公司運營之道
~~$768~~ $729

集成學習實戰
$445

基於深度學習的圖像處理與實踐
~~$630~~ $497

精確掌握 AI 大趨勢！深度學習技術解密：日本 AI 神人，帶你正確學會從機器學習到生成式 AI 的核心基礎

簡體書拿來曬2本75折詳見活動內容 »

VIP 95折
~~$534~~ $507

編譯原理, 2/e (Compilers : Principles, Techniques, and Tools, 2/e)
VIP 95折
~~$594~~ $564

深度學習之 TensorFlow：入門、原理與進階實戰
85折
$402

Essential C++ (簡體中文版)
VIP 95折
~~$774~~ $735

TCP/IP 詳解 (捲1)：協議 (TCP/IP Illustrated, Volume 1 : The Protocols, 2/e)
85折
$402

Go 並發編程實戰, 2/e
VIP 95折
~~$474~~ $450

機器人學導論, 4/e (Introduction to Robotics: Mechanics and Control, 4/e)
85折
$402

深入淺出 Vue.js
85折
$351

實用機器學習 (Real-world Machine Learning)
85折
$504

深度探索 C++ 對像模型 (Inside the C++ Object Model)
85折
$300

區塊鏈項目開發指南
85折
$402

原子教你玩 STM32 (庫函數版第2版)
85折
$402

Spring Security 實戰
85折
$611

嵌入式 Linux 基礎教程, 2/e (Embedded Linux Primer: A Practical Real-World Approach, 2/e)
85折
$504

MySQL 技術內幕－InnoDB 存儲引擎, 2/e
85折
$448

PADS 9.5 實戰攻略與高速 PCB 設計
85折
$244

基於 Bootstrap 和 Knockout.js 的 ASP.NET MVC 開發實戰 (ASP.Net MVC 5 with Bootstrap and Knockout.Js: Building Dynamic, Responsive Web Applications)
85折
$265

深入淺出 USB 系統開發 : 基於 ARM Cortex-M3
85折
$402

Redis 設計與實現
VIP 95折
~~$354~~ $336

FPGA 原理和結構
VIP 95折
~~$474~~ $450

TCP/IP 網絡編程
75折
$445

數據分析與機器學習(基於R語言)
85折
$652

深度學習推薦系統 2.0
75折
$400

移動通信系統架構設計
VIP 95折
~~$528~~ $501

自動駕駛汽車 BEV 感知算法
50折
$207

區塊鏈技術進階與實戰

LLM 大語言模型｜2書75折詳見活動內容 »

78折
~~$690~~ $538

零基礎玩轉 LLM 應用全攻略：Python × No-Code 實作 AI 開發超簡單（iThome鐵人賽系列書）
79折
~~$790~~ $624

大型語言模型應用實戰：從 Prompt Engineering 到 Agentic RAG 與 MCP
78折
~~$500~~ $390

大模型時代：從 ChatGPT 一枝獨秀到全面開戰的 AI 賽局
79折
~~$980~~ $774

業界實戰親授 - 大型語言模型微調、最佳化、佈署一次到位
79折
~~$880~~ $695

深度學習最佳入門與專題實戰：自然語言處理、大型語言模型與強化學習篇
79折
~~$780~~ $616

AIGC 大型語言模型 - 個人應用到企業實戰立刻上手
79折
~~$790~~ $624

讓 LLM 飛起來的工具使用 - AI Agent MCP 協議開發、標準、應用
79折
~~$880~~ $695

AI Agent 手刻首選 - 使用 LangChain 親手實作 LLM 大型商業專案
79折
~~$620~~ $489

LLMOps 打造穩定運行的大型語言模型系統 (LLMOps: Managing Large Language Models in Production)
79折
~~$880~~ $695

實用 DeepSeek 技術 - 開發真正可用的 LLM 應用程式
7折
~~$650~~ $455

AI 程式設計、深度學習與 LLM 入門到精通：PyTorch × GPT × Transformer × LLaMA 實作指南（iThome鐵人賽系列書）
79折
~~$1,250~~ $987

LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)
79折
~~$760~~ $600

AI Agent 智能工作流：設計與自動化全實戰
79折
~~$880~~ $695

不再是 ChatBot - 最新 AI Agent 代理建構
79折
~~$680~~ $537

最新 AI 開發範式 - Agent 多重智慧體自動產生應用
79折
~~$680~~ $537

LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具
79折
~~$980~~ $774

LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)
79折
~~$980~~ $774

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent
79折
~~$780~~ $616

Node.js 與 LLM 原理與實務：AI 應用程式開發
79折
~~$980~~ $774

知道你的下一筆訂單 - 使用 LLM
79折
~~$980~~ $774

更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練
79折
~~$750~~ $592

AI Agent 自動化流程超 Easy -- 不寫程式 No Code 聰明完成樣樣事
79折
~~$750~~ $592

Ollama 本地 AI 全方位攻略：命令列功能、五大主題測試、RAG、Vibe Coding、MCP，一本搞定所有實戰應用
VIP 95折
~~$588~~ $558

AI傳媒學：大模型助力傳媒行業應用與創新
7折
~~$680~~ $476

深談 AWS 雲端上的 AI Agent：系統化學習 AWS-AI 證照，協助企業管理 AI Agent

商品描述

本書主要介紹了大模型的發展與演變、相關技術、應用場景、未來發展趨勢和前景。本書首先回顧了大模型技術的起源和發展歷程，然後介紹了數據預處理、Transformer、預訓練與微調、模型推理和PyTorch框架等技術。此外，本書還通過具體的案例和實踐展示瞭如何應用大模型技術來解決實際問題。本書旨在幫助讀者全面瞭解大模型技術的發展與應用，並推動其在各個領域的應用和發展。

本書圖文並茂，理論翔實，案例豐富，適合從事大模型開發的科研人員以及廣大的開發者作為技術參考和培訓資料，亦可作為高校本科生和研究生的教材。

作者簡介

張成文，博士，北京郵電大學副教授、碩士生導師。中國人工智能學會高級會員，任中國電子商會大模型應用產業專委會秘書長、中國人工智能產業發展聯盟產學研工作組副組長，中國醫學裝備協會人工智能和醫用機器人工作委員會常委、中國教育發展戰略學會人工智能與機器人專委會理事等。他在網絡技術專業領域有著深入的研究，並且完成了國家科技重大專項、國家重點研發計劃、國家自然科學基金等項目。專業方向包括人工智能、大數據個性化推薦、雲計算、電腦視覺等。他在國內外一流期刊上發表了多篇高水平論文，並出版了多本教材和專著。

目錄大綱

第 1章大模型概述 1

1.1 大模型介紹 2

1.1.1 生成原理 4

1.1.2 關鍵技術 5

1.1.3 關鍵術語 10

1.2 大模型分類 11

1.2.1 按模型結構劃分 12

1.2.2 按模態劃分 12

1.2.3 按微調方式劃分 13

1.2.4 帶插件系統的大模型 13

1.3 大模型的開發流程 13

1.3.1 確定項目目標 14

1.3.2 數據準備 15

1.3.3 模型設計 16

1.3.4 模型訓練 16

1.3.5 模型部署 17

1.3.6 模型應用 17

1.4 應用場景 18

1.5 未來發展方向 20

1.5.1 AI智能體 20

1.5.2 具身智能 21

1.6 小結 22

1.7 課後習題 22

第 2章數據預處理 23

2.1 文本數據預處理 23

2.1.1 構造方法 24

2.1.2 構造流程 26

2.1.3 處理手段 28

2.1.4 常用類庫 37

2.2 圖像數據預處理 47

2.2.1 圖像去噪 48

2.2.2 圖像重採樣 52

2.2.3 圖像增強 53

2.3 圖文對數據預處理 56

2.4 Datasets庫 58

2.4.1 安裝與配置 58

2.4.2 使用方法 58

2.5 小結 63

2.6 課後習題 64

第3章 Transformer 65

3.1 註意力機制 65

3.1.1 自註意力機制 66

3.1.2 多頭自註意力機制 68

3.2 Transformer簡介 70

3.2.1 位置編碼 70

3.2.2 整體結構 71

3.2.3 稀疏Transformer 72

3.3 Visual Transformer簡介 73

3.3.1 模型結構 74

3.3.2 與Transformer對比 75

3.4 Q-Former 75

3.5 transformers庫 77

3.5.1 基本組成 77

3.5.2 使用方法 78

3.5.3 微調實踐 83

3.6 小結 85

3.7 課後習題 86

第4章預訓練 87

4.1 預訓練介紹 87

4.1.1 發展歷程 88

4.1.2 模型類型 88

4.1.3 掩碼預訓練 89

4.2 預訓練任務 89

4.3 應用於下遊任務的方法 91

4.3.1 遷移學習 91

4.3.2 微調 91

4.4 預訓練模型的應用 92

4.5 小結 93

4.6 課後習題 93

第5章訓練優化 94

5.1 模型訓練挑戰 94

5.2 訓練優化技術 95

5.2.1 數據並行 95

5.2.2 模型並行 97

5.2.3 流水線並行 98

5.2.4 混合精度訓練 99

5.3 訓練加速工具 100

5.3.1 DeepSpeed 100

5.3.2 Megatron-LM 103

5.3.3 Colossal-AI 104

5.3.4 BMTrain 104

5.4 小結 107

5.5 課後習題 108

第6章模型微調 109

6.1 監督微調 110

6.2 PEFT技術 110

6.2.1 Adapter tuning 111

6.2.2 Prefix tuning 111

6.2.3 Prompt tuning 112

6.2.4 P-tuning v1 113

6.2.5 P-tuning v2 114

6.2.6 LoRA 114

6.2.7 QLoRA 115

6.3 PEFT庫 116

6.3.1 關鍵步驟 117

6.3.2 微調方法 118

6.4 小結 124

6.5 課後習題 124

第7章模型推理 125

7.1 模型壓縮和加速技術 125

7.1.1 模型量化 126

7.1.2 知識蒸餾 127

7.1.3 模型剪枝 130

7.1.4 稀疏激活 132

7.2 推理服務提升技術 133

7.2.1 KV Cache 134

7.2.2 PagedAttention 134

7.3 小結 136

7.4 課後習題 136

第8章 PyTorch框架 137

8.1 安裝與配置 137

8.2 基礎組件 138

8.2.1 張量 138

8.2.2 CUDA張量 142

8.2.3 Autograd 144

8.2.4 DataLoader 146

8.3 構建線性回歸模型 148

8.4 構建Transformer模型 151

8.4.1 數據準備與參數設置 151

8.4.2 位置編碼 153

8.4.3 掩碼操作 154

8.4.4 註意力計算 154

8.4.5 前饋神經網絡 155

8.4.6 編碼器與解碼器 155

8.4.7 構建Transformer 157

8.4.8 模型訓練 157

8.4.9 模型測試 158

8.5 小結 158

8.6 課後習題 159

第9章向量數據庫 160

9.1 Milvus 160

9.1.1 安裝與配置 161

9.1.2 Milvus 1.0的基本操作 162

9.1.3 Milvus 2.0的基本操作 163

9.2 Pinecone 166

9.2.1 註冊與配置 166

9.2.2 基本操作 166

9.3 Chroma 168

9.3.1 安裝與配置 168

9.3.2 基本操作 168

9.4 小結 170

9.5 課後習題 170

第 10章前端可視化工具 171

10.1 Gradio 171

10.1.1 Gradio安裝 172

10.1.2 常用操作 172

10.1.3 Interface使用詳解 175

10.1.4 Blocks使用詳解 176

10.2 Streamlit 178

10.2.1 安裝與配置 178

10.2.2 數據展示API 180

10.2.3 控件API 182

10.2.4 頁面佈局API 184

10.2.5 狀態存儲 185

10.3 小結 185

10.4 課後習題 186

第 11章 LangChain 187

11.1 LangChain組件 187

11.1.1 Models 188

11.1.2 Prompts 188

11.1.3 Indexes 190

11.1.4 Memory 190

11.1.5 Chains 194

11.1.6 Agents 196

11.2 基礎操作 199

11.2.1 Prompts的用法 200

11.2.2 Chains的用法 201

11.2.3 Agents的用法 202

11.2.4 Memory的用法 204

11.3 進階實戰 205

11.3.1 對話式檢索問答 205

11.3.2 長短文本總結 207

11.3.3 結合向量數據庫實現問答 209

11.4 基於私域數據的問答系統 211

11.4.1 環境準備 212

11.4.2 模型測試 213

11.4.3 構建提示詞模板 213

11.4.4 生成詞向量 214

11.4.5 創建向量數據庫 216

11.4.6 構建問答系統 217

11.5 小結 219

11.6 課後習題 219

第 12章常用開源模型的部署與微調 220

12.1 ChatGLM3模型部署與微調 220

12.1.1 環境準備 220

12.1.2 加載模型 222

12.1.3 數據準備 224

12.1.4 定義模型 228

12.1.5 模型訓練 230

12.1.6 保存模型 232

12.1.7 模型評估 232

12.2 Baichuan2模型部署與微調 233

12.2.1 環境準備 233

12.2.2 加載模型 234

12.2.3 數據準備 238

12.2.4 定義模型 241

12.2.5 模型訓練 242

12.2.6 保存模型 244

12.2.7 模型評估 245

12.3 LLaMA2模型部署與微調 247

12.3.1 模型使用申請 248

12.3.2 環境準備 248

12.3.3 加載模型 249

12.3.4 數據準備 250

12.3.5 模型訓練 251

12.3.6 保存模型 254

12.3.7 模型評估 255

12.4 小結 256

12.5 課後習題 256

參考文獻 257

大模型導論

張成文

買這商品的人也買了...

簡體書拿來曬2本75折詳見活動內容 »

LLM 大語言模型｜2書75折詳見活動內容 »

相關主題

商品描述

作者簡介

目錄大綱

類似商品

大模型導論

張成文

買這商品的人也買了...

簡體書拿來曬2本75折 詳見活動內容 »

LLM 大語言模型｜2書75折 詳見活動內容 »

相關主題

商品描述

作者簡介

目錄大綱

類似商品

簡體書拿來曬2本75折詳見活動內容 »

LLM 大語言模型｜2書75折詳見活動內容 »