人工智能大模型導論

史衛亞劉田園劉婉月

出版商: 北京大學
出版日期: 2025-04-01
定價: $414
售價: 8.7 折 $360 (限時優惠至 2026-04-18)
語言: 簡體中文
頁數: 229
裝訂: 16開
ISBN: 7301359721
ISBN-13: 9787301359723
相關分類: Large language model

立即出貨

買這商品的人也買了...

~~$1,200~~ $1,176

Antennas: For All Applications, 3/e (IE-Paperback)
~~$980~~ $980

A Course In Fuzzy Systems and Control (IE-Paperback)
~~$820~~ $410

圖解 TensorFlow 2 初學篇：實作 tf.keras + Colab 雲端、深度學習、人工智慧、影像辨識
~~$539~~ $512

自然語言處理之 BERT 模型算法、架構和案例實戰
$453

自然語言處理與應用
$504

LangChain 入門指南：構建高可復用、可擴展的 LLM 應用程序
~~$880~~ $695

LLM 的瑞士刀 - 用 LangChain 極速開發可擴充大型應用程式
$458

大模型應用開發 : 動手做 AI Agent
~~$650~~ $507

LLM 大型語言模型的絕世祕笈：27路獨步劍法，帶你闖蕩生成式 AI 的五湖四海（iThome鐵人賽系列書）
~~$680~~ $537

讓 AI 好好說話！從頭打造 LLM (大型語言模型) 實戰秘笈
$453

新一代人工智能：從深度學習到大模型
$469

深度學習理論及實戰（MATLAB版·第2版）
~~$714~~ $678

深度剖析 DeepSeek 大模型 : 原理開發與優化部署
~~$880~~ $695

深度學習最佳入門與專題實戰：自然語言處理、大型語言模型與強化學習篇
$673

人工智能大模型：機器學習基礎
~~$450~~ $355

文科生也能輕鬆實現！自建自用大語言模型 (LLM)：無痛操作 Ollama 本機端模型管理器
~~$750~~ $592

深度學習詳解｜台大李宏毅老師機器學習課程精粹
~~$534~~ $507

DeepSeek 圖解：大模型是怎樣構建的
~~$880~~ $695

跟 NVIDIA 學 LLM 基礎！GPT、Transformer、attention、self-attention 機制、seq2seq 架構，紮穩大型語言模型的深度學習建模技術（《跟 NVIDIA 學深度學習》修訂版）
$327

大語言模型認識與應用
~~$594~~ $564

語言之舞：大語言模型應用實戰全書
$402

大語言模型極速入門：技術與應用
~~$474~~ $450

大模型核心技術與應用 (微課視頻版)
~~$299~~ $284

生成式人工智能應用
~~$270~~ $256

生成式人工智能素養與應用

LLM 大語言模型｜2書75折詳見活動內容 »

78折
~~$690~~ $538

零基礎玩轉 LLM 應用全攻略：Python × No-Code 實作 AI 開發超簡單（iThome鐵人賽系列書）
79折
~~$790~~ $624

大型語言模型應用實戰：從 Prompt Engineering 到 Agentic RAG 與 MCP
78折
~~$500~~ $390

大模型時代：從 ChatGPT 一枝獨秀到全面開戰的 AI 賽局
79折
~~$980~~ $774

業界實戰親授 - 大型語言模型微調、最佳化、佈署一次到位
79折
~~$880~~ $695

深度學習最佳入門與專題實戰：自然語言處理、大型語言模型與強化學習篇
79折
~~$780~~ $616

AIGC 大型語言模型 - 個人應用到企業實戰立刻上手
79折
~~$790~~ $624

讓 LLM 飛起來的工具使用 - AI Agent MCP 協議開發、標準、應用
79折
~~$880~~ $695

AI Agent 手刻首選 - 使用 LangChain 親手實作 LLM 大型商業專案
79折
~~$620~~ $489

LLMOps 打造穩定運行的大型語言模型系統 (LLMOps: Managing Large Language Models in Production)
79折
~~$880~~ $695

實用 DeepSeek 技術 - 開發真正可用的 LLM 應用程式
7折
~~$650~~ $455

AI 程式設計、深度學習與 LLM 入門到精通：PyTorch × GPT × Transformer × LLaMA 實作指南（iThome鐵人賽系列書）
79折
~~$1,250~~ $987

LLM 工程師開發手冊 (LLM Engineer's Handbook: Master the art of engineering large language models from concept to production)
79折
~~$760~~ $600

AI Agent 智能工作流：設計與自動化全實戰
79折
~~$880~~ $695

不再是 ChatBot - 最新 AI Agent 代理建構
79折
~~$680~~ $537

最新 AI 開發範式 - Agent 多重智慧體自動產生應用
79折
~~$680~~ $537

LangChain 開發手冊 -- OpenAI × LCEL 表達式 × Agent 自動化流程 × RAG 擴展模型知識 × 圖形資料庫 × LangSmith 除錯工具
79折
~~$980~~ $774

LLM 語意理解與生成技術完全開發 (Hands-On Large Language Models)
79折
~~$980~~ $774

LLM × 網路爬蟲終極實戰：n8n 串接資料爬取 × Qdrant × RAG 打造本機 AI Agent
79折
~~$780~~ $616

Node.js 與 LLM 原理與實務：AI 應用程式開發
79折
~~$980~~ $774

知道你的下一筆訂單 - 使用 LLM
79折
~~$980~~ $774

更少 GPU 卻更強 - LLM 輕量化壓縮及加速訓練
79折
~~$750~~ $592

AI Agent 自動化流程超 Easy -- 不寫程式 No Code 聰明完成樣樣事
79折
~~$750~~ $592

Ollama 本地 AI 全方位攻略：命令列功能、五大主題測試、RAG、Vibe Coding、MCP，一本搞定所有實戰應用
VIP 95折
~~$588~~ $558

AI傳媒學：大模型助力傳媒行業應用與創新
7折
~~$680~~ $476

深談 AWS 雲端上的 AI Agent：系統化學習 AWS-AI 證照，協助企業管理 AI Agent

簡體書拿來曬2本75折詳見活動內容 »

VIP 95折
~~$534~~ $507

編譯原理, 2/e (Compilers : Principles, Techniques, and Tools, 2/e)
VIP 95折
~~$594~~ $564

深度學習之 TensorFlow：入門、原理與進階實戰
85折
$402

Essential C++ (簡體中文版)
VIP 95折
~~$774~~ $735

TCP/IP 詳解 (捲1)：協議 (TCP/IP Illustrated, Volume 1 : The Protocols, 2/e)
85折
$402

Go 並發編程實戰, 2/e
VIP 95折
~~$474~~ $450

機器人學導論, 4/e (Introduction to Robotics: Mechanics and Control, 4/e)
85折
$402

深入淺出 Vue.js
85折
$351

實用機器學習 (Real-world Machine Learning)
85折
$504

深度探索 C++ 對像模型 (Inside the C++ Object Model)
85折
$300

區塊鏈項目開發指南
85折
$402

原子教你玩 STM32 (庫函數版第2版)
85折
$402

Spring Security 實戰
85折
$611

嵌入式 Linux 基礎教程, 2/e (Embedded Linux Primer: A Practical Real-World Approach, 2/e)
85折
$504

MySQL 技術內幕－InnoDB 存儲引擎, 2/e
85折
$448

PADS 9.5 實戰攻略與高速 PCB 設計
85折
$244

基於 Bootstrap 和 Knockout.js 的 ASP.NET MVC 開發實戰 (ASP.Net MVC 5 with Bootstrap and Knockout.Js: Building Dynamic, Responsive Web Applications)
85折
$265

深入淺出 USB 系統開發 : 基於 ARM Cortex-M3
85折
$402

Redis 設計與實現
VIP 95折
~~$354~~ $336

FPGA 原理和結構
VIP 95折
~~$474~~ $450

TCP/IP 網絡編程
75折
$445

數據分析與機器學習(基於R語言)
85折
$652

深度學習推薦系統 2.0
75折
$400

移動通信系統架構設計
VIP 95折
~~$528~~ $501

自動駕駛汽車 BEV 感知算法
50折
$207

區塊鏈技術進階與實戰

商品描述

本書採用理論與實訓案例相結合的形式，深入淺出地介紹了大模型的基礎知識。本書共分為8章，內容涵蓋大模型的基礎知識、傳統語言模型基礎知識、神經網絡基礎知識、大模型的主要技術、大模型的微調與部署、大模型的應用，以及面對的挑戰和未來發展等。在講解理論知識的同時，輔以實訓案例，聚焦核心技術與應用，引領AI技術新潮流本書不僅適合作為高等院校人工智能、計算機科學與技術或相關專業學習大模型的入門教材，也適合從事相關工作的人工智能愛好者和工程師學習閱讀。

作者簡介

史衛亞，理學博士，副教授，電氣和電子工程師協會（IEEE）會員，中國計算機協會（CCF）會員。2009年獲得覆旦大學計算機應用專業博士學位。2015-2016年在美國北卡羅來納大學做訪問學者，現執教於河南工業大學信息科學與工程學院。主要研究方向為機器學習、數據庫、圖像和視頻處理、人工智能和模式識別等。先後在國內外核心期刊及國際會議上發表論文30多篇，其中SCI論文5篇，EI論文12篇。參加多項國家自然基金、河南省科技攻關項目，並作為主持人參與開發國內某上市燃氣企業收費系統、用戶管理系統、地理信息系統等多個應用項目。

目錄大綱

第1章大模型概述
1.1 大模型概念及其發展
1.1.1 大模型基本概念
1.1.2 大模型的發展
1.1.3 大模型的分類
1.2 大規模語言模型的興起
1.3 大規模語言模型的發展歷程
1.3.1 大規模語言模型的定義
1.3.2 大規模語言模型的發展
1.3.3 大規模語言模型的主要類型
1.3.4 大規模語言模型的應用領域
1.4 大規模語言模型的特點及存在的問題
1.4.1 大規模語言模型的特點
1.4.2 大規模語言模型的湧現
1.4.3 存在的問題
1.5 視覺大模型
1.5.1 視覺大模型的發展
1.5.2 視覺大模型的主要應用
1.6 多模態大模型
1.6.1 多模態大模型的發展
1.6.2 多模態大模型的主要應用
1.7 案例實訓
1.8 本章小結
1.9 課後習題
第2章語言模型基礎
2.1 統計語言模型
2.1.1 統計語言模型的定義
2.1.2 語言模型的評估指標
2.2 N-gram模型
2.2.1 N-gram模型數學基礎
2.2.2 N-gram例子
2.3 數據稀疏性與平滑技術
2.3.1 數據稀疏性
2.3.2 平滑技術
2.4 詞袋模型
2.4.1 詞袋模型的定義和構建步驟
2.4.2 詞袋模型的應用
2.5 案例實訓
2.5.1 實訓項目1：使用N-gram模型來判斷一個句子的合法性
2.5.2 實訓項目2：使用詞袋模型計算文本相似度
2.6 本章小結
2.7 課後習題
第3章神經網絡語言模型
3.1 神經網絡基礎
3.1.1 感知機
3.1.2 Sigmoid神經元
3.1.3 神經網絡架構
3.1.4 神經網絡原理
3.2 循環神經網絡
3.2.1 循環神經網絡
3.2.2 循環神經網絡的定義
3.2.3 循環神經網絡的結構及原理
3.2.4 優缺點及應用場景
3.3 長短時記憶網絡
3.3.1 輸入門、遺忘門和輸出門
3.3.2 LSTM模型原理
3.4 詞向量表示Word2Vec
3.4.1 Word2Vec的定義
3.4.2 CBOW和Skip-Gram
3.4.3 Word2Vec優化策略
3.5 案例實訓——基於LSTM的情感分類案例
3.6 本章小結
3.7 課後習題
第4章大模型的技術發展
4.1 Transformer模型介紹
4.2 自註意力機制
4.3 多頭註意力
4.4 位置編碼與掩碼
4.4.1 位置編碼
4.4.2 掩碼
4.5 Transformer模型的優化與變種
4.6 案例實訓
4.6.1 實訓項目1：基於Transformer模型的中英文翻譯系統
4.6.2 實訓項目2：搭建基礎的Transformer模型中英文翻譯系統
4.7 本章小結
4.8 課後習題
第5章預訓練語言模型
5.1 預訓練語言模型概述
5.1.1 預訓練語言模型的概念
5.1.2 預訓練語言模型的基本原理
5.1.3 預訓練語言模型的關鍵技術
5.1.4 預訓練語言模型的應用場景
5.2 BERT系列模型
5.2.1 BERT模型的基本架構
5.2.2 模型微調
5.3 GPT系列模型
5.3.1 GPT發展歷程
5.3.2 GPT模型的基本架構
5.3.3 GPT模型的訓練
5.3.4 GPT版本的主要改進
5.4 ChatGPT模型
5.4.1 ChatGPT的訓練過程
5.4.2 ChatGPT的應用場景
5.5 其他大規模預訓練模型
5.6 案例實訓
5.7 本章小結
5.8 課後習題
第6章大模型的微調與部署·
6.1 數據集與預處理
6.1.1 數據集的選擇
6.1.2 數據集的來源
6.1.3 數據集格式
6.1.4 數據集預處理
6.2 模型微調策略
6.2.1 指令微調
6.2.2 全微調
6.2.3 參數高效微調
6.3 提示工程
6.3.1 提示工程的定義
6.3.2 提示工程的關鍵要素
6.3.3 提示工程的其他技巧
6.3.4 提示工程的實際應用示例
6.3.5 提示工程的挑戰與未來展望
6.4 檢索增強生成
6.4.1 為什麼要引入檢索增強生成
6.4.2 檢索增強生成的步驟
6.4.3 檢索增強生成與微調的關系
6.5 模型壓縮
6.6 模型部署
6.7 大模型的評估與測試
6.7.1 大模型的評估
6.7.2 大模型的測試
6.8 LangChain框架
6.9 大模型應用開發的整體流程
6.9.1 大模型開發需要關註的問題
6.9.2 大模型開發的一般流程
6.10 案例實訓
6.10.1 實訓項目1：通義千問大模型的部署
6.10.2 實訓項目2：ChatGLM3-6B大模型的部署
6.11 本章小結
6.12 課後習題
第7章大模型的應用
7.1 自然語言生成
7.2 問答系統
7.3 對話系統
7.4 專業領域的應用
7.4.1 法律領域
7.4.2 教育領域
7.4.3 金融領域
7.4.4 醫療領域
7.4.5 科學研究領域
7.4.6 工程技術領域
7.5 圖像大模型的應用
7.5.1 安防監控
7.5.2 自動駕駛
7.5.3 醫療診斷
7.5.4 零售與電商
7.5.5 智慧農業
7.5.6 更多創新應用
7.6 基於大模型的智能體
7.6.1 智能體

人工智能大模型導論

史衛亞 劉田園 劉婉月