大話大語言模型

王符偉 曹宇

  • 出版商: 機械工業
  • 出版日期: 2025-05-01
  • 售價: $594
  • 語言: 簡體中文
  • 頁數: 242
  • ISBN: 7111778693
  • ISBN-13: 9787111778691
  • 相關分類: LangChain
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

大語言模型作為AI領域的明星,憑借其強大的語言理解和生成能力,正深刻地改變著人們的生活與工作。其興起得益於預訓練和生成式AI技術的發展,未來將在多領域發揮重要作用,但同時也面臨隱私、倫理等挑戰。 本書全面介紹大語言模型(Large Language Model,LLM)的前世今生、工作原理、應用實踐及未來趨勢。全書共4篇:基礎篇追溯了大語言模型的起源與興起,深度揭秘了其工作原理,並對當前現狀與研發競賽進行深入分析,同時展望了其未來發展前景。進階篇聚焦於模型規模化、提示工程、思維鏈推理等關鍵技術,詳細介紹了以ChatGPT為代表的大語言模型背後的技術原理,並探討問答系統在實際應用中的落地實踐。高階篇深入剖析了Transformer架構與預訓練模型的核心機制,探討微調技巧在提升模型性能中的作用,以及大語言模型在多領域的應用實踐,同時構建和完善了大語言模型的API生態體系。展望篇探討了大語言模型如何重塑因特網格局,驅動各行業創新升級及其面臨的社會挑戰與應對策略,展望了以DeepSeek為代表的大語言模型對未來技術發展與人們生活方式可能帶來的深遠變革。 本書適合AI從業者、研究人員及對大語言模型感興趣的讀者閱讀。

作者簡介

王符偉 人工智能領域專家,IT與藝術融合兩棲圖書作者。擅長將深奧晦澀的技術,以 匠心的插畫形式進行生動拆解,讓覆雜的技術變得趣味橫生、易於理解。 讀者在探索技術的旅途中,感悟生活的哲理與智慧,體驗科技與藝術交融的獨特魅力。 曹宇 九三學社社員、副教授,現就職於上海城建職業學院,深耕科研與教學工作近二十年。兼任上海九三學社市社製造專工委委員、碩士研究生導師及 職稱評審委專家等職務。長期專註於計算機應用技術領域,在教學與研究上成果斐然。成功主持多個企業級項目,在專業領域發表數十篇學術論文。已出版《分佈式應用開發框架研究》《Sprinud Alibaba 與 Kubernetes 微服務容器化實踐》等十餘部專著。

目錄大綱

序言1
序言2
前言
基礎篇 初識大語言模型
1 大語言模型是什麽(瞭解AI時代大語言模型的前世今生)2
1.1 大語言模型什麽時候突然走進我們的視野2
1.2 追溯大語言模型的前世3
1.3 預訓練模型的興起:AI進化的方向6
1.4 生成式AI時代的到來:大語言模型“ ”9
2 大語言模型是如何工作的(解密大語言模型的工作原理)22
2.1 大語言模型:放大版的生成式AI22
2.2 大語言模型的左膀右臂:微調與提示25
2.3 大語言模型+:AI平臺時代的到來31
2.4 大語言模型生態的繁榮:第三方框架與軟件庫的持續發展與完善34
2.5 開源大語言模型:驅動未來AI騰飛的靈魂37
3 深度剖析大語言模型的現狀與研發競賽(企業與科研院所的競相角逐與創新探索)40
3.1 AI技術的持續創新與突破40
3.2 加速發展+突破想象力的AI產品不斷湧現41
3.3 企業:資金與數據的雙重驅動42
3.4 科研院所:學術與技術的深度融合43
3.5 國產大語言模型的開發及競爭的意義44
3.6 未來競爭的焦點45
3.7 基準測試:揭秘大語言模型的性能密碼47
進階篇 與模型互動
4 模型規模化效應:評估模型性能指標(選擇適用的模型規模,實現資源優化配置)53
4.1 如何衡量模型的規模53
4.2 權衡FLOPS與Accuracy58
4.3 模型的選擇策略60
5 語境內學習:利用提示工程有效提升服務(利用提示控制語言模型,推動智能系統的應用)62
5.1 走近提示工程62
5.2 提示工程驅使語言模型“ 化”65
5.3 懂“提示”的AI會“驅逐”程序員嗎67
5.4 熟悉幾種具體的提示形式71
6 思維鏈(CoT)推理:加強文本邏輯和連貫性(提升模型的語言理解和生成水平)75
6.1 趣聊思維鏈推理,讓AI 聰明 有邏輯75
6.2 巧用思維鏈,改善LLM推理能力77
6.3 提高思維鏈推理的穩健性80
6.4 思考樹(ToT):進化版的思維鏈81
7 指令微調器:優化模型在特定任務中的表現(提供高效的智能解決方案)84
7.1 有效利用已有的數據集84
7.2 與“指令微調”容易混淆的技術85
7.3 指令微調存在的問題和挑戰87
8 人類反饋強化學習:實現個性化和協同學習(利用人類反饋實現模型學習的精準性和個性化,促進人機協同合作)89
8.1 強化學習的獎勵機制89
8.2 獎勵標準的考量91
8.3 獎勵標簽能否AI化92
9 ChatGPT熱潮:深度解析其學習來源和問答精度(探究ChatGPT的學習數據和黑匣子技術,提升人機交互質量)94
9.1 LLM的學習數據從哪裡來94
9.2 LLM通過深度學習提高精度95
9.3 LLM生成的文章很自然100
9.4 LLM也懂巧妙措辭嗎102
9.5 LLM的語言風格很文雅103
10 問答系統實踐:將ChatGPT融入大語言模型應用的 地位(文檔檢索模型,實現智能化和個性化應用效果的 體驗)105
10.1 問答系統是什麽105
10.2 問答系統的基本類型108
10.3 包含文檔檢索的問答系統110
10.4 將文檔檢索模型用於專業問答112
高階篇 模型應用與實踐
11 深度解析Transformer核心機制:從自註意力機制到文本生成(Transformer推動自然語言處理技術進步)118
11.1 Transformer工作原理118
11.2 詞嵌入,文本的數值化表示120
11.3 神經網絡中的詞嵌入應用125
11.4 註意力機制,聚焦關鍵信息128
11.5 趣解Query-Key-Value機制130
11.6 Transformer的文本生成能力141
12 預訓練語言模型解析:GPT、RoBERTa、T5(透視預訓練語言模型的豐富表達與跨語言能力)144
12.1 文字預測的過程144
12.2 GPT:文本生成的鼻祖150
12.3 BERT?RoBERTa:文本生成的新思路152
12.4 T5:模型融合的全新範式154
12.5 模型如何應對多語言任務156
12.6 中文處理策略:微觀視角的分詞160
13 模型微調深入分析:揭秘自然語言處理任務(情感分析、自然語言推理、語義相似度和語境多項選擇的微調技巧)164
13.1 大語言模型擅長的基本任務164
13.2 情感分析:本質是文本分類166
13.3 自然語言推理:機器理解文本的邏輯思維挑戰169
13.4 微調與語義相似度的結合:智能的“雙重奏”171
13.5 多項選擇問答:打造智能問答高手173
13.6 LoRA微調策略174
14 摘要生成:提高信息獲取效率的精練技術(探討如何提高信息獲取效率,助力知識傳播與創新)176
14.1 摘要生成的基本概念176
14.2 面向查詢VS非面向查詢178
15 命名實體識別:助力多領域NLP應用的信息提取(深度挖掘文本中有價值的信息,為多領域應用提供強大支持)180
15.1 什麽是命名實體識別180
15.2 有哪些基本任務182
15.3 解決任務的基本方法185
16 語句嵌入:優化文本處理與理解技術(發掘語句嵌入的應用潛力,提升智能系統的服務能力)189
16.1 什麽是語句嵌入189
16.2 解鎖語義相似度計算,賦能智能問答190
17 大語言模型API框架生態:打造智能應用部署新範式(基於RAG、LangChain和分佈式的創新工具與生態系統建設)192
17.1 為什麽要重視API框架生態192
17.2 RAG:結合信息檢索的方法創新194
17.3 RAG對大語言模型進化的影響196
17.4 LangChain登場:智鏈地球村199
17.5 LlamaIndex:輕松打造個性化問答聊天201
17.6 LM Studio:你的私人AI實驗室203
17.7 分佈式學習:多GPU與多節點訓練204
展望篇 迎接大語言模型
18 大語言模型對未來因特網的影響(大語言模型技術將推動新一代技術平臺的形成)208
18.1 新一代技術平臺的構建208
18.2 因特網交互體驗的重塑210
19 大語言模型在各行業的應用前景(大語言模型在醫療、金融、教育等垂直行業的創新應用和潛力)212
19.1 醫療與AI跨越式融合與創新212
19.2 AI病理診斷與未來健康215
19.3 AI走近焦慮抑鬱防線217
19.4 AI為下一代教育提供有效建議221
19.5 AI無雇員超市的興起222
19.6 AI語音產品與人類的積極互動223
20 大語言模型時代的社會挑戰與應對(大語言模型應用可能帶來隱私安全、社會倫理與公平等問題)225
20.1 不是所有的數據都有權獲取225
20.2 不能因為是AI就與倫理無關226
20.3 AI可以涉足“公平性”任務嗎228
21 大語言模型技術的發展趨勢(展望大語言模型未來的技術突破)230
21.1 AI監控街道交通真的很有效嗎230
21.2 AI解析通緝犯特徵231
22 大語言模型對人類生活的影響(大語言模型技術如何改變人們的日常生活、工作、交流方式)233
23 深探智能:DeepSeek大模型技術的新里程( 中文AI新紀元,開啟人機共生新篇章)235
23.1 破繭而出:DeepSeek的誕生背景235
23.2 智芯躍遷:技術解碼與創新突破236
23.3 智啟未來:應用圖景與社會影響238
參考文獻242