大語言模型基礎(微課視頻版)
周蘇,楊武劍
買這商品的人也買了...
-
$320$250 -
$203大數據分析 : 數據挖掘必備算法示例詳解
-
$454區塊鏈財稅管理與 Corda 開發指南
-
$474$450 -
$352敏捷測試從零開始
-
$414$393 -
$500$390 -
$714$678 -
$305機器學習 — 原理、算法與 Python 實戰 (微課視頻版)
-
$245Java 敏捷開發實踐
-
$894$849 -
$594$564 -
$594$564 -
$600$468 -
$450$356 -
$720$562 -
$500裝備體系貢獻率評估 — 理論、方法與應用
-
$505元宇宙通論
-
$690$545 -
$714$678 -
$650$507 -
$352大語言模型通識
-
$654$621 -
$479$455 -
$301自然語言處理——基於深度學習的理論和實踐(微課視頻版)
相關主題
商品描述
"大語言模型(簡稱大模型)是一種基於深度學習技術的先進人工智能模型,特別適用於理解和生成自然語言文本,它具有文生文、文生圖、文生視頻甚至未來的文生X等多種多模態形式。大模型的多功能性和通用性,使其能夠在未經專門訓練的情況下處理多種類型的自然語言任務。隨著技術的發展,大模型已經成為自然語言處理領域的重要基石,並持續推動著人工智能技術的進步和社會應用的拓展。學習大模型課程不僅有利於個人專業成長,更能對社會進步和技術創新產生積極影響。人工智能及其大模型技術,是每個高校學生甚至社會人必須關註、學習和重視的知識與現實。 本書介紹的大模型知識主要包括大模型基礎、模型與生成式AI、大模型架構、人工數據標註、大模型預訓練數據、大模型開發組織、提示工程與微調、強化學習方法、大模型智能體、大模型應用框架、技術倫理與限制、大模型產品評估等。 本書特色鮮明,易讀易學,適合高等院校電腦、大數據、人工智能等相關專業學生學習,也適合對人工智能以及大模型相關領域感興趣的讀者閱讀參考。 "
目錄大綱
目錄
第1章大模型基礎1
1.1人工智能基礎1
1.1.1人工智能的實現途徑1
1.1.2機器學習和深度學習2
1.1.3監督與無監督學習3
1.2大模型定義5
1.2.1模型預訓練和微調5
1.2.2大模型的特徵5
1.2.3大模型的優勢6
1.3大模型技術的形成6
1.3.1Blockhead思維實驗7
1.3.2大模型的歷史基礎7
1.3.3基於Transformer模型8
1.3.4大模型的世界模型問題9
1.3.5文化知識傳遞和語言支持10
1.4通用人工智能11
1.4.1什麽是通用人工智能11
1.4.2大模型與通用人工智能11
1.4.3人工智能生成內容12
【作業】13
【實踐與思考】瞭解典型的開源大模型14
第2章大模型與生成式AI17
2.1什麽是語言模型17
2.1.1語言模型的定義17
2.1.2註意力機制18
2.1.3開源還是閉源19
2.2大模型發展三階段19
2.2.1基礎模型階段20
2.2.2能力探索階段20
2.2.3突破發展階段20
2.3Transformer模型21
2.3.1Transformer過程21
2.3.2Transformer結構24
2.3.3Transformer模塊25
2.4生成式人工智能26
2.4.1生成式AI定義27
2.4.2生成式AI層次27
2.4.3生成式預訓練語言模型GPT29
【作業】30
【實踐與思考】基於ChatGPT的免費工具: ChatAI小組件32
第3章大模型架構36
3.1大模型生成原理36
3.1.1上下文學習37
3.1.2指令微調38
3.1.3零樣本/少樣本38
3.1.4深度學習架構38
3.1.5訓練策略及優化技術39
3.1.6所謂世界模型39
3.2多模態語言模型40
3.2.1多模態指令微調40
3.2.2多模態上下文學習41
3.2.3多模態思維鏈41
3.2.4大模型輔助視覺推理42
3.3大模型的結構42
3.3.1LLaMA的模型結構42
3.3.2LLaMA的註意力機制42
3.4應用技術架構44
3.4.1指令工程44
3.4.2函數調用44
3.4.3檢索增強生成44
3.4.4微調45
3.5OpenAI的Sora大模型45
3.5.1Sora技術報告分析45
3.5.2Sora的主要技術特點46
3.5.3Sora的模型訓練過程46
【作業】47
【實踐與思考】熟悉阿裡雲大模型“通義千問”49
第4章人工數據標註52
4.1知識表示方法52
4.1.1知識的概念52
4.1.2知識表示的定義53
4.1.3知識表示的過程54
4.2什麽是數據標註55
4.3數據標註分類55
4.3.1圖像標註56
4.3.2語音標註56
4.3.33D點雲標註57
4.3.4文本標註57
4.4制定標註規則58
4.5執行數據標註58
4.6標註團隊管理60
【作業】61
【實踐與思考】熟悉百度大模型“文心一言”63
第5章大模型預訓練數據67
5.1數據來源68
5.1.1通用數據68
5.1.2專業數據69
5.2數據處理70
5.2.1質量過濾70
5.2.2冗餘去除71
5.2.3隱私消除71
5.2.4詞元切分71
5.3數據影響分析72
5.3.1數據規模73
5.3.2數據質量73
5.4典型的開源數據集74
5.4.1Pile數據集74
5.4.2ROOTS數據集75
5.5訓練集、驗證集、測試集的異同77
5.5.1訓練、驗證與測試數據集的不同之處77
5.5.2訓練、驗證與測試數據集的相似之處78
5.6數據集面臨的挑戰79
5.6.1規模和質量待提升79
5.6.2大模型與數據集相輔相成80
5.6.3標準規範需健全80
5.6.4存儲性能待提高81
【作業】81
【實踐與思考】熟悉Globe Explorer智能搜索引擎83
第6章大模型開發組織86
6.1大模型開發流程86
6.2大模型的數據組織88
6.2.1數據採集89
6.2.2數據清洗和預處理89
6.2.3數據標註90
6.2.4數據集劃分90
6.2.5模型設計91
6.2.6模型初始化92
6.2.7模型訓練92
6.2.8模型驗證93
6.2.9模型保存93
6.2.10模型測試94
6.2.11模型部署94
6.3分而治之的思想95
6.3.1分佈式計算95
6.3.2消息傳遞接口(MPI)96
6.3.3MapReduce模型97
6.3.4批處理和流處理98
6.4分佈式訓練與策略98
6.4.1什麽是分佈式訓練99
6.4.2數據並行性100
6.4.3模型並行性101
6.4.4流水線並行性102
6.4.5混合並行103
6.4.6分佈式訓練集群架構103
【作業】104
【實踐與思考】熟悉科大訊飛大模型“訊飛星火認知”107
第7章提示工程與微調111
7.1什麽是提示工程111
7.1.1提示工程的原理111
7.1.2提示工程應用技術113
7.1.3提示的通用技巧114
7.2大模型為什麽要微調115
7.3提示學習和語境學習116
7.3.1提示學習116
7.3.2語境學習117
7.4上下文窗口擴展118
7.5指令數據的構建118
7.5.1手動構建指令119
7.5.2自動構建指令119
7.5.3開源指令數據集120
7.6微調及其PEFT流行方案120
7.6.1微調技術路線120
7.6.2提示微調120
7.6.3前綴微調121
7.6.4LoRA121
7.6.5QLoRA121
【作業】121
【實踐與思考】文生圖: 註冊使用Midjourney繪圖工具123
第8章強化學習方法126
8.1強化學習的概念126
8.1.1強化學習的定義126
8.1.2不同於監督和無監督學習128
8.1.3不同於傳統機器學習128
8.1.4大模型的強化學習129
8.1.5先驗知識與標註數據130
8.2強化學習基礎130
8.2.1基於模型與免模型環境131
8.2.2探索與利用131
8.2.3片段還是連續任務132
8.2.4網絡模型設計132
8.3強化學習分類133
8.3.1從獎勵中學習134
8.3.2被動與主動強化學習134
8.3.3學徒學習135
8.4深度強化學習135
【作業】137
【實踐與思考】熟悉文生視頻大模型Sora138
第9章大模型智能體143
9.1智能體和環境143
9.2智能體的良好行為144
9.2.1性能度量144
9.2.2理性145
9.3環境的本質146
9.3.1指定任務環境146
9.3.2任務環境的屬性147
9.4智能體的結構149
9.4.1智能體程序150
9.4.2學習型智能體151
9.4.3智能體組件的工作152
9.5構建大模型智能體153
9.6人工智能內容生成(AIGC)154
9.6.1內容孿生154
9.6.2內容編輯155
【作業】156
【實踐與思考】人形機器人創業獨角獸Figure AI158
第10章大模型應用框架160
10.1大模型哲學問題160
10.1.1組成性160
10.1.2天賦論與語言習得161
10.1.3語言理解與基礎162
10.1.4世界模型163
10.1.5知識傳遞和語言支持163
10.2大模型應用流程163
10.2.1確定需求大小164
10.2.2數據收集165
10.2.3數據集預處理166
10.2.4大模型預訓練166
10.2.5任務微調167
10.2.6部署167
10.3大模型應用場景167
10.3.1機器翻譯、文本理解與分析168
10.3.2自然語言生成168
10.3.3搜索與知識提取169
10.3.4代碼開發169
10.3.5檢測和預防網絡攻擊170
10.3.6虛擬助理和客戶支持170
10.3.7SEO關鍵詞優化170
10.4案例: Magic突破Q算法171
【作業】172
【實踐與思考】精通垃圾分類的ZenRobotics機器人173
第11章技術倫理與限制176
11.1人工智能面臨的倫理挑戰176
11.1.1人工智能與人類的關系176
11.1.2人與智能機器的溝通177
11.2數據隱私保護對策178
11.2.1數據主權和數據權問題178
11.2.2數據利用失衡問題179
11.2.3構建隱私保護倫理準則179
11.2.4健全道德倫理約束機制180
11.3人工智能倫理原則180
11.3.1職業倫理準則的目標180
11.3.2創新發展道德倫理宣言181
11.3.3歐盟可信賴的倫理準則182
11.4大模型的知識產權保護183
11.4.1大模型的訴訟案例183
11.4.2大模型生成內容的知識產權保護187
11.4.3尊重隱私,保障安全,促進開放187
11.4.4邊緣群體的數字平等188
【作業】188
【實踐與思考】完全由人工智能完成的視覺藝術品無法獲得版權190
第12章大模型產品評估192
12.1模型評估概述192
12.2大模型評估體系193
12.2.1知識與能力193
12.2.2倫理與安全194
12.2.3垂直領域評估197
12.3大模型評估實踐198
12.3.1基礎模型評估198
12.3.2學習模型評估198
12.4大模型產品對比199
12.5大模型的大趨勢202
【作業】203
【實踐與思考】大模型橫向對比測試實踐205
附錄A作業參考答案209
附錄B課程學習與實踐總結212
參考文獻216