人工智能：現代方法（第4版）（上下冊）

Name: 人工智能：現代方法（第4版）（上下冊）
Price: 1129 TWD
Availability: InStock
Author: [美]斯圖爾特·羅素（Stuart Russell）[美]彼得·諾維格（Peter Norvig）
ISBN: 711559810X

[美]斯圖爾特·羅素（Stuart Russell）[美]彼得·諾維格（Peter Norvig）

預覽內頁

出版商: 人民郵電
出版日期: 2024-09-01
售價: $1,188
貴賓價: 9.5 折 $1,129
語言: 簡體中文
頁數: 864
ISBN: 711559810X
ISBN-13: 9787115598103
相關分類: Machine Learning、自駕車
此書翻譯自: Artificial Intelligence: A Modern Approach, 4/e (美國原版)

立即出貨

買這商品的人也買了...

~~$680~~ $666

演算法 (Levitin：Introduction to the Design and Analysis of Algorithms, 2/e)
~~$300~~ $270

共舞雷射
$301

精通數據科學算法 (Data Science Algorithms in a Week)
$653

算法分析導論, 2/e (An Introduction to the Analysis of Algorithms, 2/e)
~~$520~~ $468

VCSEL 技術原理與應用
~~$354~~ $336

人工智能算法捲1 基礎算法
~~$480~~ $379

圖解 Fintech 的知識與技術
~~$414~~ $393

人工智能算法捲2 受大自然啟發的算法
$297

可解釋機器學習：黑盒模型可解釋性理解指南
~~$474~~ $450

LoRa 物聯網通信技術
~~$1,460~~ $1,387

Artificial Intelligence: A Modern Approach, 4/e (IE-Paperback)
~~$780~~ $764

量子電腦應用與世界級競賽實務
~~$948~~ $901

可解釋人工智能導論
~~$894~~ $849

API 安全實戰 (API Security in Action)
$352

MATLAB 修煉之道：編程實例透析
~~$359~~ $341

AI 可解釋性 (Python語言版)
~~$768~~ $730

Python 可解釋AI（XAI）實戰
$602

因果推斷與機器學習
$912

圖神經網絡：基礎、前沿與應用
~~$588~~ $559

基於 MATLAB 與 FPGA 的圖像處理教程
$403

統計信仰：駕馭無序世界的元認知
$356

讓數據成為生產力 — 數據全生命周期管理
~~$539~~ $512

自然語言處理之 BERT 模型算法、架構和案例實戰
~~$720~~ $562

Docker 實戰 6堂課：56個實驗動手做，掌握 Linux 容器核心技術（iThome鐵人賽系列書）【軟精裝】
~~$780~~ $616

ChatGPT 4 + API 創新體驗 AI 世界邁向開發機器人程式王者歸來（全彩印刷）

商品描述

本書系統、深入地探討了人工智能（AI）領域的理論和實踐，以統一的風格將當今流行的人工智能思想和術語融合到引起廣泛關註的應用中，真正做到理論和實踐相結合。全書分7個部分，共28章，理論部分介紹了人工智能研究的主要理論和方法並追溯了兩千多年前的相關思想，內容主要包括邏輯、概率和連續數學，感知、推理、學習和行動，公平、信任、社會公益和安全；實踐部分完美地踐行了“現代”理念，實際應用選擇當下熱度較高的微電子設備、機器人行星探測器、擁有幾十億用戶的在線服務、AlphaZero、人形機器人、自動駕駛、人工智能輔助醫療等。本書適合作為高等院校人工智能相關專業本科生和研究生的教材，也可以作為相關領域專業人員的參考書。

作者簡介

斯图尔特·罗素（Stuart Russell），1986年他进入加利福尼亚大学伯克利分校，任计算机科学系教授，并曾担任系主任，人类兼容人工智能中心主任，他也是史密斯–扎德（Smith-Zadeh）工程系讲席教授。1990年，他获得了美国国家科学基金会（NSF）杰出青年科学家总统奖；1995年，他成为计算机与思想奖的获奖人之一。他是美国人工智能协会（AAAI）、美国计算机协会（ACM）和美国科学促进协会的会士，牛津大学瓦德汉学院的荣誉院士和安德鲁·卡内基（Andrew Carnegie）院士。2012年到2014年，他在巴黎担任布莱斯·帕斯卡（Blaise Pascal）主席。他在人工智能领域发表了300多篇论文，涉及范围广泛。

彼得·诺维格（Peter Norvig）曾任谷歌公司的研究总监、核心网络搜索算法的负责人。他曾与他人合作共同教授了一门有16万名学生注册的在线人工智能课程，帮助开启了当下的大规模在线公开课程的大幕。他曾担任美国宇航局艾姆斯研究中心计算科学部的负责人，负责人工智能和机器人学的研究和开发。他曾任南加利福尼亚大学的教授和加利福尼亚大学伯克利分校、斯坦福大学的教师。他是美国人工智能协会和美国计算机协会的会士，以及美国艺术与科学院和加利福尼亚科学院的院士。

两位作者共同获得了2016年首届AAAI/EAAI杰出教育家奖。

目錄大綱

第一部分人工智能基礎

第 1 章緒論 2

1.1 什麽是人工智能 2

1.1.1 類人行為：圖靈測試方法 3

1.1.2 類人思考：認知建模方法 3

1.1.3 理性思考：“思維法則”方法 4

1.1.4 理性行為：理性智能體方法 4

1.1.5 益機 5

1.2 人工智能的基礎 6

1.2.1 哲學 6

1.2.2 數學 8

1.2.3 經濟學 9

1.2.4 神經科學 10

1.2.5 心理學 12

1.2.6 電腦工程 13

1.2.7 控制理論與控制論 14

1.2.8 語言學 15

1.3 人工智能的歷史 16

1.3.1 人工智能的誕生（1943—1956） 16

1.3.2 早期熱情高漲，期望無限（1952—1969） 17

1.3.3 一些現實（1966—1973） 19

1.3.4 專家系統（1969—1986） 20

1.3.5 神經網絡的回歸（1986—現在） 22

1.3.6 概率推理和機器學習（1987—現在） 22

1.3.7 大數據（2001—現在） 23

1.3.8 深度學習（2011—現在） 24

1.4 目前的先進技術 24

1.5 人工智能的風險和收益 27

小結 30

參考文獻與歷史註釋 31

第 2 章智能體 32

2.1 智能體和環境 32

2.2 良好行為：理性的概念 34

2.2.1 性能度量 34

2.2.2 理性 35

2.2.3 全知、學習和自主 36

2.3 環境的本質 37

2.3.1 指定任務環境 37

2.3.2 任務環境的屬性 38

2.4 智能體的結構 41

2.4.1 智能體程序 41

2.4.2 簡單反射型智能體 42

2.4.3 基於模型的反射型智能體 44

2.4.4 基於目標的智能體 45

2.4.5 基於效用的智能體 46

2.4.6 學習型智能體 47

2.4.7 智能體程序的組件如何工作 49

小結 50

參考文獻與歷史註釋 51

第二部分問題求解

第 3 章通過搜索進行問題求解 54

3.1 問題求解智能體 54

3.1.1 搜索問題和解 55

3.1.2 問題形式化 56

3.2 問題示例 57

3.2.1 標準化問題 57

3.2.2 真實世界問題 59

3.3 搜索算法 61

3.3.1 最佳優先搜索 62

3.3.2 搜索數據結構 63

3.3.3 冗餘路徑 64

3.3.4 問題求解性能評估 65

3.4 無信息搜索策略 65

3.4.1 廣度優先搜索 66

3.4.2 Dijkstra 算法或一致代價搜索 67

3.4.3 深度優先搜索與內存問題 68

3.4.4 深度受限和迭代加深搜索 69

3.4.5 雙向搜索 712

3.4.6 無信息搜索算法對比 72

3.5 有信息（啟發式）搜索策略 73

3.5.1 貪心最佳優先搜索 73

3.5.2 A* 搜索 75

3.5.3 搜索等值線 77

3.5.4 滿意搜索：不可容許的啟發式

函數與加權 A* 搜索 79

3.5.5 內存受限搜索 80

3.5.6 雙向啟發式搜索 83

3.6 啟發式函數 85

3.6.1 啟發式函數的準確性對性能的影響 85

3.6.2 從鬆弛問題出發生成啟發式函數 86

3.6.3 從子問題出發生成啟發式函數：模式數據庫 87

3.6.4 使用地標生成啟發式函數 88

3.6.5 學習以更好地搜索 90

3.6.6 從經驗中學習啟發式函數 90

小結 90

參考文獻與歷史註釋 92

第 4 章復雜環境中的搜索 95

4.1 局部搜索和最優化問題 95

4.1.1 爬山搜索 96

4.1.2 模擬退火 98

4.1.3 局部束搜索 99

4.1.4 進化算法 99

4.2 連續空間中的局部搜索 102

4.3 使用非確定性動作的搜索 104

4.3.1 不穩定的真空吸塵器世界 105

4.3.2 與或搜索樹 106

4.3.3 反復嘗試 107

4.4 部分可觀測環境中的搜索 108

4.4.1 無觀測信息的搜索 108

4.4.2 部分可觀測環境中的搜索 111

4.4.3 求解部分可觀測問題 112

4.4.4 部分可觀測環境中的智能體 113

4.5 在線搜索智能體和未知環境 115

4.5.1 在線搜索問題 115

4.5.2 在線搜索智能體 117

4.5.3 在線局部搜索 118

4.5.4 在線搜索中的學習 119

小結 120

參考文獻與歷史註釋 121

第 5 章對抗搜索和博弈 124

5.1 博弈論 124

5.2 博弈中的優化決策 126

5.2.1 極小化極大搜索算法 127

5.2.2 多人博弈中的最優決策 128

5.2.3 α-β 剪枝 129

5.2.4 移動順序 131

5.3 啟發式 α-β 樹搜索 132

5.3.1 評價函數 132

5.3.2 截斷搜索 134

5.3.3 前向剪枝 135

5.3.4 搜索和查表 136

5.4 蒙特卡羅樹搜索 136

5.5 隨機博弈 139

5.6 部分可觀測博弈 142

5.6.1 四國軍棋：部分可觀測的國際象棋 142

5.6.2 紙牌游戲 144

5.7 博弈搜索算法的局限性 146

小結 147

參考文獻與歷史註釋 148

第 6 章約束滿足問題 152

6.1 定義約束滿足問題 152

6.1.1 問題示例：地圖著色 153

6.1.2 問題示例：車間作業調度 154

6.1.3 CSP 形式體系的變體 155

6.2 約束傳播：CSP 中的推斷 156

6.2.1 節點一致性 157

6.2.2 弧一致性 157

6.2.3 路徑一致性 158

6.2.4 k 一致性 158

6.2.5 全局約束 159

6.2.6 數獨 160

6.3 CSP 的回溯搜索 161

6.3.1 變量排序和值排序 163

6.3.2 交替進行搜索和推理 164

6.3.3 智能回溯：向後看 164

6.3.4 約束學習 166

6.4 CSP 的局部搜索 166

6.5 問題的結構 168

6.5.1 割集調整 169

6.5.2 樹分解 170

6.5.3 值對稱 171

小結 171

參考文獻與歷史註釋 172

第三部分知識、推理和規劃

第 7 章邏輯智能體 176

7.1 基於知識的智能體 176

7.2 wumpus 世界 178

7.3 邏輯 180

7.4 命題邏輯：一種非常簡單的邏輯 183

7.4.1 語法 183

7.4.2 語義 184

7.4.3 一個簡單的知識庫 185

7.4.4 一個簡單的推斷過程 186

7.5 命題定理證明 187

7.5.1 推斷與證明 188

7.5.2 通過歸結證明 190

7.5.3 霍恩子句與確定子句 194

7.5.4 前向鏈接與反向鏈接 194

7.6 高效命題模型檢驗 196

7.6.1 完備的回溯算法 196

7.6.2 局部搜索算法 198

7.6.3 隨機 SAT 問題概覽 199

7.7 基於命題邏輯的智能體 200

7.7.1 世界的當前狀態 200

7.7.2 混合智能體 203

7.7.3 邏輯狀態估計 204

7.7.4 用命題推斷進行規劃 205

小結 207

參考文獻與歷史註釋 208

第 8 章一階邏輯 211

8.1 回顧表示 211

8.1.1 思想的語言 212

8.1.2 結合形式語言和自然語言的優點 213

8.2 一階邏輯的語法和語義 215

8.2.1 一階邏輯模型 215

8.2.2 符號與解釋 216

8.2.3 項 218

8.2.4 原子語句 218

8.2.5 復合語句 218

8.2.6 量詞 219

8.2.7 等詞 222

8.2.8 數據庫語義 222

8.3 使用一階邏輯 223

8.3.1 一階邏輯的斷言與查詢 223

8.3.2 親屬關系論域 224

8.3.3 數、集合與列表 225

8.3.4 wumpus 世界 227

8.4 一階邏輯中的知識工程 228

8.4.1 知識工程的過程 229

8.4.2 電子電路論域 230

小結 233

參考文獻與歷史註釋 234

第 9 章一階邏輯中的推斷 236

9.1 命題推斷與一階推斷 236

9.2 合一與一階推斷 238

9.2.1 合一 239

9.2.2 存儲與檢索 240

9.3 前向鏈接 241

9.3.1 一階確定子句 242

9.3.2 簡單的前向鏈接算法 242

9.3.3 高效前向鏈接 244

9.4 反向鏈接 247

9.4.1 反向鏈接算法 247

9.4.2 邏輯編程 248

9.4.3 冗餘推斷和無限循環 249

9.4.4 Prolog 的數據庫語義 251

9.4.5 約束邏輯編程 251

9.5 歸結 252

9.5.1 一階邏輯的合取範式 252

9.5.2 歸結推斷規則 253

9.5.3 證明範例 254

9.5.4 歸結的完備性 256

9.5.5 等詞 258

9.5.6 歸結策略 260

小結 261

參考文獻與歷史註釋 262

第 10 章知識表示 265

10.1 本體論工程 265

10.2 類別與對象 267

10.2.1 物理組成 268

10.2.2 量度 269

10.2.3 對象：事物和物質 271

10.3 事件 272

10.3.1 時間 273

10.3.2 流和對象 275

10.4 精神對象和模態邏輯 275

10.5 類別的推理系統 278

10.5.1 語義網絡 278

10.5.2 描述邏輯 280

10.6 用默認信息推理 281

10.6.1 限定與默認邏輯 281

10.6.2 真值維護系統 283

小結 284

參考文獻與歷史註釋 285

第 11 章自動規劃 290

11.1 經典規劃的定義 290

11.1.1 範例領域：航空貨物運輸 291

11.1.2 範例領域：備用輪胎問題 292

11.1.3 範例領域：積木世界 292

11.2 經典規劃的算法 294

11.2.1 規劃的前向狀態空間搜索 294

11.2.2 規劃的反向狀態空間搜索 295

11.2.3 使用布爾可滿足性規劃 296

11.2.4 其他經典規劃方法 296

11.3 規劃的啟發式方法 297

11.3.1 領域無關剪枝 299

11.3.2 規劃中的狀態抽象 300

11.4 分層規劃 300

11.4.1 高層動作 301

11.4.2 搜索基元解 302

11.4.3 搜索抽象解 303

11.5 非確定性域的規劃和行動 307

11.5.1 無傳感器規劃 309

11.5.2 應變規劃 312

11.5.3 在線規劃 313

11.6 時間、調度和資源 315

11.6.1 時間約束和資源約束的表示 315

11.6.2 解決調度問題 316

11.7 規劃方法分析 318

小結 319

參考文獻與歷史註釋 320

第四部分不確定知識和不確定推理

第 12 章不確定性的量化 326

12.1 不確定性下的動作 326

12.1.1 不確定性概述 327

12.1.2 不確定性與理性決策 328

12.2 基本概率記號 329

12.2.1 概率是關於什麽的 329

12.2.2 概率斷言中的命題語言 330

12.2.3 概率公理及其合理性 333

12.3 使用完全聯合分佈進行推斷 334

12.4 獨立性 336

12.5 貝葉斯法則及其應用 337

12.5.1 應用貝葉斯法則：簡單實例 338

12.5.2 應用貝葉斯法則：合並證據 339

12.6 樸素貝葉斯模型 340

12.7 重游 wumpus 世界 342

小結 344

參考文獻與歷史註釋 345

第 13 章概率推理 348

13.1 不確定域的知識表示 348

13.2 貝葉斯網絡的語義 350

13.2.1 貝葉斯網絡中的條件獨立性關系 353

13.2.2 條件分佈的高效表示 354

13.2.3 連續變量的貝葉斯網絡 356

13.2.4 案例研究：汽車保險 358

13.3 貝葉斯網絡中的精確推斷 360

13.3.1 通過枚舉進行推斷 361

13.3.2 變量消元算法 363

13.3.3 精確推斷的復雜性 365

13.3.4 聚類算法 366

13.4 貝葉斯網絡中的近似推理 367

13.4.1 直接採樣方法 368

13.4.2 通過馬爾可夫鏈模擬進行推斷 372

13.4.3 編譯近似推斷 378

13.5 因果網絡 379

13.5.1 表示動作：do 操作 380

13.5.2 後門準則 382

小結 382

參考文獻與歷史註釋 383

第 14 章時間上的概率推理 388

14.1 時間與不確定性 388

14.1.1 狀態與觀測 389

14.1.2 轉移模型與傳感器模型 389

14.2 時序模型中的推斷 391

14.2.1 濾波與預測 392

14.2.2 平滑 394

14.2.3 尋找最可能序列 396

14.3 隱馬爾可夫模型 398

14.3.1 簡化矩陣算法 398

14.3.2 隱馬爾可夫模型示例：定位 400

14.4 卡爾曼濾波器 403

14.4.1 更新高斯分佈 403

14.4.2 簡單的一維示例 404

14.4.3 一般情況 406

14.4.4 卡爾曼濾波的適用範圍 407

14.5 動態貝葉斯網絡 408

14.5.1 構建動態貝葉斯網絡 409

14.5.2 動態貝葉斯網絡中的精確推斷 412

14.5.3 動態貝葉斯網絡中的近似推斷 413

小結 417

參考文獻與歷史註釋 418

第 15 章概率編程 421

15.1 關系概率模型 421

15.1.1 語法與語義 423

15.1.2 實例：評定玩家的技能等級 425

15.1.3 關系概率模型中的推斷 426

15.2 開宇宙概率模型 427

15.2.1 語義與語法 428

15.2.2 開宇宙概率模型的推斷 429

15.2.3 示例 430

15.3 追蹤復雜世界 433

15.3.1 示例：多目標跟蹤 433

15.3.2 示例：交通監控 436

15.4 作為概率模型的程序 436

15.4.1 示例：文本閱讀 437

15.4.2 語法與語義 438

15.4.3 推斷結果 438

15.4.4 結合馬爾可夫模型改進生成程序 439

15.4.5 生成程序的推斷 439

小結 440

參考文獻與歷史註釋 440

第 16 章做簡單決策 444

16.1 在不確定性下結合信念與願望 444

16.2 效用理論基礎 445

16.2.1 理性偏好的約束 445

16.2.2 理性偏好導致效用 447

16.3 效用函數 448

16.3.1 效用評估和效用尺度 448

16.3.2 金錢的效用 449

16.3.3 期望效用與決策後失望 451

16.3.4 人類判斷與非理性 452

16.4 多屬性效用函數 454

16.4.1 占優 455

16.4.2 偏好結構與多屬性效用 456

16.5 決策網絡 458

16.5.1 使用決策網絡表示決策問題 458

16.5.2 評估決策網絡 460

16.6 信息價值 460

16.6.1 簡單示例 460

16.6.2 完美信息的一般公式 461

16.6.3 價值信息的性質 462

16.6.4 信息收集智能體的實現 463

16.6.5 非短視信息收集 463

16.6.6 敏感性分析與健壯決策 464

16.7 未知偏好 465

16.7.1 個人偏好的不確定性 466

16.7.2 順從人類 467

小結 468

參考文獻與歷史註釋 469

第 17 章做復雜決策 473

17.1 序貫決策問題 473

17.1.1 時間上的效用 475

17.1.2 最優策略與狀態效用 477

17.1.3 獎勵規模 479

17.1.4 表示 MDP 480

17.2 MDP 的算法 482

17.2.1 價值迭代 482

17.2.2 策略迭代 485

17.2.3 線性規劃 487

17.2.4 MDP 的在線算法 487

17.3 老虎機問題 489

17.3.1 計算基廷斯指數 491

17.3.2 伯努利老虎機 492

17.3.3 近似最優老虎機策略 493

17.3.4 不可索引變體 493

17.4 部分可觀測MDP 495

17.5 求解POMDP 的算法 497

17.5.1 POMDP的價值迭代 497

17.5.2 POMDP的在線算法 500

小結 501

參考文獻與歷史註釋 502

第 18 章多智能體決策 505

18.1 多智能體環境的特性 505

18.1.1 單個決策者 505

18.1.2 多決策者 506

18.1.3 多智能體規劃 507

18.1.4 多智能體規劃：合作與協調 509

18.2 非合作博弈論 510

18.2.1 單步博弈：正則形式博弈 510

18.2.2 社會福利 513

18.2.3 重復博弈 517

18.2.4 序貫博弈：擴展形式 520

18.2.5 不確定收益與輔助博弈 525

18.3 合作博弈論 527

18.3.1 聯盟結構與結果 528

18.3.2 合作博弈中的策略 529

18.3.3 合作博弈中的計算 531

18.4 制定集體決策 533

18.4.1 在合同網中分配任務 533

18.4.2 通過拍賣分配稀缺資源 535

18.4.3 投票 539

18.4.4 議價 541

小結 544

參考文獻與歷史註釋 545

第五部分機器學習

第 19 章樣例學習 550

19.1 學習的形式 550

19.2 監督學習 552

19.3 決策樹學習 555

19.3.1 決策樹的表達能力 556

19.3.2 從樣例中學習決策樹 557

19.3.3 選擇測試屬性 559

19.3.4 泛化與過擬合 560

19.3.5 拓展決策樹的適用範圍 562

19.4 模型選擇與模型優化 563

19.4.1 模型選擇 564

19.4.2 從錯誤率到損失函數 566

19.4.3 正則化 567

19.4.4 超參數調整 568

19.5 學習理論 569

19.6 線性回歸與分類 572

19.6.1 單變量線性回歸 572

19.6.2 梯度下降 574

19.6.3 多變量線性回歸 575

19.6.4 帶有硬閾值的線性分類器 577

19.6.5 基於邏輯斯諦回歸的線性分類器 579

19.7 非參數模型 581

19.7.1 最近鄰模型 581

19.7.2 使用 k-d 樹尋找最近鄰 583

19.7.3 局部敏感哈希 584

19.7.4 非參數回歸 585

19.7.5 支持向量機 586

19.7.6 核技巧 589

19.8 集成學習 589

19.8.1 自助聚合法 590

19.8.2 隨機森林法 590

19.8.3 堆疊法 591

19.8.4 自適應提升法 592

19.8.5 梯度提升法 594

19.8.6 在線學習 595

19.9 開發機器學習系統 596

19.9.1 問題形式化 596

19.9.2 數據收集、評估和管理 597

19.9.3 模型選擇與訓練 601

19.9.4 信任、可解釋性、可說明性 601

19.9.5 操作、監控和維護 603

小結 604

參考文獻與歷史註釋 605

第 20 章概率模型學習 610

20.1 統計學習 610

20.2 完全數據學習 613

20.2.1 最大似然參數學習：離散模型 613

20.2.2 樸素貝葉斯模型 615

20.2.3 生成模型和判別模型 616

20.2.4 最大似然參數學習：連續模型 616

20.2.5 貝葉斯參數學習 618

20.2.6 貝葉斯線性回歸 620

20.2.7 貝葉斯網絡結構學習 622

20.2.8 非參數模型密度估計 623

20.3 隱變量學習：EM 算法 624

20.3.1 無監督聚類：學習混合高斯 625

20.3.2 學習帶隱變量的貝葉斯網絡參數值 627

20.3.3 學習隱馬爾可夫模型 630

20.3.4 EM 算法的一般形式 630

20.3.5 學習帶隱變量的貝葉斯網絡結構 631

小結 632

參考文獻與歷史註釋 632

第 21 章深度學習 635

21.1 簡單前饋網絡 636

21.1.1 網絡作為復雜函數 636

21.1.2 梯度與學習 639

21.2 深度學習的計算圖 640

21.2.1 輸入編碼 641

21.2.2 輸出層與損失函數 641

21.2.3 隱藏層 642

21.3 捲積網絡 643

21.3.1 池化與下採樣 646

21.3.2 捲積神經網絡的張量運算 646

21.3.3 殘差網絡 647

21.4 學習算法 648

21.4.1 計算圖中的梯度計算 649

21.4.2 批量歸一化 650

21.5 泛化 650

21.5.1 選擇正確的網絡架構 651

21.5.2 神經架構搜索 652

21.5.3 權重衰減 653

21.5.4 暫退法 653

21.6 循環神經網絡 654

21.6.1 訓練基本的循環神經網絡 655

21.6.2 長短期記憶 RNN 656

21.7 無監督學習與遷移學習 657

21.7.1 無監督學習 657

21.7.2 遷移學習和多任務學習 661

21.8 應用 662

21.8.1 視覺 662

21.8.2 自然語言處理 663

21.8.3 強化學習 663

小結 664

參考文獻與歷史註釋 664

第 22 章強化學習 668

22.1 從獎勵中學習 668

22.2 被動強化學習 670

22.2.1 直接效用估計 671

22.2.2 自適應動態規劃 671

22.2.3 時序差分學習 672

22.3 主動強化學習 674

22.3.1 探索 675

22.3.2 安全探索 677

22.3.3 時序差分 Q 學習 678

22.4 強化學習中的泛化 680

22.4.1 近似直接效用估計 680

22.4.2 近似時序差分學習 681

22.4.3 深度強化學習 682

22.4.4 獎勵函數設計 683

22.4.5 分層強化學習 683

22.5 策略搜索 686

22.6 學徒學習與逆強化學習 688

22.7 強化學習的應用 690

22.7.1 在電子游戲中的應用 690

22.7.2 在機器人控制中的應用 691

小結 692

參考文獻與歷史註釋 693

第六部分溝通、感知和行動

第 23 章自然語言處理 698

23.1 語言模型 698

23.1.1 詞袋模型 699

23.1.2 n 元單詞模型 700

23.1.3 其他 n 元模型 701

23.1.4 n 元模型的平滑 701

23.1.5 單詞表示 702

23.1.6 詞性標註 703

23.1.7 語言模型的比較 706

23.2 文法 707

23.3 句法分析 709

23.3.1 依存分析 711

23.3.2 從樣例中學習句法分析器 712

23.4 擴展文法 713

23.4.1 語義解釋 715

23.4.2 學習語義文法 717

23.5 真實自然語言的復雜性 717

23.6 自然語言任務 720

小結 722

參考文獻與歷史註釋 722

第 24 章自然語言處理中的深度學習 727

24.1 詞嵌入 727

24.2 自然語言處理中的循環神經網絡 730

24.2.1 使用循環神經網絡的語言模型 730

24.2.2 用循環神經網絡進行分類 732

24.2.3 自然語言處理任務中的 LSTM模型 733

24.3 序列到序列模型 733

24.3.1 註意力 735

24.3.2 解碼 736

24.4 Transformer 架構 737

24.4.1 自註意力 737

24.4.2 從自註意力到 Transformer 738

24.5 預訓練和遷移學習 739

24.5.1 預訓練詞嵌入 740

24.5.2 預訓練上下文表示 741

24.5.3 掩碼語言模型 742

24.6 最高水平（SOTA） 742

小結 745

參考文獻與歷史註釋 745

第 25 章電腦視覺 748

25.1 引言 748

25.2 圖像形成 749

25.2.1 無透鏡成像：針孔照相機 749

25.2.2 透鏡系統 751

25.2.3 縮放正交投影 752

25.2.4 光線與明暗 752

25.2.5 顏色 753

25.3 簡單圖像特徵 754

25.3.1 邊緣 755

25.3.2 紋理 757

25.3.3 光流 758

25.3.4 自然圖像分割 759

25.4 圖像分類 760

25.4.1 基於捲積神經網絡的圖像分類 761

25.4.2 捲積神經網絡對圖像分類問題

有效的原因 762

25.5 物體檢測 763

25.6 三維世界 766

25.6.1 多個視圖下的三維線索 766

25.6.2 雙目立體視覺 766

25.6.3 移動攝像機給出的三維線索 768

25.6.4 單個視圖的三維線索 769

25.7 電腦視覺的應用 769

25.7.1 理解人類行為 770

25.7.2 匹配圖片與文字 772

25.7.3 多視圖重建 773

25.7.4 單視圖中的幾何 774

25.7.5 生成圖片 775

25.7.6 利用視覺控制運動 778

小結 780

參考文獻與歷史註釋 781

第 26 章機器人學 785

26.1 機器人 785

26.2 機器人硬件 786

26.2.1 機器人的硬件層面分類 786

26.2.2 感知世界 787

26.2.3 產生運動 789

26.3 機器人學解決哪些問題 789

26.4 機器人感知 790

26.4.1 定位與地圖構建 791

26.4.2 其他感知類型 795

26.4.3 機器人感知中的監督學習與無監督學習 795

26.5 規劃與控制 796

26.5.1 構形空間 796

26.5.2 運動規劃 799

26.5.3 軌跡跟蹤控制 806

26.5.4 最優控制 809

26.6 規劃不確定的運動 810

26.7 機器人學中的強化學習 812

26.7.1 利用模型 812

26.7.2 利用其他信息 813

26.8 人類與機器人 814

26.8.1 協調 814

26.8.2 學習做人類期望的事情 817

26.9 其他機器人框架 820

26.9.1 反應式控制器 820

26.9.2 包容架構 821

26.10 應用領域 822

小結 825

參考文獻與歷史註釋 826

第七部分總結

第 27 章人工智能的哲學、倫理和安全性 832

27.1 人工智能的極限 832

27.1.1 由非形式化得出的論據 832

27.1.2 由能力缺陷得出的論據 833

27.1.3 數學異議 833

27.1.4 衡量人工智能 834

27.2 機器能真正地思考嗎 835

27.2.1 中文房間 835

27.2.2 意識與感質 836

27.3 人工智能的倫理 836

27.3.1 致命性自主武器 837

27.3.2 監控、安全與隱私 839

27.3.3 公平與偏見 841

27.3.4 信任與透明度 844

27.3.5 工作前景 845

27.3.6 機器人權利 847

27.3.7 人工智能安全性 848

小結 851

參考文獻與歷史註釋 852

第 28 章人工智能的未來 857

28.1 人工智能組件 857

28.2 人工智能架構 862

附錄 A 數學背景知識 865

附錄 B 關於語言與算法的說明 871

參考文獻 873