人工智能:計算 Agent 基礎, 2/e (Artificial Intelligence: Foundations of Computational Agents, 2/e)

David L.Poole,Alan K.Mackworth

買這商品的人也買了...

商品描述

本書是人工智能領域的經典導論書籍,新版對符號方法和非符號方法進行了廣泛討論,這些知識是理解當前和未來主要人工智能方法的基礎。理論結合實踐的講解方式使得本書更易於學習,對於想要瞭解AI並準備跨入該領域的讀者來說,本書將是必不可少的。
——Robert Kowalski,倫敦帝國理工學院
本書清晰呈現了AI領域的全貌,從邏輯基礎到學習、表示、推理和多智能體系統的新突破均有涵蓋。作者將AI看作眾多技術的集成,一層一層地講解構建智能體所需的所有技術。盡管包羅甚廣,但本書的選材標準頗高,最終納入書中的技術都是極具應用前景和發展潛力的,因此讀之備感收獲滿滿。
——Guy Van den Broeck,加州大學洛杉磯分校

重要更新和特色:
優化篇章結構,增加關於機器學習的內容,討論了與機器學習和AI相關的社會及倫理問題;摒棄先講關系語言的做法,改為後講關系方法,更利於知識的呈現和理解;更新代碼示例,並增加了一些練習。
提出智能體的單一設計空間的概念,從簡單的智能體開始,逐步引入十個維度的復雜性,通過模塊化方式降低理論學習的難度,並結合自主送貨機器人等四個應用實例來展開實踐。
在宏觀層面,搭建了一個連貫的知識框架,利用多維度的設計空間引導讀者縱觀大局;在細節層面,聚焦於基礎技術而非復雜技術,為讀者未來的進階學習及實戰打下堅實的基礎。
本書網站http://artint.info提供豐富的學習資源,包括可免費下載的Python代碼和PPT等。

作者簡介

[加]大衛·L.普爾(David L.Poole)不列顛哥倫比亞大學計算機科學系教授,計算智能實驗室主管。
他是加拿大人工智能協會(CAIAC)和人工智能促進協會(AAAI)會士。
曾獲CAIAC 2013年終身成就獎,曾任人工智能不確定性協會(AUAI)主席。


 [加]阿蘭·K.麥克沃斯(Alan K.Mackworth)不列顛哥倫比亞大學計算機科學系榮休教授。
他是CAIAC和AAAI會士,以及加拿大高等研究院(CIFAR)和加拿大皇家學會(RSC)院士。
曾任國際人工智能聯合會議(IJGAI)、AAAI和CAIAC主席。


黃智瀕,計算機系統結構博士,北京郵電大學計算機學院講師。
長期從事機器學習、超大規模並行計算、GPU加速計算以及三維計算機視覺和深度學習架構方面的研究。


白鵬,博士,中國航天空氣動力技術研究院研究員、博士生導師,航天科技集團公司學術技術帶頭人,《空氣動力學學報》編委。
長期從事飛行器空氣動力學特性評估與氣動總體設計領域的科研工作。
曾榮獲部級科技進步獎(5次)、航天貢獻獎及航天基金獎。
獲國家發明專利20餘項,出版學術專著2部,在國內外學術期刊和AIAA等重要國際學術會議上發表論文100餘篇。

目錄大綱

譯者序
前言
致謝
第一部分 世界中的智能體:什麽是智能體?如何創建智能體?
第1章 人工智能與智能體2
 1.1 什麽是人工智能2
  1.1.1 人工智能和自然智能3
 1.2 人工智能簡史5
  1.2.1 與其他學科的關系7
 1.3 環境中的智能體7
 1.4 設計智能體8
  1.4.1 設計時間計算、離線計算和在線計算8
  1.4.2 任務10
  1.4.3 定義解決方案11
  1.4.4 表示12
 1.5 智能體設計空間14
  1.5.1 模塊性14
  1.5.2 規劃視野14
  1.5.3 表示15
  1.5.4 計算限制16
  1.5.5 學習17
  1.5.6 不確定性18
  1.5.7 偏好19
  1.5.8 智能體數量19
  1.5.9 交互性20
  1.5.10 各維度的相互作用20
 1.6 原型應用21
  1.6.1 自主送貨機器人22
  1.6.2 診斷助手24
  1.6.3 智能輔導系統25
  1.6.4 交易智能體27
  1.6.5 智能家居28
 1.7 本書概覽29
 1.8 回顧29
 1.9 參考文獻和進一步閱讀30
 1.10 練習31
第2章 智能體的體系結構與層次控制32
 2.1 智能體32
 2.2 智能體系統33
  2.2.1 智能體的功能33
 2.3 層級控制36
 2.4 用推理行動42
  2.4.1 智能體建模世界42
  2.4.2 知識和行動43
  2.4.3 設計時間計算和離線計算44
  2.4.4 在線計算45
 2.5 回顧46
 2.6 參考文獻和進一步閱讀46
 2.7 練習47
第二部分 確定性推理、規劃與學習
第3章 搜索解決方案50
 3.1 以搜索的方式解決問題50
 3.2 狀態空間51
 3.3 圖搜索53
  3.3.1 形式化圖搜索53
 3.4 通用搜索算法55
 3.5 無信息搜索策略57
  3.5.1 廣度優先搜索57
  3.5.2 深度優先搜索59
  3.5.3 迭代深化62
  3.5.4 最低代價優先搜索64
 3.6 啟發式搜索65
  3.6.1 A搜索66
  3.6.2 設計啟發式函數69
 3.7 搜索空間的修剪70
  3.7.1 環修剪70
  3.7.2 多路徑修剪70
  3.7.3 搜索策略小結72
 3.8 更復雜的搜索73
  3.8.1 分支定界73
  3.8.2 搜索的方向75
  3.8.3 動態規劃77
 3.9 回顧79
 3.10 參考文獻和進一步閱讀80
 3.11 練習80
第4章 約束推理83
 4.1 可能世界、變量和約束83
  4.1.1 變量和世界83
  4.1.2 約束86
  4.1.3 約束滿足問題87
 4.2 生成和測試算法88
 4.3 使用搜索求解CSP88
 4.4 一致性算法89
 4.5 域分割93
 4.6 變量消除94
 4.7 局部搜索96
  4.7.1 迭代最佳改進98
  4.7.2 隨機算法98
  4.7.3 局部搜索的變體99
  4.7.4 評估隨機算法102
  4.7.5 隨機重啟104
 4.8 基於種群的方法104
 4.9 優化器106
  4.9.1 系統化的優化方法108
  4.9.2 用於優化的局部搜索110
 4.10 回顧111
 4.11 參考文獻和進一步閱讀112
 4.12 練習112
第5章 命題與推理115
 5.1 命題115
  5.1.1 命題演算的語法115
  5.1.2 命題演算的語義116
 5.2 命題約束119
  5.2.1 用於一致性算法的子句形式120
  5.2.2 在局部搜索中利用命題結構121
 5.3 命題確定子句121
  5.3.1 問題和答案123
  5.3.2 證明124
 5.4 知識表示問題129
  5.4.1 背景知識和觀察129
  5.4.2 查詢用戶130
  5.4.3 知識層面的解釋131
  5.4.4 知識層面的調試133
 5.5 反證法137
  5.5.1 霍恩子句137
  5.5.2 假設與沖突138
  5.5.3 基於一致性的診斷139
  5.5.4 用假設和霍恩子句進行推理140
 5.6 完備知識假設143
  5.6.1 非單調推理145
  5.6.2 否定作為失敗的證明過程146
 5.7 溯因法148
 5.8 因果模型152
 5.9 回顧153
 5.10 參考文獻和進一步閱讀153
 5.11 練習154
第6章 確定性規劃161
 6.1 狀態、動作、目標的表示161
  6.1.1 顯式狀態空間表示162
  6.1.2 STRIPS表示163
  6.1.3 基於特徵的動作表示164
  6.1.4 初始化狀態和目標166
 6.2 前向規劃166
 6.3 回歸規劃168
 6.4 CSP規劃169
  6.4.1 動作特徵171
 6.5 偏序規劃173
 6.6 回顧175
 6.7 參考文獻和進一步閱讀176
 6.8 練習176
第7章 有監督機器學習179
 7.1 學習問題179
 7.2 有監督學習181
  7.2.1 評估預測值183
  7.2.2 誤差類型187
  7.2.3 無輸入特徵的點估算189
 7.3 有監督學習的基本模型190
  7.3.1 學習決策樹191
  7.3.2 線性回歸和分類195
 7.4 過擬合200
  7.4.1 偽計數202
  7.4.2 正則化203
  7.4.3 交叉驗證204
 7.5 神經網絡與深度學習207
 7.6 復合模型211
  7.6.1 隨機森林212
  7.6.2 集成學習212
 7.7 基於案例的推理214
 7.8 實現精煉假設空間的學習216
  7.8.1 版本空間學習217
  7.8.2 可能近似正確的學習219
 7.9 回顧221
 7.10 參考文獻和進一步閱讀221
 7.11 練習222
第三部分 不確定性推理、學習與行動
第8章 不確定性推理228
 8.1 概率228
  8.1.1 概率的語義229
  8.1.2 概率的公理230
  8.1.3 條件概率232
  8.1.4 期望值236
  8.1.5 信息237
 8.2 獨立性238
 8.3 信念網絡239
  8.3.1 觀察和查詢241
  8.3.2 構造信念網絡241
 8.4 概率推理246
  8.4.1 信念網絡的變量消去247
  8.4.2 表示條件概率和因子253
 8.5 序貫概率模型255
  8.5.1 馬爾可夫鏈256
 8.5.2 隱馬爾可夫模型257
  8.5.3 監控和平滑的算法261
  8.5.4 動態信念網絡262
  8.5.5 時間粒度263
  8.5.6 語言的概率模型263
 8.6 隨機模擬268
  8.6.1 單變量採樣268
  8.6.2 信念網絡的前向採樣269
  8.6.3 拒絕採樣270
  8.6.4 似然加權271
  8.6.5 重要性採樣272
  8.6.6 粒子濾波273
  8.6.7 馬爾可夫鏈蒙特卡羅275
 8.7 回顧276
 8.8 參考文獻和進一步閱讀276
 8.9 練習277
第9章 不確定性規劃283
 9.1 偏好和效用284
  9.1.1 理性公理284
  9.1.2 因子化效用288
  9.1.3 前景理論290
 9.2 一次性決策291
  9.2.1 單階段決策網絡294
 9.3 序貫決策296
  9.3.1 決策網絡296
 9.3.2 策略299
  9.3.3 決策網絡的變量消去300
 9.4 信息和控制的價值303
 9.5 決策過程305
  9.5.1 策略308
  9.5.2 價值迭代310
  9.5.3 策略迭代313
  9.5.4 動態決策網絡314
  9.5.5 部分可觀察決策過程316
 9.6 回顧317
 9.7 參考文獻和進一步閱讀317
 9.8 練習318
第10章 不確定性學習324
 10.1 概率學習324
  10.1.1 學習概率324
  10.1.2 概率分類器326
  10.1.3 決策樹的MAP學習330
  10.1.4 描述長度331
 10.2 無監督學習332
  10.2.1 k-均值332
  10.2.2 用於軟聚類的期望最大化335
 10.3 學習信念網絡338
  10.3.1 學習概率338
  10.3.2 隱藏變量339
  10.3.3 缺失值340
  10.3.4 結構學習340
  10.3.5 信念網絡學習的一般情況341
 10.4 貝葉斯學習341
 10.5 回顧345
 10.6 參考文獻和進一步閱讀345
 10.7 練習345
第11章 多智能體系統347
 11.1 多智能體框架347
 11.2 博弈的表示348
  11.2.1 博弈的標準形式348
  11.2.2 博弈的擴展形式349
  11.2.3 多智能體決策網絡351
 11.3 完美信息計算策略352
 11.4 不完美信息推理354
  11.4.1 計算納什均衡359
 11.5 群體決策360
 11.6 機制設計361
 11.7 回顧363
 11.8 參考文獻和進一步閱讀363
 11.9 練習364
第12章 學習行動366
 12.1 強化學習問題366
 12.2 進化算法368
 12.3 時間差分369
 12.4 Q-學習370
 12.5 探索和利用371
 12.6 評估強化學習算法372
 12.7 同策學習373
 12.8 基於模型的強化學習375
 12.9 使用特徵的強化學習377
  12.9.1 線性函數近似的SARSA377
 12.10 多智能體強化學習379
  12.10.1 完美信息游戲379
  12.10.2 學會協作379
 12.11 回顧383
 12.12 參考文獻和進一步閱讀383
 12.13 練習383
第四部分 基於個體和關系的推理、學習與行動
第13章 個體與關系386
 13.1 利用關系結構386
 13.2 符號和語義387
 13.3 Datalog:一種關系規則語言388
  13.3.1 基礎Datalog的語義390
  13.3.2 解釋變量392
  13.3.3 帶變量的查詢395
 13.4 證明與替換397
  13.4.1 實例和替換397
  13.4.2 帶變量的自下而上的程序398
  13.4.3 合一化400
  13.4.4 帶變量的確定性解析401
 13.5 函數符號403
  13.5.1 帶函數符號的證明程序406
 13.6 自然語言中的應用408
  13.6.1 在無上下文的語法中使用確定子句409
  13.6.2 增強語法412
  13.6.3 用於非終止的構建結構412
  13.6.4 罐裝的文本輸出413
  13.6.5 強制執行限制因素414
  13.6.6 構建數據庫的自然語言接口415
  13.6.7 限制418
 13.7 相等性419
 13.7.1 允許相等性斷言419
  13.7.2 唯一名稱假設420
 13.8 完備知識假設422
  13.8.1 完備知識假設證明程序425
 13.9 回顧426
 13.10 參考文獻和進一步閱讀426
 13.11 練習427
第14章 本體論與知識庫系統431
 14.1 知識共享431
 14.2 靈活的表示432
  14.2.1 選擇個體和關系432
  14.2.2 圖形化表示434
  14.2.3 類435
 14.3 本體論和知識共享437
  14.3.1 統一資源標識符442
  14.3.2 描述邏輯442
  14.3.3 頂層本體448
 14.4 實現知識庫系統450
  14.4.1 基礎語言和元語言450
  14.4.2 一個普通的元解釋器452
  14.4.3 拓展基礎語言453
  14.4.4 深度受限搜索454
  14.4.5 建立證明樹的元解釋器455
  14.4.6 延遲目標455
 14.5 回顧456
 14.6 參考文獻和進一步閱讀457
 14.7 練習457
第15章 關系規劃、學習與概率推理461
 15.1 個體和關系的規劃461
  15.1.1 情境演算461
  15.1.2 事件演算467
 15.2 關系學習468
  15.2.1 結構化學習:歸納邏輯編程468
  15.2.2 學習隱藏屬性:協作過濾472
 15.3 統計關系型人工智能476
  15.3.1 關系概率模型476
 15.4 回顧483
 15.5 參考文獻和進一步閱讀484
 15.6 練習484
第五部分 回顧與展望
第16章 回顧與展望488
 16.1 復雜性維度的回顧488
 16.2 社會和道德後果491
 16.3 參考文獻和進一步閱讀495
 16.4 練習495
附錄A 數學基礎與標記496
參考文獻
 
參考文獻為網絡資源,請訪問華章網站www.hzbook.com下載。——編輯註