Reinforcement Learning|強化學習深度解析 (繁體中文版) (Reinforcement Learning: An Introduction, 2/e)
Richard S. Sutton, Andrew G. Barto 許士文、卓信宏 譯
- 出版商: 碁峰 開學書展2書75折
- 出版日期: 2021-04-27
- 定價: $1,200
- 售價: 8.5 折 $1,020
- 語言: 繁體中文
- 頁數: 592
- 裝訂: 平裝
- ISBN: 9865027194
- ISBN-13: 9789865027193
-
相關分類:
Reinforcement、DeepLearning、Reinforcement
- 此書翻譯自: Reinforcement Learning: An Introduction, 2/e (Hardcover)
-
相關翻譯:
強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e) (簡中版)
立即出貨 (庫存 > 10)
買這商品的人也買了...
-
$857深度學習 -
Reinforcement Learning: An Introduction, 2/e (Hardcover)$1,750$1,715 -
大數據分析與資料挖礦, 2/e$700$686 -
深度學習 (Deep Learning)(繁體中文版)$1,200$1,020 -
動手做深度強化學習 (Deep Reinforcement Learning Hands-On)$690$538 -
$250機器學習線性代數基礎 (Python 語言描述) -
特徵工程不再難:資料科學新手也能輕鬆搞定! (Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems)$520$406 -
深度學習的數學地圖 -- 用 Python 實作神經網路的數學模型 (附數學快查學習地圖)$580$458 -
GAN 對抗式生成網路 (GANs in Action: Deep learning with Generative Adversarial Networks)$750$675 -
強化式學習:打造最強 AlphaZero 通用演算法$780$702 -
深度強化式學習 (Deep Reinforcement Learning in Action)$1,000$790 -
Deep Learning 3|用 Python 進行深度學習框架的開發實作$780$616 -
白話演算法!培養程式設計的邏輯思考 (Grokking Algorithms: An illustrated guide for programmers and other curious people)$520$468 -
遊戲設計的藝術:架構世界、開發介面、創造體驗,聚焦遊戲設計與製作的手法與原理 (The Art of Game Design: A Book of Lenses, 3/e)$990$842 -
機器學習設計模式 (Machine Learning Design Patterns: Solutions to Common Challenges in Data Preparation, Model Building, and Mlops)$680$537 -
核心開發者親授!PyTorch 深度學習攻略 (Deep Learning with Pytorch)$1,000$790 -
深度學習的 16 堂課:CNN + RNN + GAN + DQN + DRL, 看得懂、學得會、做得出! (Deep Learning Illustrated: A Visual, Interactive Guide to Artificial Intelligence)$620$558 -
強化學習導論$400$360 -
Keras 大神歸位:深度學習全面進化!用 Python 實作 CNN、RNN、GRU、LSTM、GAN、VAE、Transformer$1,200$948 -
深度強化學習圖解$834$792 -
白話機器學習$780$616 -
一本精通 - PyQt5 & PyQt6 軟體介面開發$890$703 -
Deep Learning 4|用 Python 進行強化學習的開發實作$680$537 -
最強 AI 投資分析:打造自己的股市顧問機器人,股票趨勢分析×年報解讀×選股推薦×風險管理$750$592 -
演算法導論, 4/e (Introduction to Algorithms, 4/e)$1,800$1,422
碁峰開學書展 兩書75折(部分除外) 詳見活動內容 »
-
75折
Python 初學特訓班:從快速入門、主流應用到 AI 全面實戰, 6/e (附超過500分鐘影音教學/範例程式)$490$368 -
79折
Software Architecture in Practice, 4/e (繁體中文版)$780$616 -
75折
Code:隱藏在電腦軟硬體底下的秘密 (第二版) (Code: The Hidden Language of Computer Hardware and Software, 2/e)$680$510 -
79折
戰勝 C語言, 3/e$600$474 -
79折
超人 60 DAYS 特攻本 -- 數位科技概論與應用 (114年統測適用)$280$221 -
79折
Hello!Python 程式設計$450$356 -
79折
翻倍效率工作術 - 不會就太可惜的 Excel × ChatGPT 自動化應用 (附範例/Bing Chat與ChatGPT使用差異影音/指令速查表)$390$308 -
79折
用 mBlock 玩 mBot 機器人互動程式設計 (最新加強版)$300$237 -
79折
重構|改善既有程式的設計, 2/e (繁中平裝版)(Refactoring: Improving The Design of Existing Code, 2/e)$800$632 -
79折
玩轉 AI 新視界|文案、繪圖、簡報、社群自動化經營全能實戰(附:關鍵教學影片)$520$411 -
75折
凡人也能懂的白話人工智慧演算法 (Grokking Artificial Intelligence Algorithms)$580$435 -
79折
Arduino 自走車最佳入門與應用 -- 打造輪型機器人輕鬆學, 2/e$600$474 -
79折
AI 時代的 Python 高效學習書 - ChatGPT 程式助理新思維$550$434 -
75折
一週學會 Google Analytics 4|迅速打下分析基礎$690$517 -
79折
約耳再談軟體 (More Joel on Software)$580$458 -
79折
AutoCAD 2024 電腦繪圖與絕佳設計表現 -- 室內設計基礎 (附600分鐘影音教學/範例檔)$580$458 -
79折
API 設計模式|簡化整合的訊息交換技術 (Patterns for API Design: Simplifying Integration with Loosely Coupled Message Exchanges)$850$671 -
75折
Power BI 大數據實戰應用 -- 零售 x 金融$680$510 -
79折
Code That Fits in Your Head|軟體工程的啟發式方法$580$458 -
79折
量子計算實戰 (Practical Quantum Computing for Developers)$580$458 -
75折
AI 繪圖完全攻略|Midjourney、Leonardo.Ai、DALL·E、ChatGPT、Copilot、Canva GPT、MS Designer$580$435 -
85折
像程式設計師這樣思考|鍛鍊程式設計思維 (Think Like a Programmer: An Introduction to Creative Problem Solving)$400$340 -
79折
Linux 核心除錯實務 (Linux Kernel Debugging: Leverage proven tools and advanced techniques to effectively debug Linux kernels and kernel modules)$800$632 -
79折
約耳趣談軟體 (Joel on Software)$580$458 -
79折
Soft Skills 軟實力|軟體開發人員的生存手冊, 2/e (Soft Skills: The Software Developer's Life Manual, 2/e)$580$458
商品描述
針對強化學習的關鍵概念和演算法,提供清晰而簡單的說明
什麼是強化學習
強化學習是學習該做什麼(如何將當前情形映射到動作上),以便最大化一個獎勵訊號數值。學習者不會被告知要採取哪些動作,而是必須透過嘗試來發現哪些動作會產生最大的回報。在最有趣和最具挑戰性的案例中,動作不僅會影響當下的獎勵,同時也會影響下一個情境,並且影響後續所有的獎勵。試誤搜尋和延遲獎勵這兩個特性,是強化學習中的兩個最重要的區別特徵。
本書精采內容包括:
.涵蓋所有強化學習演算法的核心概念
.解決有限馬可夫決策問題的三種基本方法
.近似最佳策略進行控制的方式
.介紹並分析資格痕跡演算法的機制
.強化學習與心理學和神經科學之間的關係
.強化學習的相關應用與未來強化學習研究中一些正在進行的前瞻技術
專家推薦
"這本書是強化學習的聖經,鑑於該領域的蓬勃發展,新版特別及時。不管是學生、研究人員、從業人是,只要對強化學習感興趣的人,都應該收藏一本。"
-Pedro Domingos, 華盛頓大學教授、《大演算》作者
"所有研究強化學習的學者,都曾受到本書第一版的啟發,第二版保證讓大家更滿意。新版的內容大幅增加,新版涵蓋的內容更深更廣,而且依然保留解說簡單直接的特色。"
-Csaba Szepesvari, 阿爾伯塔大學教授、DeepMind研究科學家
"我推薦這本書給所有想要認識機器學習的人。第二版涵蓋了當今最關鍵的演算法與理論,以實際的應用來解說概念,範圍從控制機器人到如何打敗世界頂尖的棋手,並從心理學與神經科學的角度探討演算法與人類學習之間的基本關連。"
-Tom Mitchell, 卡內基梅隆大學教授
"強化學習領域的經典之作,強化學習是現代人工智慧的發展基礎。這是一本想要認真研究AI科技的人必讀的書。"
- Demis Hassabis, DeepMind聯合創始人兼CEO
"第二版的問世恰逢其時,如果您想了解強化學習這個領域,本書是最好的起點。我肯定會將這本書推薦給我的學生以及其他想要了解強化學習的研究人員"
-- Yoshua Bengio, 《深度學習》作者、蒙特婁大學教授
<序>
由本書的第一版出版至今的二十年見證了人工智慧領域的巨大進步, 這在很大程度上得益於機器學習的進步,也包括了強化學習的進步。雖然計算能力的突破是這些進步中的一部分,但理論與演算法上的新進展同樣功不可沒。面對這樣的進步,相較於1998年版本的再版顯得刻不容緩,於是我們在2012年開始了改版計畫。本書第二版的目標與第一版是一致的:針對強化學習的關鍵概念和演算法提供清晰而簡單的說明。這個版本依然是將重點專注於核心線上學習演算法,同時涵蓋一些日漸重要的新主題。
作者簡介
Richard S. Sutton
強化學習之父。阿爾伯塔大學計算科學教授和AITF強化學習和人工智能主席,同時也是DeepMind的傑出研究科學家。
Andrew G. Barto
馬薩諸塞大學阿姆赫斯特分校電腦與資訊科學學院的榮譽教授。
目錄大綱
第二版前言
第一版前言
符號摘要
第1章 導論
Part I 表格式解決方法
第2章 多搖臂式拉霸機
第3章 有限馬可夫決策過程
第4章 動態規劃
第5章 蒙地卡羅方法
第6章 時序差分學習
第7章 n 步自助法
第8章 表格式方法的規劃和學習
Part II 近似解決方法
第9章 on-policy 預測的近似方法
第10章 on-policy 控制的近似方法
第11章 *off-policy 的近似方法
第12章 資格痕跡
第13章 策略梯度方法
Part III 深入觀察
第14章 心理學
第15章 神經科學
第16章 應用和案例研究
第17章 前瞻技術
參考資料與文獻












