邊做邊學深度強化學習:PyTorch 程序設計實踐

[日]小川雄太郎(Yutaro ogawa)著

買這商品的人也買了...

商品描述

PyTorch是基於Python的張量和動態神經網絡,作為近年來較為火爆的深度學習框架,它使用強大的GPU能力,提供極高的靈活性和速度。
本書面向普通大眾,指導讀者以PyTorch為工具,在Python中實踐深度強化學習。讀者只需要具備一些基本的編程經驗和基本的線性代數知識即可讀懂書中內容,通過實現具體程序來掌握深度強化學習的相關知識。
本書內容:
介紹監督學習、非監督學習和強化學習的基本知識。
通過走迷宮任務介紹三種不同的算法(策略梯度法、Sarsa和Q學習)。
使用Anaconda設置本地PC,在倒立擺任務中實現強化學習。
使用PyTorch實現MNIST手寫數字分類任務。
實現深度強化學習的最基本算法DQN。
解釋繼DQN之後提出的新的深度強化學習技術(DDQN、Dueling Network、優先經驗回放和A2C等)。
使用GPU與AWS構建深度學習環境,採用A2C再現消磚塊游戲。