Python 強化學習實戰 : 應用 OpenAI Gym 和 TensorFlow 精通強化學習和深度強化學習
蘇達桑.拉維尚迪蘭
- 出版商: 機械工業
- 出版日期: 2018-12-14
- 售價: $414
- 貴賓價: 9.5 折 $393
- 語言: 簡體中文
- 頁數: 203
- 裝訂: 平裝
- ISBN: 7111612884
- ISBN-13: 9787111612889
-
相關分類:
Reinforcement 強化學習、DeepLearning 深度學習、TensorFlow
立即出貨
買這商品的人也買了...
-
$796深度學習 (Deep Learning)
-
$474$450 -
$450$356 -
$474$450 -
$301scikit learn機器學習:常用算法原理及編程實戰
-
$403深入理解 TensorFlow 架構設計與實現原理
-
$480$456 -
$580$493 -
$620$527 -
$379Python 深度學習實戰:75個有關神經網絡建模、強化學習與遷移學習的解決方案 (Python Deep Learning Cookbook: Over 75 practical recipes on neural network modeling, reinforcement learning, and transfer learning using Python)
-
$607強化學習
-
$480$408 -
$1,380$1,311 -
$374Python 深度學習:基於 TensorFlow
-
$360$353 -
$534$507 -
$550$435 -
$520$411 -
$500$395 -
$768$730 -
$505TensorFlow 與捲積神經網絡從算法入門到項目實戰
-
$422強化學習:原理與Python實現
-
$857強化學習, 2/e (Reinforcement Learning: An Introduction, 2/e)
-
$1,125Applied Reinforcement Learning with Python: With Openai Gym, Tensorflow, and Keras
-
$505白話強化學習與 PyTorch
商品描述
強化學習是一種重要的機器學習方法,在智能體及分析預測等領域有許多應用。本書共13章,主要包括強化學習的各種要素,即智能體、環境、策略和模型以及相應平臺和庫;Anaconda、Docker、OpenAIGym、Universe和TensorFlow等安裝配置;馬爾可夫鏈和馬爾可夫過程及其與強化學習問題建模之間的關系,動態規劃的基本概念;蒙特卡羅方法以及不同類型的蒙特卡羅預測和控制方法;時間差分學習、預測、離線/在線策略控制等;多臂賭博機問題以及相關的各種探索策略方法;深度學習的各種基本概念和RNN、LSTM、CNN等神經網絡;深度強化學習算法DQN,以及雙DQN和對抗網絡體系結構等改進架構;DRQN以及DARQN;A3C網絡的基本工作原理及架構;策略梯度和優化問題;*後介紹了強化學習的*新進展以及未來發展。