強化學習與最優控制

[美]德梅萃·P. 博賽卡斯(Dimitri P. Bertsekas) 著

  • 強化學習與最優控制-preview-1
  • 強化學習與最優控制-preview-2
  • 強化學習與最優控制-preview-3
強化學習與最優控制-preview-1

買這商品的人也買了...

商品描述

本書的目的是考慮大型且具有挑戰性的多階段決策問題,這些問題原則上可以通過動態規劃和最優控制來解決,但它們的精確解決方案在計算上是難以處理的。本書討論依賴於近似的解決方法,以產生具有足夠性能的次優策略。這些方法統稱為增強學習,也可以叫做近似動態規劃和神經動態規劃等。 本書的主題產生於最優控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界,並架設一座具有任一領域背景的專業人士都可以訪問的橋梁。