強化學習實戰 — 從零開始製作 AlphaGo 圍棋 (微課視頻版)

劉佳

預覽內頁

出版商: 清華大學
出版日期: 2023-04-01
定價: $419
售價: 8.5 折 $356
語言: 簡體中文
頁數: 191
ISBN: 7302629692
ISBN-13: 9787302629696
相關分類: Reinforcement

立即出貨 (庫存 < 4)

強化學習實戰 — 從零開始製作 AlphaGo 圍棋 (微課視頻版)-preview-1

買這商品的人也買了...

$355

強化學習入門：從原理到實踐
$499

Python 深度學習異常檢測 : 使用 Keras 和 PyTorch
$402

商用機器學習：數據科學實踐
~~$780~~ $663

強化式學習：打造最強 AlphaZero 通用演算法
$469

深度學習與圍棋
$378

深度學習處理結構化數據實戰
$426

動手學強化學習
$458

基於機器學習的工作流活動推薦
$662

深度強化學習
$601

因果推斷與機器學習
$464

深度學習在醫學圖像中的應用
~~$348~~ $330

機器學習 (MATLAB版)
$407

Python 統計機器學習
$555

3D 科研繪圖與學術圖表繪製從入門到精通
$407

機器學習與深度學習（基於Python實現）
$407

程序員的制勝技
~~$594~~ $564

LaTeX 論文寫作教程
~~$534~~ $507

CPU 眼裡的 C/C++
$355

時間黑客：用數據分析做個明白人
$458

R語言醫學多元統計分析
~~$539~~ $512

自然語言處理與醫療文本的知識抽取
$453

深度強化學習理論及其在機器人運動控制中的應用實踐
$300

光纖傳感器及其應用技術
~~$479~~ $455

深度強化學習
~~$680~~ $537

讓 AI 好好說話！從頭打造 LLM (大型語言模型) 實戰秘笈

簡體書拿來曬2本75折詳見活動內容 »

VIP 95折
~~$534~~ $507

編譯原理, 2/e (Compilers : Principles, Techniques, and Tools, 2/e)
VIP 95折
~~$594~~ $564

深度學習之 TensorFlow：入門、原理與進階實戰
85折
$402

Essential C++ (簡體中文版)
VIP 95折
~~$774~~ $735

TCP/IP 詳解 (捲1)：協議 (TCP/IP Illustrated, Volume 1 : The Protocols, 2/e)
85折
$402

Go 並發編程實戰, 2/e
VIP 95折
~~$474~~ $450

機器人學導論, 4/e (Introduction to Robotics: Mechanics and Control, 4/e)
85折
$402

深入淺出 Vue.js
85折
$351

實用機器學習 (Real-world Machine Learning)
85折
$504

深度探索 C++ 對像模型 (Inside the C++ Object Model)
85折
$300

區塊鏈項目開發指南
85折
$402

原子教你玩 STM32 (庫函數版第2版)
85折
$402

Spring Security 實戰
85折
$611

嵌入式 Linux 基礎教程, 2/e (Embedded Linux Primer: A Practical Real-World Approach, 2/e)
85折
$504

MySQL 技術內幕－InnoDB 存儲引擎, 2/e
85折
$448

PADS 9.5 實戰攻略與高速 PCB 設計
85折
$244

基於 Bootstrap 和 Knockout.js 的 ASP.NET MVC 開發實戰 (ASP.Net MVC 5 with Bootstrap and Knockout.Js: Building Dynamic, Responsive Web Applications)
85折
$265

深入淺出 USB 系統開發 : 基於 ARM Cortex-M3
85折
$402

Redis 設計與實現
VIP 95折
~~$354~~ $336

FPGA 原理和結構
VIP 95折
~~$474~~ $450

TCP/IP 網絡編程
75折
$445

數據分析與機器學習(基於R語言)
85折
$652

深度學習推薦系統 2.0
75折
$400

移動通信系統架構設計
VIP 95折
~~$528~~ $501

自動駕駛汽車 BEV 感知算法
50折
$207

區塊鏈技術進階與實戰

商品描述

本書通過基礎理論和算法實踐相結合，循序漸進地介紹了人工智能領域中的常見算法，並以圍棋遊戲作為媒介，全面、系統地介紹了人工智能算法的實現方法，並通過Keras和PyTorch框架實踐人工智能算法中的深度強化學習內容。全書共10章，分別介紹圍棋的基礎知識、如何製作圍棋軟件、傳統棋類智能算法、神經網絡入門知識、如何實現圍棋智能體程序、通用化圍棋智能體程序、策略梯度算法、基於價值的深度學習網絡(DQN)算法、ActorCritic算法、如何實踐AlphaGo和AlphaZero等知識，書中的每個知識點都有相應的實現代碼和實例。本書主要面向廣大從事數據分析、機器學習、數據挖掘或深度學習的專業人員，從事高等教育的專任教師，高等學校的在讀學生及相關領域的廣大科研人員。

目錄大綱

目錄

第一部分電腦圍棋的基礎知識和傳統的智能算法

第1章圍棋：黑白的世界

1.1什麼是圍棋

1.2圍棋的規則

1.3勝負的判定

1.4圍棋棋手的棋力

1.5電腦眼中的圍棋

1.5.1SGF文件

1.5.2GTP

第2章實現一個圍棋軟件

2.1軟件版本

2.2圍棋軟件的組成

2.3佐布裡斯特散列

2.4圍棋智能體

2.5圍棋的棋盤

2.6引入裁判

2.7讓智能體下棋

第3章傳統的棋類智能

3.1極小化極大算法

3.2AlphaBeta剪枝算法

3.3棋類局面評估

3.4蒙特卡羅模擬

3.4.1蒙特卡羅算法

3.4.2蒙特卡羅樹搜索

3.4.3蒙特卡羅算法改進

3.4.4需要註意的問題

3.5監督學習

3.6傳統方法的討論

第二部分基於神經網絡的機器學習

第4章機器學習入門

4.1人工神經網絡

4.1.1神經元

4.1.2常見的激活函數

4.1.3多層感知器

4.1.4捲積神經網絡

4.1.5反向傳播算法

4.1.6小批量訓練法

4.1.7殘差網絡

4.1.8多層感知器的應用示例

4.1.9捲積網絡對圖片進行多分類的應用示例

4.2優化神經網絡

4.2.1訓練集、驗證集、測試集以及交叉驗證

4.2.2欠擬合與過擬合

4.2.3損失函數的正則化

4.2.4精確率和召回率的權衡

4.3其他人工智能方法簡介

4.3.1K近鄰算法

4.3.2樸素貝葉斯法

4.3.3決策樹

4.3.4Boosting算法/Bagging算法

4.3.5支持向量機

4.3.6隨機場算法

4.3.7傳統智能算法所面臨的挑戰

第5章第一個圍棋智能體

5.1電子圍棋棋譜

5.2HDF5文件結構

5.3數據模型

5.4獲取訓練樣本

5.5代碼演示

第6章通用化圍棋智能體程序

6.1在網絡上發布圍棋智能體

6.2本地對戰

6.2.1電腦的圍棋語言

6.2.2圍棋的對弈圖形界面

6.2.3圍棋引擎

6.3讓圍棋智能體自己去網上下棋

第三部分強化學習

第7章策略梯度

第8章深度價值網絡

8.1傳統的QLearning算法

8.1.1原始版QLearning

8.1.2原始版QLearning計算時的優化

8.1.3QLearning的變種Sarsa

8.1.4Sarsa的進化Sarsaλ

8.2在神經網絡上應用DQN

第9章ActorCritic算法

第10章AlphaGo和AlphaZero

10.1AlphaGo的結構和訓練流程

10.2AlphaZero的結構與訓練流程

10.3可行的優化

附錄AKeras入門

附錄BPyTorch入門

附錄C反向傳播算法

C.1命名約定

C.2正文

C.3進一步討論

C.4拓展

附錄D不同地區的圍棋規則

D.1中國規則

D.2日本規則

D.3應氏規則

D.4新西蘭規則

D.5美國規則

D.6智運會規則

D.7TrompTaylor規則

強化學習實戰 — 從零開始製作 AlphaGo 圍棋 (微課視頻版)

劉佳

買這商品的人也買了...

簡體書拿來曬2本75折 詳見活動內容 »

商品描述

目錄大綱

類似商品

簡體書拿來曬2本75折詳見活動內容 »