[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

強化學習/智能科學與技術叢書
該商品所屬分類:計算機/網絡 -> 計算機原理
【市場價】
998-1446
【優惠價】
624-904
【介質】 book
【ISBN】9787111600220
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



  • 出版社:機械工業
  • ISBN:9787111600220
  • 作者:編者:(荷)馬可·威寧//馬丁·範·奧特羅|譯者:趙地...
  • 頁數:464
  • 出版日期:2018-06-01
  • 印刷日期:2018-06-01
  • 包裝:平裝
  • 開本:16開
  • 版次:1
  • 印次:1
  • 譯者序
    序言
    前言
    作者清單
    **部分 緒論
    第1章 強化學習和馬爾可夫決策過程
    1.1 簡介
    1.2 時序決策
    1.2.1 接近時序決策
    1.2.2 在線學習與離線學習
    1.2.3 貢獻分配
    1.2.4 探索–運用的平衡
    1.2.5 反饋、目標和性能
    1.2.6 表達
    1.3 正式的框架
    1.3.1 馬爾可夫決策過程
    1.3.2 策略
    1.3.3 *優準則和減量
    1.4 價值函數和貝爾曼方程
    1.5 求解馬爾可夫決策過程
    1.6 動態規劃:基於模型的解決方案
    1.6.1 基本的動態規劃算法
    1.6.2 高效的動態規劃算法
    1.7 強化學習:無模型的解決方案
    1.7.1 時序差分學習
    1.7.2 蒙特卡羅方法
    1.7.3 高效的探索和價值*新
    1.8 總結
    參考文獻
    第二部分 高效的解決方案框架
    第2章 批處理強化學習
    2.1 簡介
    2.2 批處理強化學習問題
    2.2.1 批處理學習問題
    2.2.2 增長批處理學習問題
    2.3 批處理強化學習算法的基礎
    2.4 批處理強化學習算法
    2.4.1 基於核的近似動態規劃
    2.4.2 擬合Q迭代
    2.4.3 基於*小二乘的策略迭代
    2.4.4 識別批處理算法
    2.5 批處理強化學習理論
    2.6 批處理強化學習的實現
    2.6.1 神經擬合Q迭代
    2.6.2 控制應用中的神經擬合Q迭代算法
    2.6.3 面向多學習器的批處理強化學習
    2.6.4 深度擬合Q迭代
    2.6.5 應用/發展趨勢
    2.7 總結
    參考文獻
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部