[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

深入淺出強化學習(原理入門)/博文視點AI繫列
該商品所屬分類:工業技術 -> 自動化技術
【市場價】
550-796
【優惠價】
344-498
【介質】 book
【ISBN】9787121329180
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



  • 出版社:電子工業
  • ISBN:9787121329180
  • 作者:編者:郭憲//方勇純
  • 頁數:239
  • 出版日期:2018-01-01
  • 印刷日期:2018-01-01
  • 包裝:平裝
  • 開本:16開
  • 版次:1
  • 印次:1
  • 字數:284千字
  • 從零起步掌握強化學習技術精髓,稱霸人工智能領域!
    郭憲、方勇純編著的《深入淺出強化學習(原理入門)》針對初學者的需求,直接分析原理,並輔以編程實踐。從解決問題的思路,層層剖析,普及了傳統的強化學習基本方法和當前炙手可熱的深度強化學習方法,直接將讀者帶入強化學習的殿堂。讀完本書,讀者能在熟練掌握原理的基礎上,直接上手編程實踐。
    本書的敘述方式簡潔、直接、清晰,值得精讀!
    本書除了繫統地介紹理論,還介紹了相應的數學基礎與編程實例,因此既適合零基礎的人員入門學習,也適合相關人員作為研究參考。
  • 郭憲、方勇純編著的《深入淺出強化學習(原理 入門)》用通俗易懂的語言深入淺出地介紹了強化學 習的基本原理,覆蓋了傳統的強化學習基本方法和當 前炙手可熱的深度強化學習方法。開篇從最基本的馬 爾科夫決策過程入手,將強化學習問題納入到嚴謹的 數學框架中,接著闡述了解決此類問題最基本的方法 ——動態規劃方法,並從中總結出解決強化學習問題 的基本思路:交互迭代策略評估和策略改善。基於這 個思路,分別介紹了基於值函數的強化學習方法和基 於直接策略搜索的強化學習方法。最後介紹了逆向強 化學習方法和近年具有代表性、比較前沿的強化學習 方法。 除了繫統地介紹基本理論,書中還介紹了相應的 數學基礎和編程實例。因此,《深入淺出強化學習( 原理入門)》既適合零基礎的人員入門學習、也適合 相關科研人員作為研究參考。
  • 1 緒論
    1.1 這是一本什麼書
    1.2 強化學習可以解決什麼問題
    1.3 強化學習如何解決問題
    1.4 強化學習算法分類及發展趨勢
    1.5 強化學習仿真環境構建
    1.5.1 gym安裝及簡單的demo示例
    1.5.2 深入剖析gym環境構建
    1.6 本書主要內容及安排
    第一篇 強化學習基礎
    2 馬爾科夫決策過程
    2.1 馬爾科夫決策過程理論講解
    2.2 MDP中的概率學基礎講解
    2.3 基於gym的MDP實例講解
    2.4 習題
    3 基於模型的動態規劃方法
    3.1 基於模型的動態規劃方法理論
    3.2 動態規劃中的數學基礎講解
    3.2.1 線性方程組的迭代解法
    3.2.2 壓縮映射證明策略評估的收斂性
    3.3 基於gym的編程實例
    3.4 *優控制與強化學習比較
    3.5 習題
    第二篇 基於值函數的強化學習方法
    4 基於蒙特卡羅的強化學習方法
    4.1 基於蒙特卡羅方法的理論
    4.2 統計學基礎知識
    4.3 基於Python的編程實例
    4.4 習題
    5 基於時間差分的強化學習方法
    5.1 基於時間差分強化學習算法理論講解
    5.2 基於Python和gym的編程實例
    5.3 習題
    6 基於值函數逼近的強化學習方法
    6.1 基於值函數逼近的理論講解
    6.2 DQN及其變種
    6.2.1 DQN方法
    6.2.2 Doubl
    6.2.3 優先回放(Prioritized Replay)
    6.2.4 Dueling DQN
    6.3 函數逼近方法
    6.3.1 基於非參數的函數逼近
    6.3.2 基於參數的函數逼近
    6.3.3 卷積神經網絡
    6.4 習題
    第三篇 基於直接策略搜索的強化學習方法
    7 基於策略梯度的強化學習方法
    7.1 基於策略梯度的強化學習方法理論講解
    7.2 基於gym和TensorFlow的策略梯度算法實現
    7.2.1 安裝Tensorflow
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部