[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

【新華正版】強化學習 微課版 9787302587941 清華大學出版社 圖
該商品所屬分類:圖書 -> 經管勵志
【市場價】
628-912
【優惠價】
393-570
【作者】 袁莎白朔天唐傑 
【出版社】清華大學出版社 
【ISBN】9787302587941
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



出版社:清華大學出版社
ISBN:9787302587941
商品編碼:10039617735028

品牌:文軒
出版時間:2021-10-01
代碼:69

作者:袁莎,白朔天,唐傑

    
    
"
作  者:袁莎,白朔天,唐傑 著
/
定  價:69
/
出 版 社:清華大學出版社
/
出版日期:2021年10月01日
/
頁  數:300
/
裝  幀:平裝
/
ISBN:9787302587941
/
主編推薦
本書是強化學習領域的入門書籍。本書結合大量清晰易懂的實際用用案例,能夠幫助讀者更好地理解強化學習各個算法的實現原理,降低了強化學習入學門檻。書中架構安排合理,語言表達準確,推理證明齊全。
目錄
●I 概述
第1章 導論
1.1 強化學習簡介
1.1.1 兩個主要特征
1.1.2 與機器學習的關繫
1.2 強化學習發展史
1.2.1 試錯學習
1.2.2 很優控制
1.2.3 時序差分學習
1.2.4 深度強化學習
1.3 本書的主要內容
1.4 本章小結
II 預備知識
第2章 概率統計與隨機過程
2.1 概率論
2.1.1 集合
2.1.2 概率
2.1.3 隨機試驗與隨機事件
2.1.4 條件概率與獨立事件
2.1.5 隨機變量
2.1.6 期望與方差
2.1.7 概率分布
2.2 統計學基礎
2.2.1 大數定律
2.2.2 中心極限定理
2.3 隨機過程
2.3.1 基本概念
2.3.2 分布函數
2.3.3 基本類型
2.3.4 馬爾可夫過程
2.3.5 馬爾可夫鏈的狀態分類
2.3.6 平穩分布
2.4 本章小結
第3章 機器學習
3.1 基本概念
3.2 線性回歸
3.3 邏輯回歸
3.3.1 邏輯回歸模型
3.3.2 邏輯回歸指標
3.3.3 邏輯回歸算法
3.4 隨機梯度下降
3.4.1 隨機梯度下降法
3.4.2 基於SGD實現邏輯回歸
3.5 本章小結
第4章 神經網絡
4.1
4.2 感知機
4.2.1 感知機模型
4.2.2 感知機指標
4.2.3 感知機算法
4.3 神經網絡
4.3.1 神經網絡模型
4.3.2 神經網絡指標
4.3.3 神經網絡算法
4.3.4 梯度消失現像
4.4 本章小結
第5章 深度學習
……
III 強化學習基礎
IV 表格求解法
V 近似求解法
VI 實踐與前沿
VII 附錄
內容簡介
本書構建了一個完整的強化學習入門路徑,深入淺出地介紹了強化學習算法的基本原理和實現方法。本書首先回顧了相關預備知識,包括數學基礎和機器學習基礎,然後先介紹強化學習的基本概念,給出強化學習的數學框架(馬爾可夫決策過程),隨後介紹強化學習的求解算法,包括表格求解法(動態規劃法、蒙特卡洛法和時序差分法),以及近似求解法(值函數近似法、策略梯度法和深度強化學習)。本書最後一部分為實踐與前沿,實踐部分基於一個相同的例子實現了強化學習領域的主流基礎算法,前沿部分介紹了強化學習領域的近期新研究進展。本書配有相當數量的習題供練習,配套代碼基於Python實現,源代碼均已開源,可開放獲取。本書可作為理工科本科生、研究生的“強化學習”課程的教材,也可作為相關從業者掌握強化學習的入門參考書。
作者簡介
袁莎,白朔天,唐傑 著
袁莎,清華大學計算機繫博士後,合作導師為唐傑教授,主持一項國家自然科學基金青年基金項目和一項博士後科學基金面上項目。唐傑 IEEE Fellow,清華大學計算機繫教授、繫副主任,獲國家傑出青年科學基金、王選傑青獎。研究人工智能、認知圖譜、數據挖掘、社交網絡和機器學習。發表論文300餘篇,獲ACM SIGKDD Test-of-Time Award(十年很好論文)。主持研發了超大規模預訓練模型“悟道”,參數規模超過1.75萬億。之前還研發了研究者社會網絡挖掘繫統AMiner,吸引全球220個國家/地區2000多萬用戶。擔任國際期刊IEEE T. on Big Data、AI OPEN主編以及W等



"
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
【同作者商品】
袁莎白朔天唐傑
  本網站暫時沒有該作者的其它商品。
有該作者的商品通知您嗎?
請選擇作者:
袁莎白朔天唐傑
您的Email地址
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部