[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

機器學習入門到實戰(MATLAB實踐應用)/大數據與人工智能技術叢書
該商品所屬分類:計算機/網絡 -> 輔助設計
【市場價】
500-726
【優惠價】
313-454
【介質】 book
【ISBN】9787302495147
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



  • 出版社:清華大學
  • ISBN:9787302495147
  • 作者:冷雨泉//張會文//張偉
  • 頁數:263
  • 出版日期:2019-03-01
  • 印刷日期:2019-03-01
  • 包裝:平裝
  • 開本:16開
  • 版次:1
  • 印次:1
  • 字數:370千字
  • 《機器學習入門與實戰——MATLAB實踐應用》的編寫是作者在多年機器學習及工作經驗的基礎上,對大量的網絡資源、論文和相關書籍進行總結、整理、分析而來。全書共分為三部分,分別為機器學習概念篇、MATLAB機器學習基礎篇、機器學習算法與MATLAB實踐篇。
  • 本書主要介紹經典的機器學習算法的原理及改進,以及MATLAB的實例實現。本書內容分為三部分。第一部分(第1章)是機器學習概念篇,介紹機器學習的相關概念,並且對機器學習的各類算法進行分類,以便讀者對機器學習的知識框架有一個整體的了解,從而在後續的學習中更容易接受機器學習涉及的各類算法。第二部分(第2章、第3章)是MATLAB機器學習基礎篇,介紹MATLAB的基本使用方法,以及MATLAB集成的機器學習工具箱。MATLAB易上手的特點讓使用者將更多的精力專注於算法開發與使用,而不是搭建算法實現開發平臺。第三部分(第4章~第19章)是機器學習算法與MATLAB實踐篇,對監督學習、無/非監督學習、強化學習三大類常用算法進行逐個講解,包括機器學習算法原理、算法優缺點、算法的實例解釋以及MATLAB的實踐應用。 本書適合以下讀者: 對人工智能、機器學習感興趣的讀者; 希望用機器學習完成設計的計算機或電子信息專業學生; 準備開設機器學習、深度學習實踐課的授課老師; 學習過C語言,且希望進一步提升編程水平的開發者; 剛從事機器學習、語音、機器視覺、智能機器人研發的算法工程師。
  • **部分 機器學習概念篇
    第1章 機器學習基礎
    1.1 機器學習概述
    1.1.1 機器學習的概念
    1.1.2 機器學習的發展史
    1.1.3 機器學習的用途
    1.1.4 機器學習、數據挖掘及人工智能的關繫
    1.2 機器學習基本術語
    1.3 機器學習任務及算法分類
    1.4 如何學習和運用機器學習
    1.4.1 軟件平臺的選擇
    1.4.2 機器學習應用實現流程
    1.5 數據預處理
    1.5.1 數據初步選取
    1.5.2 數據清理
    1.5.3 數據集成
    1.5.4 數據變換
    1.5.5 數據歸約
    參考文獻
    第二部分 MATLAB機器學習基礎篇
    第2章 MATLAB基礎入門
    2.1 MATLAB界面介紹
    2.2 矩陣賦值與運算
    2.3 m文件及函數實現與調用
    2.4 基本流程控制語句
    2.5 基本繪圖方法
    2.5.1 二維繪圖函數的基本用法
    2.5.2 三維繪圖函數的基本用法
    2.5.3 顏色與形狀參數列表
    2.5.4 圖形窗口分割與坐標軸
    2.6 數據文件導入與導出
    參考文獻
    第3章 MATLAB機器學習工具箱
    3.1 工具箱簡介
    3.2 分類學習器基本操作流程
    3.3 分類學習器算法優化與選擇
    3.3.1 特征選擇
    3.3.2 選擇分類器算法
    3.4 工具箱分類學習實例
    參考文獻
    第三部分 機器學習算法與MATLAB實踐篇
    第4章 k近鄰算法
    4.1 k近鄰算法原理
    4.1.1 k近鄰算法實例解釋
    4.1.2 k近鄰算法的特點
    4.2 基於k近鄰算法的算法改進
    4.2.1 快速KNN算法
    4.2.2 kd樹KNN算法
    4.3 k近鄰算法的MATLAB實踐
    參考文獻
  • 第3章MATLAB機器學習工具箱 在MATLAB近幾年的版本中,推出了一個新的產品功能,即統計和機器學習工具箱(Statistics and Machine Learning Toolbox)。這個工具箱具有很多功能,並且在不斷地完善中。具體來說它包含如下一些子模塊: 探索性數據分析、數據降維、機器學習、回歸和方差分析、概率分布擬合及假設檢驗等功能模塊。如果讀者希望快速地了解部署一個機器學習應用,那麼MATLAB提供的工具箱將會是一個不錯的選擇。基於這個原因,本章將著重介紹MATLAB統計和機器學習工具箱中的機器學習模塊。
    3.1工具箱簡介 機器學習算法使用計算方法直接從數據中“學習”信息,不把預定方程假設為模型。在第1章中羅列了各種不同的機器學習算法,歸納起來,按照解決問題的性質,可以分為分類(回歸)、聚類和強化學習問題。相應地,在Statistics and Machine Learning Toolbox中提供用於執行受監督和無/非監督機器學習的方法。分類算法使用戶可以將一個分類應變量建模為一個或多個預測元的函數。Statistics and Machine Learning Toolbox提供了涵蓋多種參數化和非參數化分類算法的應用程序和函數,如logistic回歸、樸素貝葉斯、k近鄰、SVM等[1]。研究者可以直接利用MATLAB提供的這些算法的函數接口,通過編寫腳本程序來使用這些算法。*直觀地,MATLAB提供了一個GUI形式的分類學習應用程序,它使得研究者能夠以窗口菜單的形式構建一個機器學習應用。本章將著重介紹這個應用的使用方法。
    分類學習器應用程序(Classification Learner App)提供了一個機器學習應用常用的操作,如交互式探查數據、選擇特征、指定交叉驗證方案、訓練模型和評估結果。分類學習器應用程序用於使用監督式機器學習來訓練模型對數據進行分類,使用它可以執行常見任務,例如,導入數據和指定交叉驗證方案; 探索數據和選擇特征; 使用多種分類算法訓練模型; 比較和評估模型; 在計算機視覺和信號處理等應用場合中共享訓練過的模型。
    除此之外,分類學習器集成了多種可視化方式來方便用戶選擇模型,進行模型評估和比較。訓練好的模型也可以直接導入MATLAB的工作空間,來對新的數據預測,也可以直接生成代碼,方便和其他應用集成。
    在MATLAB統計和機器學習工具箱中當然也實現了很多聚類算法,聚類算法通過根據相似度測量對數據分組來發現數據集中的規律。可用的算法包括k均值、k中心點、分層聚類、高斯混合模型和隱馬爾可夫模型。當不知道聚類的數量時,可以使用聚類評估技術根據特定指標確定數據中存在的聚類數量。隻是聚類算法還沒有對應的GUI應用。對於回歸算法,MATLAB 2017版本也推出了回歸學習器,它的操作流程和界面與分類學習器很類似,感興趣的讀者可安裝2017版本進行實踐操作和學習。
    3.2分類學習器基本操作流程 對於構建機器學習應用,通常包括五部分,分別是數據導入、數據的探索和特征選擇、訓練模型、比較模型和輸出模型。分類學習器也在不同的窗口中實現了這些功能。
    首先,為了啟動分類學習器,可以通過直接在命令行窗口中輸入“classification Learner”,或者在MATLAB的菜單欄中選擇“應用程序”選項卡下的分類學習器應用Classification Learner,如圖3.1所示。
    圖3.1啟動分類學習器 此時MATLAB將彈出一個空白的分類器窗口,如圖3.2所示。
    圖3.2空白的分類器窗口 該窗口就是進行分類操作*核心的一個窗口。但是可以看到大部分的菜單和按鈕都是灰色的,這是因為還沒有選擇數據。對於機器學習應用來說,數據就好像是機器的燃料,沒有燃料,機器自然動不起來,所以為了進行下一步工作,首先需要輸入數據。
    導入數據的方法分為兩種方式: 一種是單擊CLASSIFICATION LEARNER選項卡下FILE組中的New Session下拉按鈕,然後選擇From Workspace,如圖3.3所示,其含義是導入MATLAB工作空間的函數數據; 另一種則是選擇From File,如圖3.3所示,其含義是通過數據文件導入數據,如.xls、.xlsx、.xlsm、.txt、.csv等格式數據文件。
    圖3.3導入數據 數據導入後,則進入數據處理窗口界面,如圖3.4所示。圖3.4中的數據是在命令行窗口中調用fisheriris數據集而產生的,其具體操作是在MATLAB命令行窗口中輸入: fishertable=readtable('fisheriris.csv');並按Enter鍵生成的數據變量,此時使用上述的**種導入數據的方法,即可生成圖3.4。
    圖3.4數據處理窗口 該窗口主要目的是用來設置訓練數據的相關屬性、標簽及設置驗證集。可以看到窗口主要分成3個部分,其依次對應3個步驟。在Step1中主要功能是選擇數據集,且設置數據集矩陣中的行作為一個變量,還是將列作為變量; 在Step2需要向算法聲明哪些維度是輸入量,哪些是輸出量,對於分類問題來說就是選擇哪幾個變量作為屬性值,哪個變量作為標簽。這個聲明可以通過把變量導入為Predictor還是Response完成,其中,Predictor對應輸入,Response對應標簽,此時,導入數據的工作就完成了。
    為了優化算法中的一些超參數,需要一定的手段來評估不同參數的表現。其中,驗證集的目的是用來對算法的超參數調優。在模型計算過程中,測試集數據隻能使用一次,不能用測試集數據調優,因為其會導致算法對測試集過擬合,將會導致模型在測試集上有較好的結果,但是實際效果不能得到保證。所以可以知道驗證集應該是訓練集的一部分。但是當訓練集數量較少(因此驗證集的數量*少)時,將用到交叉驗證法。所謂kfold validation就是把訓練集均分成k份,其中k-1份用來訓練,1份用來驗證。然後循環取其中k-1份來訓練,其中1份來驗證,*後取所有k次驗證結果的平均值作為算法驗證結果。在窗口的Step3中可以允許用戶設定這個k值。導入數據並設置好交叉驗證後,單擊Start Session按鈕就彈出如圖3.5所示的分類器窗口。
    圖3.5分類器窗口 可看出圖3.5所示的窗口和圖3.2所示的窗口是一樣的,隻是灰色的部分被激活了。這個激活的窗口包含了訓練一個機器學習應用的核心要素,其大體分六部分。*上邊的菜單欄提供了特征選擇、算法選擇、模型訓練、可視化繪圖及輸出等操作。特征選擇模塊用於選擇輸入特征,即選擇屬性特征,一方面可通過單擊該模塊中的Feature Selection按鈕進行人工選擇,也可以利用PCA的方法自動選擇。分類算法模塊是各種算法的一個倉庫。單擊其下拉按鈕會出現如圖3.6所示下拉列表。
    圖3.6多種分類器 可以看到,分類學習器將可以應用的算法分成了四大類,分別是決策樹類、判別分析類、支持向量機類、神經網絡類。注意,在GET STARTED中的All和AllLinear並不是一個算法,而是一個快捷操作,它能夠快速地對數據應用分類學習器中的所有模型或所有線性模型。在做了特征選擇後,下一步則需要選擇一個合適的分類算法。有了算法,下一步就是訓練了。在TRAINING組中,除了簡單地單擊Train進行訓練外,還可以通過Advanced按鈕設置一些訓練的參數,如對於決策樹類算法來說可以設置*大的葉子結點數及確定決策邊界的準則等。
    當用戶選擇一個訓練模型後,它就會出現在窗口的右側方框中。用戶可以選擇多個模型,一次訓練。得到的每個分類器的分類精度會顯示在方框中。其中分類效果*好的模型會以方框突出顯示。History窗格顯示當前模型的一些詳細信息。
    訓練完畢後,用戶不僅僅得到一個分類的精度值,同時用戶還可以通過各種圖形來直觀地觀測當前模型的表現。當然,圖示化訓練數據對於數據探索,發現數據的模式也是大有裨益的。繪圖的選項在PLOTS組中,可以繪制的圖形包括訓練數據的散點圖、confusion matrix、ROC曲線等。關於這些不同圖形的含義,讀者可參考機器學習相關書籍,另外,在窗口的*右邊可以設置繪圖參數。
    通過可視化窗口界面,用戶可以再次調整模型,如進一步的特征提取,或者設置*加合理的超參數值,來改善模型的表現。那麼,一旦得到了一個滿意的模型,該如何利用它呢?分類學習器提供了兩種模式: 一種方法是用戶導出訓練好的模型到工作空間中,這個時候用戶將發現變量空間中多了一個結構體變量,這個變量含有一個用於預測的成員函數,此時,用戶將可以用它來做預測。但是如果用戶希望*改模型,或者把它集成到其他的應用中,則需要用到另外一種方法,也是*通用的方法,即以代碼的形式使用。MATLAB可以直接通過GUI形式的窗口生成代碼。單擊圖3.5所示的分類器窗口中的Export Model按鈕,操作如圖3.7所示。
    圖3.7導出訓練模型 因為特征選擇和算法選擇對於一個機器學習應用至關重要,下面將會*詳細地介紹如何使用分類學習器APP做特征選擇和分類器選擇。
    3.3分類學習器算法優化與選擇 使用工具箱的方法並不是智能的,同樣需要對數據進行預處理,並根據經驗和分析選擇合適的數據特征。另外,機器學習各類算法也具有不同的特點,使用者應在不斷的實踐中了解各類機器學習算法,在特定的應用場合應選擇適合數據自身的算法。
    3.3.1特征選擇 在分類學習器中可以通過對原始數據做散點圖來分析是否需要或排除某個特征。選擇不同特征作為坐標軸,如果數據某一類別數據很好地分開,說明這個特征是有用的。如果某個特征對於分類沒有任何作用,則可以考慮把它排除。在fisheriris數據集中選擇X和Y分別為PetalLength和PetalWidth,可以看到setosa類能夠被很好地分開,如圖3.8所示。
    圖3.8數據可視化 在分類學習器窗口中,也可以通過勾選某個特征,觀察分類器的表現。如果刪除某個特征後可以提高模型的性能,那麼應該排除這個特征,尤其是當收集該數據比較昂貴和困難的時候。具體操作為單擊FEATURES組中的Feature Selection按鈕,將出現如圖3.9所示的窗口,用戶可以取消選中特征名稱後的復選框,從而排除該特征。
    圖3.9特征選擇菜單 利用主成分分析來降低特征空間的維度,有助於防止過擬合。PCA能夠消除數據中的冗餘信息,產生一個新的變量集,該變量集稱為主成分。在工具箱中使用PCA包括以下步驟: (1)在分類器窗口的FEATURES組中單擊PCA按鈕; (2)在Advanced PCA Options下拉列表框中選中Enable PCA復選框,並設置相應參數(一般采用默認)。至此,用戶已完成了對PCA的設置,之後,當用戶單擊Train的時候,PCA會首先對數據做變換和處理,然後進行模型訓練。
    在分類學習器中也可以利用平行坐標圖(Parallel Coordinates Plot)來選擇特征,具體操作為單擊分類學習器窗口的PLOTS組中的Parallel Coordinates Plot按鈕,生成平行坐標圖,如圖3.10所示。
    圖3.10平行坐標圖 在平行坐標圖中其實它就是把每個特征列在一個一維的軸上畫出來,然後把每個記錄(一個樣本點)依次連接起來,*後用不同的顏色表示不同的類別,錯分的類別用虛線表示。如果某個特征具有很好的區分度,那麼在坐標軸上就會出現明顯的聚類現像。從圖3.10可以看出PetalWidth和PetalLength特征具有很好的分類效果。
    3.3.2選擇分類器算法 各分類器算法有各自的特點,依賴於具體的需求,如速度、存儲、靈活性、可解釋性等,會有不同的選擇。如果對於一個數據沒有特別深刻的了解,或者特別適合的模型,*開始用戶可以選擇All QuickToTrain,這個選項會用所有高效的模型對數據訓練,能夠快速地得到不同分類器的表現。但是一般來說,不同類型算法有不同的特點,有大概的了解也會有利於用戶選擇分類器算法。表3.1中針對不同類型分類器算法進行了對比。
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部