●第 1章 數據科學和機器學習 11.1 數據科學在商業領域中的作用 21.2 機器學習算法的分類 81.2.1 分類:產生類判定的算法 81.2.2 回歸分析:預測數值的算法 91.2.3 聚類分析:對數據進行無監督群組化的算法 101.2.4 其他算法 121.3 本書使用的例題 131.3.1 基於回歸分析的觀測值推斷 131.3.2 基於線性判別的新數據分類 171.3.3 圖像文件的褪色處理(提取代表色) 181.3.4 識別手寫文字 191.4 分析工具的準備 201.4.1 本書使用的數據分析工具 211.4.2 運行環境設置步驟(以CentOS 6為例) 221.4.3 運行環境設置步驟(以Mac OS X為例) 251.4.4 運行環境設置步驟(以Windows 7/8.1為例) 271.4.5 IPython的使用方法 30第 2章 最小二乘法:機器學習理論第 一步 352.1 基於近似多項式和最小二乘法的推斷 362.1.1 訓練集的特征變量和目標變量 362.1.2 近似多項式和誤差函數的設置 382.1.3 誤差函數最小化條件 392.1.4 示例代碼的確認 422.1.5 統計模型的最小二乘法 462.2 過度擬合檢出 492.2.1 訓練集和測試集 492.2.2 測試集的驗證結果 502.2.3 基於交叉檢查的泛化能力驗證 522.2.4 基於數據的過度擬合變化 542.3 附錄:Hessian矩陣的特性 56第3章 最優推斷法:使用概率的推斷理論 593.1 概率模型的利用 603.1.1 “數據的產生概率”設置 603.1.2 基於似然函數的參數評價 653.1.3 示例代碼的確認 693.2 使用簡化示例的解釋說明 733.2.1 正態分布的參數模型 743.2.2 示例代碼的確認 763.2.3 推斷量的評價方法(一致性和無偏性) 783.3 附錄:樣本均值及樣本方差一致性和無偏性的證明 803.3.1 樣本均值及樣本方差一致性和無偏性的證明 813.3.2 示例代碼的確認 85第4章 感知器:分類算法的基礎 894.1 概率梯度下降法的算法 914.1.1 分割平面的直線方程 914.1.2 基於誤差函數的分類結果評價 934.1.3 基於梯度的參數修正 954.1.4 示例代碼的確認 994.2 感知器的幾何學解釋 1004.2.1 對角項的任意性和算法的收斂速度 1014.2.2 感知器的幾何學解釋 1034.2.3 對角項的幾何學意義 104第5章 Logistic回歸和ROC曲線:學習模型的評價方法 1075.1 對分類問題應用最優推斷法 1085.1.1 數據發生概率的設置 1085.1.2 基於最優推斷法的參數確定 1125.1.3 示例代碼的確認 1145.2 基於ROC曲線的學習模型評價 1175.2.1 Logistic回歸在實際問題中的應用 1185.2.2 基於ROC曲線的性能評價 1205.2.3 示例代碼的確認 1235.3 附錄:IRLS法的推導 126第6章 K均值算法:無監督學習模型的基礎 1336.1 基於K均值算法的聚類分析和應用實例 1346.1.1 無監督學習模型類聚類分析 1346.1.2 基於K均值算法的聚類分析 1356.1.3 在圖像數據方面的應用 1386.1.4 示例代碼的確認 1416.1.5 K均值算法的數學依據 1436.2 “懶惰”學習模型K近鄰法 1466.2.1 基於K近鄰法的分類 1466.2.2 K近鄰法的問題 148第7章 EM算法:基於最優推斷法的監督學習 1517.1 使用伯努利分布的最優推斷法 1527.1.1 手寫文字的合成方法 1537.1.2 基於圖像生成器的最優推斷法應用 1547.2 使用混合分布的最優推斷法 1577.2.1 基於混合分布的概率計算 1577.2.2 EM算法的過程 1587.2.3 示例代碼的確認 1617.2.4 基於聚類分析的探索性數據解析 1657.3 附錄:手寫文字數據的采集方法 167第8章 貝葉斯推斷:以數據為基礎提高置信度的手法 1698.1 貝葉斯推斷模型和貝葉斯定理 1708.1.1 貝葉斯推斷的思路 1718.1.2 貝葉斯定理入門 1728.1.3 使用貝葉斯推斷確定正態分布:推斷參數 1788.1.4 使用貝葉斯推斷確定正態分布:推斷觀測值分布 1858.1.5 示例代碼的確認 1888.2 貝葉斯推斷回歸分析的應用 1908.2.1 參數後期分布的計算 1908.2.2 觀測值分布的推斷 1948.2.3 示例代碼的確認 1958.3 附錄:最優推斷法和貝葉斯推斷的關繫 198後記 201
內容簡介
人工智能正在形成一股新的浪潮,它將從技術、經濟、社會等各個層面改變我們的工作和生活方式。作為實現人工智能的重要技術,機器學習正在受到人工智能專家之外的更廣泛人群的關注,想要了解機器學習相關知識和技術的人日益增多。本書緊緊圍繞“機器學習的商業應用”這個主題,從數學原理上解釋了機器學習的一些基礎算法,如很小二乘法、很優推斷法、感知器、Logistic回歸、K均值算法、EM算法、貝葉斯推斷等。全書的主旨在於幫助讀者理解機器學習的本質,因此作者介紹具體的例題時,基本的著眼點是教會讀者使用什麼樣的思維方式,以及如何進行計算,為讀者探索更加復雜的深度學習領域或神經網絡算法打下堅實的基礎。