作 者:薛薇 等 著
定 價:99
出 版 社:機械工業出版社
出版日期:2021年03月01日
頁 數:412
裝 幀:平裝
ISBN:9787111674900
繫統介紹Python用於機器學習的數據分析、機器學習、數據可視化相關庫。結合大量實例透徹講解各類機器學習算法在數據建模、數據分析中的應用。全彩呈現數據建模可視化圖像,提供配套數據集、源代碼、PPT等學習資源。
●前言
第1章 機器學習概述 1
1.1 機器學習的發展:人工智能中的機器學習 1
1.1.1 符號主義人工智能 1
1.1.2 基於機器學習的人工智能 2
1.2 機器學習的核心:數據和數據建模 4
1.2.1 機器學習的學習對像:數據集 4
1.2.2 機器學習的任務:數據建模 6
1.3 機器學習的典型應用 11
1.3.1 機器學習的典型行業應用 11
1.3.2 機器學習在客戶細分中的應用 12
1.3.3 機器學習在客戶流失分析中的應用 13
1.3.4 機器學習在營銷響應分析中的應用 14
1.3.5 機器學習在交叉銷售中的應用 15
1.3.6 機器學習在欺詐甄別中的應用 16
【本章總結】 16
【本章習題】 17
第2章 Python機器學習基礎 18
2.1 Python:機器學習的優選工具 18
2.2 Python的集成開發環境:Anaconda 19
2.2.1 Anaconda的簡介 19
2.2.2 Anaconda Prompt的使用 20
2.2.3 Spyder的使用 22
2.2.4 Jupyter Notebook的使用 23
2.3 Python第三方包的引用 24
2.4 NumPy使用示例 24
2.4.1 NumPy數組的創建和訪問 25
2.4.2 NumPy的計算功能 26
2.5 Pandas使用示例 29
2.5.1 Pandas的序列和索引 29
2.5.2 Pandas的數據框 30
2.5.3 Pandas的數據加工處理 31
2.6 NumPy和Pandas的綜合應用:空氣質量監測數據的預處理和基本分析 32
2.6.1 空氣質量監測數據的預處理 32
2.6.2 空氣質量監測數據的基本分析 34
2.7 Matplotlib的綜合應用:空氣質量監測數據的圖形化展示 36
2.7.1 AQI的時序變化特點 37
2.7.2 AQI的分布特征及相關性分析 38
2.7.3 優化空氣質量狀況的統計圖形 40
【本章總結】 41
【本章相關函數】 41
【本章習題】 47
第3章 數據預測與預測建模 49
3.1 數據預測的基本概念 49
3.2 預測建模 50
3.2.1 什麼是預測模型 50
3.2.2 預測模型的幾何理解 53
3.2.3 預測模型參數估計的基本策略 56
3.3 預測模型的評價 59
3.3.1 模型誤差的評價指標 60
3.3.2 模型的圖形化評價工具 62
3.3.3 泛化誤差的估計方法 64
3.3.4 數據集的劃分策略 67
3.4 預測模型的選擇問題 69
3.4.1 模型選擇的基本原則 69
3.4.2 模型過擬合 69
3.4.3 預測模型的偏差和方差 71
3.5 Python建模實現 73
3.5.1 ROC和P-R曲線圖的實現 74
3.5.2 模型復雜度與誤差的模擬研究 75
3.5.3 數據集劃分和測試誤差估計的實現 79
3.5.4 模型過擬合以及偏差與方差的模擬研究 82
3.6 Python實踐案例 86
3.6.1 實踐案例1:PM2.5濃度的回歸預測 86
3.6.2 實踐案例2:空氣污染的分類預測 87
【本章總結】 91
【本章相關函數】 91
【本章習題】 91
……
第4章 數據預測建模:貝葉斯分類器 93
4.1 貝葉斯概率和貝葉斯法則 93
4.2 貝葉斯和樸素貝葉斯分類器 94
4.3 貝葉斯分類器的分類邊界 99
4.4 Python建模實現 100
4.5 Python實踐案例 103
【本章總結】 110
【本章相關函數】 111
【本章習題】 111
第5章 數據預測建模:近鄰分析 112
5.1 近鄰分析:K-近鄰法 112
5.2 基於觀測相似性的加權K-近鄰法 117
5.3 K-近鄰法的適用性 120
5.4 Python建模實現 122
5.5 Python實踐案例 125
【本章總結】 129
【本章相關函數】 129
【本章習題】 130
第6章 數據預測建模:決策樹 131
6.1 決策樹概述 131
6.2 CART的生長 139
6.3 CART的後剪枝 141
6.4 Python建模實現 143
6.5 Python實踐案例 147
【本章總結】 154
【本章相關函數】 155
【本章習題】 155
第7章 數據預測建模:集成學習 156
7.1 集成學習概述 157
7.2 基於重抽樣自舉法的集成學習 158
7.3 從弱模型到強模型的構建 163
7.4 梯度提升樹 174
7.5 XGBoost算法 181
7.6 Python建模實現 185
7.7 Python實踐案例 191
【本章總結】 197
【本章相關函數】 197
【本章習題】 198
第8章 數據預測建模:人工神經網絡 200
8.1 人工神經網絡的基本概念 201
8.2 感知機網絡 203
8.3 多層感知機及B-P反向傳播算法 213
8.4 Python建模實現 220
8.5 Python實踐案例 223
【本章總結】 227
【本章相關函數】 227
【本章習題】 227
第9章 數據預測建模:支持向量機 229
9.1 支持向量分類概述 229
9.2 接近線性可分下的支持向量分類 233
9.3 廣義線性可分下的支持向量分類 238
9.4 線性不可分下的支持向量分類 242
9.5 支持向量回歸 247
9.6 Python建模實現 252
9.7 Python實踐案例 258
【本章總結】 266
【本章相關函數】 266
【本章習題】 266
第10章 特征選擇:過濾、包裹和嵌入策略 267
10.1 特征選擇概述 267
10.2 過濾式策略下的特征選擇 268
10.3 包裹式策略下的特征選擇 278
10.4 嵌入式策略下的特征選擇 281
10.5 Python建模實現 288
10.6 Python實踐案例 290
【本章總結】 298
【本章相關函數】 298
【本章習題】 299
第11章 特征提取:空間變換策略 300
11.1 特征提取概述 300
11.2 主成分分析 301
11.3 矩陣的奇異值分解 307
11.4 核主成分分析 309
11.5 因子分析 315
11.6 Python建模實現 323
11.7 Python實踐案例 331
【本章總結】 334
【本章相關函數】 334
【本章習題】 335
第12章 揭示數據內在結構:聚類分析 336
12.1 聚類分析概述 336
12.2 基於質心的聚類模型:K-均值聚類 343
12.3 基於連通性的聚類模型:繫統聚類 346
12.4 基於高斯分布的聚類模型:EM聚類 351
12.5 Python建模實現 356
12.6 Python實踐案例:各地區環境污染的特征的對比分析 367
【本章總結】 370
【本章相關函數】 370
【本章習題】 370
第13章 揭示數據內在結構:特色聚類 371
13.1 基於密度的聚類:DBSCAN聚類 371
13.2 Mean-Shift聚類 375
13.3 BIRCH聚類 380
13.4 Python建模實現 387
13.5 Python實踐案例:商品批發商的市場細分 394
【本章總結】 397
【本章相關函數】 398
【本章習題】 398
本書采用理論與實踐相結合的方式,引導讀者以Python為工具,以機器學習為方法,進行數據的建模與分析。本書共13章,對機器學習的原理部分進行了深入透徹的講解,對機器學習算法部分均進行了Python實現。除前兩章外,各章都給出了可實現的實踐案例,並全彩呈現數據可視化圖形。本書兼具知識的深度和廣度,在理論上突出可讀性,在實踐上強調可操作性,實踐案例具備較強代表性。隨書提供全部案例的數據集、源代碼、教學PPT、關鍵知識點,教學輔導視頻,具備較高實用性。本書既可以作為數據分析從業人員的參考書,也可作為高等院校數據分析、機器學習等專業課程的教材。
薛薇 等 著
薛薇,博士,中國人民大學應用統計研究中心專職研究員,中國人民大學統計學院副教授。主要開設課程:機器學習,計量經濟學,統計軟件,統計學。研究方向:機器學習與深度學習算法研究。基於顧客消費行為大數據的客戶終身價值統計建模,以及營銷與品牌大數據的機器學習算法應用。