●第1章數學基礎001
1.1引言001
1.2線性代數001
1.2.1概述001
1.2.2向量與矩陣002
1.2.3矩陣的運算003
1.2.4幾種特殊的矩陣005
1.2.5線性方程組與矩陣的逆007
1.2.6特征值和特征向量010
1.2.7張量的定義和運算011
1.3概率基礎013
1.3.1頻率與概率013
1.3.2熵016
1.3.3常見的概率分布017
1.4優化理論020
1.4.1優化理論簡介020
1.4.2無約束的優化問題022
1.4.3無約束的優化方法024
1.4.4風險函數的優化方法026
1.4.5帶約束的優化方法028
1.5本章小結031
參考文獻031
第2章模型構建032
2.1引言032
2.2建模流程032
2.2.1目標定義032
2.2.2損失函數035
2.2.3求解優化037
2.2.4結果評估037
2.2.5模型選擇040
2.3常見模型042
2.3.1模型的分類方法042
2.3.2回歸模型043
2.3.3邏輯回歸模型047
2.4集成學習049
2.4.1集成學習概述049
2.4.2Bagging051
2.4.3Boosting052
2.5本章小結055
參考文獻057
第3章個性化推薦與搜索058
3.1個性化推薦概述058
3.2跨領域推薦改善用戶冷啟動問題059
3.2.1背景描述059
3.2.2基礎定義060
3.2.3建模思路061
3.2.4模型結構062
3.2.5實驗結果065
3.3Bandit算法在攜程場景中的應用實踐066
3.3.1Context-freeBandit算法067
3.3.2ContextualBandit算法069
3.3.3場景應用070
3.4旅遊度假產品的搜索個性化排序078
3.4.1度假搜索排序框架079
3.4.2度假搜索排序算法080
3.4.3模型演進及其他085
3.4.4小結086
3.5深度學習在酒店房型推薦中的應用實踐087
3.5.1酒店房型推薦業務的背景087
3.5.2業務問題轉化為算法問題087
3.5.3算法流程088
3.5.4小結089
3.6強化學習在酒店排序中的應用實踐089
3.6.1業務背景089
3.6.2傳統排序學習的局限性090
3.6.3強化學習的基本思路091
3.6.4算法流程091
3.6.5小結093
3.7瀑布流排序算法實踐094
3.7.1場景簡介094
3.7.2優化目標094
3.7.3特征工程095
3.7.4模型097
3.7.5位置偏差098
3.7.6評價指標099
3.7.7場景實踐101
3.8本章小結101
第4章AI服務化102
4.1AI服務化的背景與難點102
4.2旅遊領域知識圖譜102
4.2.1旅遊領域知識圖譜的特點103
4.2.2旅遊領域知識圖譜的構建104
4.2.3旅遊領域知識圖譜的應用112
4.3QA問答中的文本匹配與排序117
4.3.1基於深度學習的語義匹配模型118
4.3.2基於交互的語義匹配模型122
4.3.3遷移學習在語義匹配網絡中的應用125
4.3.4對語義匹配模型的一些思考127
4.4攜程國際化中的機器翻譯130
4.4.1模型架構130
4.4.2建模技巧135
4.4.3翻譯質量評估138
4.5證件全文本識別141
4.5.1文本識別簡介與發展歷程141
4.5.2文本識別步驟142
4.5.3文本檢測142
4.5.4文本識別145
4.5.5文本識別在證件識別中的應用實踐145
4.6本章小結147
參考文獻147
第5章AI助力產品運營150
5.1旅遊場景中的主題圖片自動優選151
5.1.1業務場景151
5.1.2圖像識別151
5.1.3圖像去重154
5.1.4圖像優美度識別155
5.1.5小結158
5.2知識推理在攜程業務中的應用158
5.2.1標簽繫統的業務背景和業務痛點159
5.2.2標簽規則配置平臺的設計與實現160
5.2.3小結164
5.3基於專名的內容產品化165
5.3.1內容產品化的業務背景165
5.3.2命名實體識別165
5.3.3實體鏈接168
5.3.4小結174
5.4主題推薦理由抽取174
5.4.1主題推薦理由抽取的業務背景174
5.4.2智能內容抽取175
5.4.3自動內容生成186
5.4.4小結193
5.5本章小結194
參考文獻194
第6章AI運營199
6.1問題的背景與難點199
6.2機器學習在海外酒店房態預測中的運用201
6.2.1業務背景201
6.2.2海外酒店房態預測的難點201
6.2.3海外酒店房態預測難點的解決方案202
6.2.4海外酒店房態預測的應用場景208
6.3IM+用戶模擬評分209
6.3.1業務背景209
6.3.2基於深度學習的模擬評分210
6.3.3技術方案流程214
6.4海外郵件自動化215
6.4.1業務背景215
6.4.2自然語言處理在郵件自動化中的應用216
6.5實時智能異常檢測平臺的算法及工程實現221
6.5.1應用場景221
6.5.2大而全的監控衍生出的問題222
6.5.3統計模型的困擾222
6.5.4算法選擇和設計目標223
6.5.5算法的描述和檢驗225
6.5.6實時性工程231
6.6本章小結233
第7章信息安全234
7.1問題的背景與難點235
7.2機器學習在Web攻擊檢測中的實踐235
7.2.1攜程Web-IDS攻擊檢測繫統架構介紹235
7.2.2定義目標問題238
7.2.3收集數據和實現特征工程238
7.2.4模型效果評估240
7.2.5線上應用和持續優化241
7.3機器學習在滑塊驗證碼防御中的實踐242
7.3.1滑塊驗證碼人機識別243
7.3.2滑塊驗證碼軌跡相似度識別247
7.4本章小結253
參考文獻253
第8章風險控制254
8.1自動化迭代反欺詐模型體繫254
8.1.1風控變量體繫256
8.1.2自動化迭代模型框架256
8.1.3RNN表征學習259
8.1.4自動化與傳統方法的效果對比261
8.2“程信分”模型體繫263
8.2.1“程信分”模型263
8.2.2“閃住”催收模型266
8.3主動學習在業務風控場景中的應用268
8.3.1酒店反刷單主動學習模型268
8.3.2機票防虛占主動學習模型271
8.4本章小結273
參考文獻273
第9章AI挖掘中臺274
9.1AI挖掘中臺的背景274
9.2AI挖掘中臺的框架和功能275
9.2.1AI挖掘中臺的構成275
9.2.2AI挖掘操作步驟276
9.2.3AI挖掘中臺的組件及工作流程279
9.2.4AI挖掘中臺應用成效281
9.3大數據和人工智能的賦能281
9.4本章小結282
第10章AI運營中臺283
10.1AI運營中臺的背景283
10.2AI運營中臺的框架和功能284
10.2.1框架284
10.2.2流程288
10.2.3模塊289
10.3AI運營中臺的高效運營290
10.3.1AI賦能方式290
10.3.2企業應用實例291
10.4本章小結292
第11章通用數據服務294
11.1通用數據服務的背景294
11.2通用數據服務平臺的架構和功能295
11.2.1通用數據服務平臺的架構295
11.2.2通用數據服務平臺的功能模塊295
11.3通用數據服務的監控299
11.3.1存儲監控300
11.3.2查詢監控300
11.3.3寫入監控301
11.4本章小結302