內容簡介
本書共19章,靠前章介紹數據科學中涉及的基本領域;第2~3章介紹與數據工作緊密相關的Python語言基礎;第4章講解描述性統計分析在宏觀業務領域的分析;第5章講解數據規整、清洗的重要技能;第6章介紹數據科學領域實用的四大統計檢驗;第7章講解當被解釋變量為連續變量時,如何使用線性回歸作預測;第8章講解使用邏輯回歸作評分卡模型;第9章講解另外一個可解釋模型——決策樹。靠前0~12章分別講解了BP神經網絡、樸素貝葉斯、近鄰域、支持向量機的原理和在決策類模型中的運用;靠前3~14章作為一個整體講解商業分析場景下的信息壓縮;靠前5章以產品推薦作為案例,講解發現事件與事件伴生關繫的關聯分析和序列分析算法;靠前6章使用欺詐識別案例講解當被解釋變量分布極 端不平衡時的處理方法;靠前7章繼續使用欺詐識別案例講解集成學習算法;靠前8章講解了使用效應分解和ARIMA方法實現宏觀業務指標預測;靠前9章用......