出版社:機械工業出版社 ISBN:9787111597797 商品編碼:29551584306 品牌:文軒 出版時間:2018-06-01 代碼:79 作者:托馬茲·卓巴斯(TomaszDrabas)著
" 作 者:(美)托馬茲·卓巴斯(Tomasz Drabas) 著;刁壽鈞 譯 定 價:79 出 版 社:機械工業出版社 出版日期:2018年06月01日 頁 數:276 裝 幀:平裝 ISBN:9787111597797 ●推薦序 ●譯者序 ●前言 ●致謝 ●關於作者 ●關於審稿人 ●章 準備數據1 ●1.1 導論1 ●1.2 使用Python讀寫CSV/TSV文件2 ●1.3 使用Python讀寫JSON文件6 ●1.4 使用Python讀寫Excel文件7 ●1.5 使用Python讀寫XML文件10 ●1.6 使用pandas檢索HTML頁面13 ●1.7 存儲並檢索關繫數據庫15 ●1.8 存儲並檢索MongoDB18 ●1.9 使用OpenRefine打開並轉換數據20 ●1.10 使用OpenRefine探索數據23 ●1.11 排重25 ●1.12 使用正則表達式與GREL清理數據27 ●1.13 插補缺失值28 ●部分目錄 本書分為三大部分。第 一部分會講授一些實戰技巧,用於讀取、寫入、清洗、格式化、探索與理解數據;第二部分由一些較深入的主題組成,比如分類、聚類和預測等;第三部分介紹更高深的主題,從圖論到自然語言處理,到離散選擇模型,再到模擬。 (美)托馬茲·卓巴斯(Tomasz Drabas) 著;刁壽鈞 譯 托馬茲·卓巴斯,微軟數據科學家,他擁有超過13年的數據分析經驗。托馬茲每天都和大數據打交道,解決機器學習問題(如異常檢測、流失預測),並使用Spark進行模式識別。 Preface 前 言數據分析與數據科學已經成功引起了各行各業的注意。當下產生的數據總量已讓人驚嘆,並且這個數據量每天仍在增長;隨著手機使用量的激增,人們對Facebook、Youtube、Netflix或其他4K視頻提供方的訪問將越發地倚重雲計算,這是我們可以預見的必然趨勢。 數據科學家的工作內容包括但遠不限於清理數據、轉換數據和分析數據,為客戶提供業務洞察力,監控公司服務的健康情況,並且自動呈現推薦以促成交銷售。 在本書中,你將學到如何讀取、寫入、清理和轉換數據—這些工作為耗時,但也為關鍵。接著,會提供相當廣泛的工具與技巧—可以說是數據科學家行走江湖的必備技能—內容涉及分類、聚類與回歸,圖論與時間序列分析,以及離散選擇模型與模擬等
" |