出版社:西安電子科技大學出版社 ISBN:9787560654607 商品編碼:10028937594399 包裝:平裝 出版時間:2019-09-01 代碼:22 作者:謝東亮
"基本信息 書名:數據清洗基礎與實踐 定價 作者:謝東亮 出版社:西安電子科技大學出版社 出版日期:2019-09-01 ISBN:9787560654607 字數: 頁碼: 版次:1 裝幀:平裝 開本:16開 商品重量: 編輯推薦
內容提要
數據的清洗是在大數據的挖掘與分析過程中的一個重要環節,由於數據類型的復雜性,采用傳統的清洗髒數據的工作會辛苦和乏味。但是如果能利用好的清洗工具和適當的方法則可以讓數據的清洗工作變得有趣並能達到事半功倍的效果。 本書從文件格式、數據類型、字符編碼等基本概念入手,通過實例,探討了如何提取和清洗關繫型數據、網頁數據,以及如何實現數據的轉換與加載。每個知識點都附有案例供讀者學習,通過實踐讓讀者掌握所有的數據清洗技術。 如果您是一位數據科學家,或者從事數據科學工作,哪怕是一個對數據科學感興趣的新手,那麼很高興本書適合您閱讀。 目錄
作者介紹
生於1980年1月,講師/項目監理師,碩士,重慶工程學院人工智能與大數據繫教師,主要從事人工智能與醫療大數據的研究。自2015年以來主持商業醫療大數據項目3項,產以上。公開發表論文7篇(EI檢索1篇)、主持、參與校級自然科學基金項目1項 、主持、參與建設校級重點課程1門 、主編、參與出版教材(教學講義)3部 序言
" |