[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

數據整理實踐指南
該商品所屬分類:計算機/網絡 -> 數據庫
【市場價】
443-643
【優惠價】
277-402
【介質】 book
【ISBN】9787115411020
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



  • 出版社:人民郵電
  • ISBN:9787115411020
  • 作者:(美)麥卡倫|譯者:魏秀麗//李妹芳
  • 頁數:209
  • 出版日期:2016-03-01
  • 印刷日期:2016-03-01
  • 包裝:平裝
  • 開本:16開
  • 版次:1
  • 印次:1
  • 字數:261千字
  • 隨著數據科學的熱門,數據的優化、整理以及如
    何處理不良數據成為人們關注的重點。本書通過處理
    不良數據,進行數據清理的案例,向讀者展示了處理
    數據的方法。
    麥卡倫著魏秀麗、李妹芳編譯的《數據整理實踐
    指南》共有19章,從6部分向讀者展示了使用和清理
    不良數據背後的理論和實踐。第1部分是Grubby的動
    手實踐指南,它向讀者介紹了駕馭、提取數據的方法
    ,如何處理文本數據中的數據以及Web開發中踫到的
    數據問題。第2部分是讓人充滿意外的數據,它向讀
    者介紹了數據也會“撒謊”。第3部分是方法,它向
    讀者介紹了處理不良數據的一些方法。第4部分是數
    據存儲和基礎設施,它向讀者介紹了如何存儲數據。
    第5部分是數據的商業化,它向讀者介紹了如何避免
    數據處理的一些誤差。第6部分是數據策略,它向讀
    者介紹了如何追蹤數據、評估數據質量以及構建數據
    質量相關平臺等。
    本書適合數據科學家、數據處理和整理相關開發
    人員閱讀。也適合想要進入數據處理領域的讀者閱讀

  • 第1章 從頭說起:什麼是噪音數據
    第2章 是我的問題還是數據的問題
    2.1 理解數據結構
    2.2 校驗
    2.2.1 字段校驗
    2.2.2 值校驗
    2.2.3 簡單統計的物理解釋
    2.3 可視化
    2.3.1 關鍵詞競價排名示例
    2.3.2 搜索來源示例
    2.3.3 **分析
    2.3.4 時間序列數據
    2.4 小結
    第3章 數據是給人看的不是給機器看的
    3.1 數據
    3.1.1 問題:數據是給人看的
    3.1.2 對數據的安排
    3.1.3 數據分散在多個文件中
    3.2 解決方案:編寫代碼
    3.2.1 從糟糕的數據格式中讀取數據
    3.2.2 從多個文件中讀取數據
    3.3 附言
    3.4 其他格式
    3.5 小結
    第4章 純文本中潛在的噪音數據
    4.1 使用哪種純文本編碼?
    4.2 猜測文本編碼格式
    4.3 對文本規範化處理
    4.4 問題:在純文本中摻入了特定應用字符
    4.5 通過Python處理文本
    4.6 實踐練習題
    第5章 重組Web數據
    5.1 你能獲得數據嗎
    5.1.1 一般工作流程示例
    5.1.2 Robots 協議
    5.1.3 識別數據組織模式
    5.1.4 存儲離線版本
    5.1.5 網頁抓取信息
    5.2 真正的困難
    5.2.1 下載原始內容
    5.2.2 表單、對話框和新建窗口
    5.2.3 Flash
    5.3 不利情況的解決辦法
    5.4 小結
    第6章 檢測撒謊者以及相互矛盾網上評論的困惑
    6.1 Weotta公司
    6.2 獲得評論
    6.3 情感分類
    6.4 極化語言
    6.5 創建語料庫
    6.6 訓練分類器
    6.7 分類器驗證
    6.8 用數據設計
    6.9 經驗教訓
    6.10 小結
    6.11 信息資源
    第7章 請噪音數據站出來
    7.1 實例1:在制造業中減少缺陷
    7.2 實例2:誰打來的電話
    7.3 實例3:當“典型的”不等於“平均的”
    7.4 經驗總結
    7.5 到工廠參觀能成為試驗的一部分嗎
    第8章 血、汗和尿
    第9章 當數據與現實不匹配
    **0章 偏差和誤差的來源
    **1章 不要把**和正確對立起來:噪音數據真是噪音嗎
    **2章 數據庫攻擊:什麼時候使用文件
    **3章 臥庫表,隱網絡
    **4章 雲計算神話
    **5章 數據科學的陰暗面
    **6章 如何雇傭機器學習專家
    **7章 數據的可追蹤性
    **8章 社交媒體:是可抹去的印記嗎
    **9章 揭秘數據質量分析:了解什麼時候數據足夠優質
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部