出版社:人民郵電出版社 ISBN:9787115479648 商品編碼:27447015791 品牌:文軒 出版時間:2018-04-01 代碼:69 作者:本傑明·班福特(BenjaminBengfo
" 作 者:(美)本傑明·班福特(Benjamin Bengfort),(美)珍妮·基姆(Jenny Kim) 著;王純超 譯 定 價:69 出 版 社:人民郵電出版社 出版日期:2018年04月01日 頁 數:211 裝 幀:平裝 ISBN:9787115479648 ●前言ix ●第一部分 分布式計算入門 ●第1章 數據產品時代2 ●1.1 什麼是數據產品2 ●1.2 使用Hadoop構建大規模數據產品4 ●1.2.1 利用大型數據集4 ●1.2.2 數據產品中的Hadoop5 ●1.3 數據科學流水線和Hadoop生態繫統6 ●1.4 小結8 ●第2章 大數據操作繫統9 ●2.1 基本概念10 ●2.2 Hadoop架構11 ●2.2.1 Hadoop集群12 ●2.2.2 HDFS14 ●2.2.3 YARN15 ●2.3 使用分布式文件繫統16 ●2.3.1 基本的文件繫統操作16 ●2.3.2 HDFS文件權限18 ●2.3.3 其他HDFS接口19 ●2.4 使用分布式計算20 ●部分目錄 通過提供分布式數據存儲和並行計算框架,Hadoop已經從一個集群計算的抽像演化成了一個大數據的操作繫統。本書旨在通過以可讀且直觀的方式提供集群計算和分析的概覽,為數據科學家深入了解特定主題領域鋪平道路,從數據科學家的視角介紹Hadoop集群計算和分析。本書分為兩大部分,第 一部分從很好高的層次介紹分布式計算,討論如何在集群上運行計算;第二部分則重點關注數據科學家應該了解的工具和技術,意在為各種分析和大規模數據管理提供動力。 (美)本傑明·班福特(Benjamin Bengfort),(美)珍妮·基姆(Jenny Kim) 著;王純超 譯 本傑明·班福特(Benjamin Bengfort),數據科學家,目前正在馬裡蘭大學攻讀博士學位,方向為機器學習和分布式計算;熟悉自然語言處理、Python數據科學、Hadoop和Spark分析等。 珍妮·基姆(Jenny Kim),經驗豐富的大數據工程師,不僅進行商業軟件的開發,在學術界也有所建樹,在海量數據、機器學習以及生產和研究環境的Hadoop實施方面有深入研究。目前任職於Cloudera的Hue團隊。
" |