出版社:機械工業出版社 ISBN:9787111602149 商品編碼:36692624100 品牌:文軒 出版時間:2018-07-01 代碼:59 作者:弗蘭克·尼爾森(FrankNielsen)著
" 作 者:(法)弗蘭克·尼爾森(Frank Nielsen) 著;張偉哲 等 譯 定 價:59 出 版 社:機械工業出版社 出版日期:2018年07月01日 頁 數:217 裝 幀:平裝 ISBN:9787111602149 ●譯者序 ●前言 ●致謝 ●第一部分基於消息傳遞接口的高性能計算 ●第1章走進高性能計算 ●1.1什麼是高性能計算 ●1.2為什麼我們需要HPC ●1.3大數據:四個特性(數據量、多樣性、生成速度、價值) ●1.4並行編程範式:MPI和MapReduce ●1.5粒度:細粒度並行與粗粒度並行 ●1.6超級計算架構:內存和網絡 ●1.7加速比 ●1.7.1擴展性和等效率分析 ●1.7.2Amdahl定律:描述數據規模固定時漸近加速比的變化趨勢 ●1.7.3Gustafson定律:可擴展的加速比,隨著資源的增加不斷擴大數據量 ●1.7.4在串行計算機上模擬並行機 ●1.7.5大數據和並行輸入/輸出 ●1.8關於分布式繫統的八個常見誤區 ●1.9注釋和參考 ●1.10總結 ●部分目錄 本書使用MPI標準介紹了數據科學中的高性能計算,幫助讀者了解分布式存儲模型中的並行編程的知識。全書分為兩部分,靠前部分(靠前~6章)基於消息傳遞接口介紹高性能計算,內容包括:阻塞與非阻塞的點對點通信、死鎖、全局通信函數(廣播、散播等)、協同計算(歸約)的基本概念;互聯網絡的拓撲結構(環、環面和超立方體)以及相應的全局通信程序;基於分布式內存的並行排序及其實現,涵蓋相關並行線性代數知識;MapReduce模型。第二部分(第7~11章)介紹計算機集群中的高性能數據分析,內容包括:數據聚類技術(平面劃分聚類、層次聚類);基於k-NN的有監督分類;核心集以及相關降維技術;圖算法(稠密子圖、圖同構檢測)。每章章末附有各種難度的練習和參考文獻,可供讀者進行自測和深入學習。本書適合作為“高性能計算”相關課程的本科生教材。 (法)弗蘭克·尼爾森(Frank Nielsen) 著;張偉哲 等 譯 弗蘭克·尼爾森,巴黎綜合理工學院教授,負責教授研究生計算機視覺和圖形學方面的課程以及本科生的算法和Java課程。他是Sony計算機科學實驗室研究員。 前言歡迎來到高性能計算的世界!歡迎來到高性能數據科學的世界! 在本書中,我們將介紹面向數據科學(Data Science,DS)的高性能計算(High Performance Computing,HPC)。因此,本書主要分為兩個部分:第一部分(前6章)涵蓋HPC的基本原理;第二部分(後5章)介紹了數據科學的基本知識,並展示了如何編寫面向基本串行算法的分布式程序,以應對大規模數據集。當前,許多大規模數據集都是公開的,這些數據集中蘊含了豐富的信息,但是這些信息需要通過精心設計纔能被提取出來。 我們主要區分兩種並行算法的設計方法:在單個共享內存多核機器上使用多線程並行化算法;在分布式內存集群繫統上並行化算法。 一方面,當在共享內存等
" |