●譯者序
序
前言
章 IT領域的變革以及未來趨勢1
1.1 引言1
1.2 新興的IT趨勢1
1.3 數字化實體的實現與發展4
1.4 物聯網/萬物互聯5
1.5 對社交媒體網站的廣泛采用7
1.6 預測性、規範性、個性化分析時代7
1.7 用於大數據及分析的Apache Hadoop11
1.8 大數據、大洞見、大動作13
1.9 結論15
1.10 習題15
第2章 大數據/快速數據分析中的高性能技術16
2.1 引言16
2.2 大數據分析學科的出現17
2.3 大數據的戰略意義18
2.4 大數據分析的挑戰19
2.5 高性能計算範型19
2.6 通過並行實現高性能的方法21
2.7 集群計算22
2.8 網格計算24
2.9 雲計算27
2.10 異構計算29
2.11 用於高性能計算的大型機31
2.12 用於大數據分析的超級計算32
2.13 用於大數據分析的設備32
2.13.1 用於大規模數據分析的數據倉庫設備33
2.13.2 in-memory大數據分析35
2.13.3 大數據的in-database處理37
2.13.4 基於Hadoop的大數據設備38
2.13.5 高性能大數據存儲設備41
2.14 結論42
2.15 習題42
參考文獻43
第3章 大數據與快速數據分析對高性能計算的渴望44
3.1 引言44
3.2 重新審視大數據分析範型45
3.3 大數據和快速數據的含義47
3.4 用於準確、預測性、規範性洞見的新興數據源48
3.5 大數據分析為何不俗50
3.6 傳統的和新一代的數據分析案例研究51
3.7 為何采用基於雲的大數據分析55
3.8 大數據分析:主要處理步驟57
3.9 實時分析58
3.10 流分析62
3.11 傳感器分析63
3.11.1 大數據分析與高性能計算的同步:附加價值63
3.12 結論64
3.13 習題64
第4章 高性能大數據分析的網絡基礎設施65
4.1 引言65
4.2 當前網絡基礎設施的局限66
4.3 高性能大數據分析網絡基礎設施的設計方法68
4.3.1 網絡虛擬化68
4.3.2 軟件定義網絡76
4.3.3 網絡功能虛擬化78
4.4 用於傳輸大數據的廣域網優化79
4.5 結論81
4.6 習題81
參考文獻81
第5章 高性能大數據分析的存儲基礎設施82
5.1 引言82
5.2 直連式存儲83
5.2.1 DAS的缺點84
5.3 存儲區域網絡85
5.3.1 塊級訪問85
5.3.2 文件級訪問85
5.3.3 對像級訪問85
5.4 保存大數據的存儲基礎設施需求86
5.5 光纖通道存儲區域網絡87
5.6 互聯網協議存儲區域網絡88
5.6.1 以太網光纖通道88
5.7 網絡附屬存儲89
5.8 用於高性能大數據分析的流行文件繫統89
5.8.1 Google文件繫統89
5.8.2 Hadoop分布式文件繫統91
5.8.3 Panasas92
5.8.4 Luster文件繫統94
5.9 雲存儲簡介96
5.9.1 雲存儲繫統的架構模型96
5.9.2 存儲虛擬化98
5.9.3 雲存儲中使用的存儲優化技術100
5.9.4 雲存儲的優點101
5.10 結論101
5.11 習題101
參考文獻102
進一步閱讀102
第6章 使用高性能計算進行實時分析103
6.1 引言103
6.2 支持實時分析的技術103
6.2.1 in-memory處理103
6.2.2 in-database分析105
6.3 大規模在線分析106
6.4 通用並行文件繫統107
6.4.1 GPFS用例107
6.5 GPFS客戶案例研究111
6.5.1 廣播公司:VRT111
6.5.2 石油公司從Lustre遷移到GPFS113
6.6 GPFS:關鍵的區別113
6.6.1 基於GPFS的解決方案114
6.7 機器數據分析114
6.7.1 Splunk114
6.8 運營分析115
6.8.1 運營分析中的技術115
6.8.2 用例以及運營分析產品116
6.8.3 其他IBM運營分析產品117
6.9 結論117
6.10 習題118
第7章 高性能計算範型119
7.1 引言119
7.2 為何還需要大型機119
7.3 大型機中HPC是如何演化的120
7.3.1 成本:HPC的一個重要因素120
7.3.2 雲計算中的集中式HPC120
7.3.3 集中式HPC的要求121
7.4 HPC遠程模擬121
7.5 使用HPC的大型機解決方案121
7.5.1 智能大型機網格121
7.5.2 IMG的工作原理122
7.5.3 IMG架構122
7.6 架構模型125
7.6.1 具有共享磁盤的存儲服務器125
7.6.2 沒有共享磁盤的存儲服務器125
7.6.3 無存儲服務器的通信網絡125
7.7 對稱多處理126
7.7.1 什麼是SMP126
7.7.2 SMP與集群方法126
7.7.3 SMP是否真的重要126
7.7.4 線程模型127
7.7.5 NumaConnect技術127
7.8 用於HPC的虛擬化127
7.9 大型機方面的創新127
7.10 FICON大型機接口128
7.11 大型機對手機的支持129
7.12 Windows高性能計算129
7.13 結論130
7.14 習題131
第8章 in-database處理與in-memory分析132
8.1 引言132
8.1.1 分析工作負載與事務工作負載的對比132
8.1.2 分析工作負載的演化133
8.1.3 傳統分析平臺135
8.2 in-database分析135
8.2.1 架構137
8.2.2 優點和局限138
8.2.3 代表性的繫統138
8.3 in-memory分析140
8.3.1 架構141
8.3.2 優點和局限142
8.3.3 代表性的繫統142
8.4 分析設備145
8.4.1 Oracle Exalytics145
8.4.2 IBM Netezza145
8.5 結論147
8.6 習題147
參考文獻148
進一步閱讀148
第9章 大數據/快速數據分析中的高性能集成繫統、數據庫和數據倉庫149
9.1 引言149
9.2 下一代IT基礎設施和平臺的關鍵特征150
9.3 用於大/快速數據分析的集成繫統150
……