概念PK:云計(jì)算與高性能計(jì)算(HPC)
超級計(jì)算機(jī)和云計(jì)算都是時(shí)下比較火的兩個(gè)概念,前者一般主要面向科學(xué)計(jì)算、工程模擬、動漫渲染等領(lǐng)域,大多屬于計(jì)算密集型的應(yīng)用,后者則主要是在Web2.0、社交網(wǎng)絡(luò)、企業(yè)IT建設(shè)和信息化等領(lǐng)域,以數(shù)據(jù)密集型、I/O密集型應(yīng)用為主。雖然側(cè)重點(diǎn)有所不同,但這兩者之間是很有淵源的,比如兩者都使用了分布式計(jì)算、網(wǎng)格計(jì)算、集群、高密度計(jì)算等技術(shù),也有一些領(lǐng)域在使用云計(jì)算從事HPC類的應(yīng)用,如北京市計(jì)算中心就在打造“北京工業(yè)云”,為中小企業(yè)提供產(chǎn)品設(shè)計(jì)模擬服務(wù),浪潮和NVIDIA也在分別推各自的“渲染云”方案。不過,HPC與云計(jì)算也存在很多不同,比如HPC幾乎不用虛擬化技術(shù),因?yàn)橐粋€(gè)應(yīng)用就可能把多個(gè)機(jī)器的CPU都跑滿了,虛擬機(jī)沒什么用武之地,而在企業(yè)私有云中,虛擬化卻是一個(gè)最基礎(chǔ)的技術(shù)。
中科院計(jì)算所所長李國杰院士在主題演講《云計(jì)算與HPC——兼談加強(qiáng)計(jì)算機(jī)系統(tǒng)研究的必要性》中,就高性能計(jì)算與云計(jì)算之間的關(guān)系談了許多觀點(diǎn),現(xiàn)總結(jié)如下:
中科院計(jì)算所所長李國杰院士
#p#
云計(jì)算是超級計(jì)算中的新發(fā)展
對高性能計(jì)算(HPC)而言,云計(jì)算并不是一個(gè)新的概念。事實(shí)上,已經(jīng)發(fā)展近30年的超級計(jì)算中心也是一種早期的云計(jì)算模式:昂貴的計(jì)算資源集中部署,多個(gè)領(lǐng)域的用戶通過互聯(lián)網(wǎng)遠(yuǎn)程使用計(jì)算服務(wù)并依據(jù)使用量支付費(fèi)用。但這種HPC服務(wù)和當(dāng)前所談?wù)摰脑朴?jì)算又有著一些明顯的區(qū)別,如沒有充分采用虛擬化技術(shù),沒有良好的用戶界面等。
云計(jì)算將擴(kuò)大HPC服務(wù)的范圍。隨著虛擬化即時(shí)的提高,通信延遲降低,緊耦合的計(jì)算將在更大范圍內(nèi)具有吸引力。
特別是位于高端計(jì)算和桌面計(jì)算之間,存在眾多對高性能計(jì)算有潛在需求的用戶。調(diào)研表明,阻礙這些潛在用戶使用高性能計(jì)算的主要障礙包括:缺乏HPC人才,建設(shè)和運(yùn)維的成本以及使用HPC應(yīng)用的復(fù)雜度。而云計(jì)算正是應(yīng)對這些挑戰(zhàn)的最佳途徑。
#p#
云計(jì)算還不合適做尖端的超級計(jì)算機(jī)
Dan Reed認(rèn)為,云計(jì)算絕對不是為特定目的構(gòu)造的性能頂尖計(jì)算機(jī)的替代器。如果一種Petascale計(jì)算需要極低的任務(wù)間通信延遲,今天的云計(jì)算肯定不適合。但是對于大多數(shù)使用較小規(guī)模設(shè)備的研究者,云計(jì)算是有吸引力的替代器。
目前的云模型并不支持頂尖的超級計(jì)算。動員Grand Challenge應(yīng)用的人做云計(jì)算就如同要說服駕駛F1賽車的人去乘公共汽車。HPC主要執(zhí)行計(jì)算密集型的任務(wù),CPU的利用率已經(jīng)很高,因此虛擬化技術(shù)對于HPC的CPU利用率作用不大。虛擬化對計(jì)算密集型(如果數(shù)據(jù)能全部放進(jìn)內(nèi)存)應(yīng)用的影響很小,而I/O密集型應(yīng)用的性能則會有一定下降。
目前的云計(jì)算做HPC效率較低
基于云計(jì)算理念來構(gòu)建超級計(jì)算中心,除了滿足傳統(tǒng)的或現(xiàn)有的HPC用戶需求外,更重要 提創(chuàng)造并吸引眾多新領(lǐng)域的用戶。美國德州先進(jìn)計(jì)算中心(TACC)的Edward Walker對Amazon EC2上HPC應(yīng)用的性能表現(xiàn)進(jìn)行了研究,應(yīng)用選擇常用的基準(zhǔn)測試程序NPB,測試結(jié)果表明:幾乎相同的硬件條件下,對OpenMP版本的8個(gè)測試程序EC2性能下降7%至21%不等,MPI版本性能則下降40%至1000%不等。
今天的數(shù)據(jù)中心與未來的HPC
云計(jì)算的易用性會影響傳統(tǒng)的HPC計(jì)算模式,傳統(tǒng)的排隊(duì)批處理方式很難實(shí)現(xiàn)按需即時(shí)響應(yīng)的科學(xué)計(jì)算,On-demand的云計(jì)算給HPC提供了更易交互的計(jì)算模式。如同幾年前用大眾化的PC服務(wù)器搭建集群以及最近用GPU加速科學(xué)計(jì)算一樣,云計(jì)算對于HPC也是一次模式轉(zhuǎn)變。
構(gòu)建百萬節(jié)點(diǎn)數(shù)量級的數(shù)據(jù)中心與今天構(gòu)建Petascale(千萬億次)及今年后構(gòu)建Exascale(億億次)的系統(tǒng)有許多相同的困難。Dan Reed認(rèn)為,他們就象是一對“雙胞胎”,面臨共同的挑戰(zhàn)包括:高速互連、存儲分層(包括Flash,PCM等)、異構(gòu)多核處理器、系統(tǒng)可靠性和恢復(fù)能力、機(jī)柜、冷卻、能耗效率和編程等等。今天Mega-datacenter的經(jīng)驗(yàn)將可用于未來的Exascale超級計(jì)算機(jī)設(shè)計(jì)。
云平臺將最終取代HPC基礎(chǔ)設(shè)施
美國IT戰(zhàn)略科學(xué)家Dan Reed指出,云計(jì)算使得計(jì)算和海量數(shù)據(jù)特別便宜,云平臺最終將取代傳統(tǒng)的HPC基礎(chǔ)設(shè)施。如果主機(jī)(Mainframe)是跳棋,PC和Internet是象棋,云計(jì)算則是要眼觀全局的圍棋。
另外,李國杰院士還特別指出,雖然云計(jì)算是發(fā)展趨勢所在,但現(xiàn)在對云計(jì)算基礎(chǔ)關(guān)鍵技術(shù)的研究還遠(yuǎn)遠(yuǎn)不夠,業(yè)界過于偏重虛擬化技術(shù),而忽視了對計(jì)算機(jī)系統(tǒng)技術(shù)的研究。參考閱讀:李國杰:云計(jì)算不可忽視計(jì)算機(jī)系統(tǒng)研究。
【編輯推薦】
- 不辯不明!云計(jì)算“十二金釵”上演擂臺賽
- 創(chuàng)新盛典!盤點(diǎn)十大熱門云計(jì)算創(chuàng)新企業(yè)
- 潮人必備!50款代替桌面軟件的在線服務(wù)
- 超級實(shí)用!十個(gè)開源云計(jì)算資源大推薦