讓高性能計算機(jī)性能"看得見"
10月26至29日,一年一度的高性能計算領(lǐng)域盛會“2011年全國高性能計算學(xué)術(shù)年會”(HPC China 2011)在山東濟(jì)南山東大廈召開。26日舉行的是國際高性能計算咨詢委員會2011中國研討會(HPC Advisory Council China Workshop 2011),IT168作為獨(dú)家網(wǎng)絡(luò)支持媒體為您做現(xiàn)場報道。
▲HPC China 2011專題
北京并行科技有限公司(Paratera)CTO陳健作了《從Linpack年代到真實(shí)應(yīng)用性能年代》的報告。
陳健談到,雖然人們一提及高性能計算機(jī)時,往往會用Linpack測試值來衡量HPC機(jī)器的性能,如TOP500排行榜,但實(shí)際上用戶對這種衡量標(biāo)準(zhǔn)并不滿意,因?yàn)樗诟咝阅苡嬎銠C(jī)的選型、優(yōu)化過程中無法提供有效的參考。憑借在聯(lián)想做了3年方案、在英特爾做了5年調(diào)優(yōu)的經(jīng)驗(yàn)積累,陳健對用戶真正想要的東西很清楚。
▲
在此次會議上,他介紹了并行科技公司新推出的Paramon應(yīng)用運(yùn)行特征收集器、Paratune應(yīng)用運(yùn)行特征分析器等性能監(jiān)控管理工具軟件,并表示其目的是要讓高性能計算機(jī)的性能可以“看得見”,讓HPC用戶和從業(yè)人員可以更簡單有效地掌握機(jī)器性能,從而快速采取相應(yīng)的對策。
陳健從最終用戶的需求出來,指出了當(dāng)前高性能計算性能優(yōu)化面臨的幾個重要問題:
一是絕大多數(shù)實(shí)際運(yùn)行的軟件只發(fā)揮硬件很少的計算能力,問題是如何快速準(zhǔn)確測量當(dāng)前軟件發(fā)揮了多少計算能力?
二是軟件優(yōu)化技術(shù)太復(fù)雜、太耗時,問題是如何讓調(diào)優(yōu)普及化,如何用20%的時間挖掘出80%的優(yōu)化空間?
三是高性能計算應(yīng)用為先,需要提供匹配關(guān)鍵應(yīng)用的硬件方案,問題是如何快速確定應(yīng)用對硬件各組件的需求情況?
針對上述問題,北京并行科技有限公司提出了“快速應(yīng)用運(yùn)行特征分析方法”這一解決方法(包括面向最終用戶的Paramon應(yīng)用運(yùn)行特征收集器和面向軟硬件廠商開發(fā)人員的Paratune應(yīng)用運(yùn)行特征分析器),盡可能讓高性能計算機(jī)實(shí)際運(yùn)行過程中的所有性能數(shù)據(jù)都能“可視化”,從而幫助用戶更有效地實(shí)現(xiàn)系統(tǒng)的選型、配置、調(diào)優(yōu)與管理。
▲
據(jù)介紹,其中,Paramon應(yīng)用運(yùn)行特征收集器,通過實(shí)時監(jiān)控機(jī)群管理/登錄節(jié)點(diǎn)、計算節(jié)點(diǎn)、IO節(jié)點(diǎn)等服務(wù)器的處理器、內(nèi)存、網(wǎng)絡(luò)和存儲性能數(shù)據(jù),提供機(jī)群系統(tǒng)中應(yīng)用軟件隨時間變化的運(yùn)行特征。Paramon軟件面向IT管理人員、硬件管理員、機(jī)房管理員等用戶角色,通過實(shí)時監(jiān)控、采集機(jī)群中服務(wù)器的CPU、GPU、內(nèi)存、網(wǎng)絡(luò)和存儲等關(guān)鍵設(shè)備的系統(tǒng)級和微架構(gòu)級性能數(shù)據(jù)(Gflops、Memory Bandwidth、Vectorization、CPI、GIPS),以圖形化的方式直觀顯示,快速反映提供機(jī)群系統(tǒng)中應(yīng)用軟件隨時間變化的運(yùn)行特征,同時了解硬件環(huán)境的運(yùn)行現(xiàn)狀,快速了解機(jī)群中隱含的硬件問題,從而在問題發(fā)生時***時間給出解決方案。
▲
▲
▲
Paratune應(yīng)用運(yùn)行特征分析器,則可以分析Paramon生成的.para應(yīng)用運(yùn)行特征文件,顯示應(yīng)用運(yùn)行時各節(jié)點(diǎn)中處理器、內(nèi)存、網(wǎng)絡(luò)和磁盤的性能數(shù)據(jù),重構(gòu)機(jī)群應(yīng)用運(yùn)行過程,高效、準(zhǔn)確地描述應(yīng)用的運(yùn)行特征。硬件廠商機(jī)群方案設(shè)計人員根據(jù)用戶應(yīng)用運(yùn)行特征圖,可以清楚的了解應(yīng)用在運(yùn)行的各個階段,對硬件設(shè)備處理器、內(nèi)存、網(wǎng)絡(luò)和磁盤等各部分的需求情況,基于這樣準(zhǔn)確的數(shù)據(jù)分析,方案人員可以提供有針對性、真正符合客戶應(yīng)用需求的HPC機(jī)群設(shè)計方案。應(yīng)用軟件優(yōu)化人員根據(jù)用戶應(yīng)用運(yùn)行特征圖,可以準(zhǔn)確了解用戶應(yīng)用程序的運(yùn)行狀態(tài),了解程序運(yùn)行熱點(diǎn)段對各種硬件部件的依賴程度,快速定位系統(tǒng)性能瓶頸,找到應(yīng)用優(yōu)化的空間和方向。
▲
陳健表示,目前Paramon應(yīng)用運(yùn)行特征收集器在全國已經(jīng)安裝了100套,用戶可以在www.paratera.com上直接下載試用。
【編輯推薦】