虛擬化是否會(huì)影響高性能計(jì)算性能?
上周,專注于計(jì)算機(jī)系統(tǒng)和應(yīng)用的AICCSA國際會(huì)議召開,IBM加拿大的云計(jì)算CTO Mazin Yousif博士在會(huì)議上做了有關(guān)云計(jì)算的主題演講,并接受了記者采訪。
2000年Mazin在加入英特爾之后不久就開始專注于Infiniband,面向自適應(yīng)性網(wǎng)格體系結(jié)構(gòu),隨后當(dāng)他成為Infiniband貿(mào)易協(xié)會(huì)(IBTA)管理工作部門主席的頭兒之后便一頭鉆進(jìn)HPC,這個(gè)協(xié)會(huì)定義了Infiniband結(jié)構(gòu)。在很多Top500 HPC系統(tǒng)中,Infiniband都是互連的基礎(chǔ),并且實(shí)現(xiàn)了高帶寬低延遲的通信優(yōu)化。
通過Infiniband建立互連通道來架設(shè)高性能計(jì)算應(yīng)用,可以直接訪問硬件,繞過操作系統(tǒng)和驅(qū)動(dòng)程序,可以減少延遲幾百納秒(以太網(wǎng)在通信通過TCP/IP時(shí)通過鏈路層和物理層,導(dǎo)致訪問速度變慢)。Mazin博士因?yàn)橛羞@樣的專業(yè)知識(shí)和HPC方面的經(jīng)驗(yàn),回答一些有關(guān)云計(jì)算中虛擬化會(huì)不會(huì)影響到HPC應(yīng)用的問題再合適不過。
記者:我們聽說過一些虛擬化造成的額外成本負(fù)擔(dān),虛擬化如何能真正影響HPC應(yīng)用的性能?
Mazin Yousif:在回答這個(gè)問題之前,我們首先應(yīng)該來看看虛擬機(jī)管理程序(VMM)的角色。VMM位于所有硬件之上,將所有的硬件資源抽象成聚合的虛擬資源,最后以虛擬機(jī)的形式呈現(xiàn)。通常情況下,VMM需要驅(qū)動(dòng)來通過I/O資源,這要求額外的I/O資源。
記者:這是否意味著一些計(jì)算敏感型應(yīng)用不會(huì)被虛擬化影響?
Mazin Yousif:是的。如果計(jì)算敏感型的應(yīng)用完全在虛擬機(jī)里運(yùn)行,那么虛擬機(jī)和VMM的入口非常少,對整體性能的影響是很小的。
記者:那么I/O密集型應(yīng)用呢?
Mazin Yousif:哦,在這些應(yīng)用上,額外的資源需求非常明顯。因?yàn)樗械奶摂M機(jī)中I/O指令都將通過VMM,這是I/O驅(qū)動(dòng)程序所在的地方,同時(shí)就要求物理的I/O資源。這通常會(huì)要求額外的時(shí)間大概有幾十或者幾百微秒。在一個(gè)實(shí)際的混合計(jì)算密集型和I/O密集型應(yīng)用的HPC系統(tǒng)中,開銷的數(shù)額肯定在兩者之間。
記者:能避免這些開銷嗎?
Mazin Yousif:可能不完全,但是原則上是可以的。首先,虛擬化解決方案供應(yīng)商可以進(jìn)一步優(yōu)化,比如減少VMM代碼中一個(gè)I/O操作的關(guān)鍵路徑;二,可以不通過VMM,將I/O直接分配到虛擬機(jī)中,從而消除了VMMV造成的開銷。這可以通過配置VMM來實(shí)現(xiàn)。但是缺點(diǎn)是,現(xiàn)在你需要為每個(gè)虛擬機(jī)定義單獨(dú)的I/O,而不是像之前那樣幾個(gè)虛擬機(jī)共享設(shè)備。虛擬化不僅影響延遲,也會(huì)影響帶寬,在一個(gè)主要是計(jì)算密集型的工作中,分配虛擬機(jī)內(nèi)存時(shí)與運(yùn)行同樣的物理資源的工作相比不會(huì)看到任何的折扣,在混合應(yīng)用的作業(yè)中,一個(gè)指定的I/O會(huì)有很大幫助。
記者:當(dāng)分配虛擬機(jī)以運(yùn)行高性能計(jì)算作業(yè)的時(shí)候,會(huì)更有利的環(huán)境是保持運(yùn)行狀態(tài)還是實(shí)時(shí)加以調(diào)整,以跟蹤資源的工作量要求變化?
Mazin Yousif:配置虛擬機(jī)與適應(yīng)的工作量資源需求是非常必要的,要跟蹤工作量的變化,包括VMM的規(guī)定分配給虛擬機(jī)增加或者減少資源的基礎(chǔ),如果VMM提供的彈性是不夠的,那么其它功能,比如VMware的分布式資源調(diào)度以及VMotion可以實(shí)現(xiàn)。
記者:那作為一個(gè)高性能計(jì)算用戶的話,應(yīng)當(dāng)怎么做?
Mazin Yousif:如果你有混合應(yīng)用打算的話,你可以決定是否允許一個(gè)I/O設(shè)備直接訪問虛擬機(jī)。
記者:但是這意味著比如有能力配置VMM,我理解這個(gè)可以在私有云中實(shí)現(xiàn),但是如何在公有云中實(shí)現(xiàn)呢?
Mazin Yousif:現(xiàn)在還不能。公有云服務(wù)供應(yīng)商當(dāng)然不會(huì)允許HPC最終用戶去決定是否允許單獨(dú)的I/O設(shè)備去指向每個(gè)單獨(dú)的虛擬機(jī),或者是幾個(gè)虛擬機(jī)共享一個(gè)。如果真的有這種需求的話,那么高性能計(jì)算委員會(huì)應(yīng)當(dāng)要求公有云能夠提供HPC所需的功能,從而在云中實(shí)現(xiàn)高性能計(jì)算。
記者:所以這是你的結(jié)論和建議?
Mazin Yousif:我不認(rèn)為虛擬化會(huì)阻礙高性能計(jì)算性能。為了進(jìn)一步滿足HPC領(lǐng)域,我們敦促云服務(wù)供應(yīng)商將云中部署虛擬化環(huán)境作為高性能計(jì)算的最佳選擇之一。
【編輯推薦】