曙光:龍芯肯定出現(xiàn)在千萬(wàn)億次HPC中
對(duì)于國(guó)產(chǎn)服務(wù)器公司曙光而言,2008年研發(fā)成功的百萬(wàn)億次高性能計(jì)算機(jī)曙光5000A,使得其在國(guó)內(nèi)外HPC領(lǐng)域都取得了巨大的聲譽(yù)和成就,相關(guān)的高性能計(jì)算標(biāo)準(zhǔn)、個(gè)人HPC項(xiàng)目的推進(jìn),也都取得了不錯(cuò)的成績(jī),那么在2009年,曙光公司又會(huì)給業(yè)界帶來(lái)什么樣的技術(shù)呢?
記者日前采訪了曙光公司副總裁聶華,他大致描述了曙光公司的規(guī)劃,主要包括推進(jìn)刀片研發(fā)、千萬(wàn)億次HPC的技術(shù)儲(chǔ)備、虛擬化與HPC的結(jié)合使用等方面。
“總體而言,我們對(duì)2009年的發(fā)展還是很樂(lè)觀的?!甭櫲A表示。
推進(jìn)刀片標(biāo)準(zhǔn)
在2008年的曙光5000A中,曙光公司采用了基于AMD公司“巴塞羅那”芯片的四路四核的刀片服務(wù)器節(jié)點(diǎn)。聶華表示,在2009年Intel公司Nehalem芯片發(fā)布之后,曙光公司將會(huì)發(fā)布基于Nehalem芯片的四路四核刀片服務(wù)器,進(jìn)一步推動(dòng)刀片服務(wù)器產(chǎn)品的升級(jí)。
此外,曙光公司作為高標(biāo)委的成員單位,將會(huì)繼續(xù)推動(dòng)相關(guān)刀片服務(wù)器標(biāo)準(zhǔn)的工作?!案邩?biāo)委和曙光并不是等同的,當(dāng)然作為重要的成員單位,我們也在積極地跟包括Intel公司倡導(dǎo)的SSI(模塊化服務(wù)器)標(biāo)準(zhǔn)在內(nèi)的多個(gè)標(biāo)準(zhǔn)進(jìn)行溝通,盡可能地達(dá)到兼容?!甭櫲A表示。
他認(rèn)為,跟SSI標(biāo)準(zhǔn)之間的兼容并不是什么妥協(xié)的結(jié)果,而是盡可能地將標(biāo)準(zhǔn)進(jìn)行開(kāi)放和有更大的是易用性,這樣才能夠取得更大的成功。
聶華介紹說(shuō),在2009年,曙光公司將至少單獨(dú)承擔(dān)高表委標(biāo)準(zhǔn)項(xiàng)目中的某一個(gè),并且會(huì)致力于推動(dòng)該項(xiàng)目的驗(yàn)收工作。但是該標(biāo)準(zhǔn)將來(lái)的采用程度、行業(yè)標(biāo)準(zhǔn)的確立時(shí)間,就不是現(xiàn)在能夠確定的問(wèn)題了。
“也許,將來(lái)標(biāo)準(zhǔn)相對(duì)成熟了,高標(biāo)委都可以考慮將這些標(biāo)準(zhǔn)提交為國(guó)際標(biāo)準(zhǔn)。”聶華說(shuō)。不過(guò)他也同時(shí)表示,這些只是曙光公司的觀點(diǎn),畢竟曙光無(wú)法完全代表高標(biāo)委所包括的數(shù)十家企業(yè)聯(lián)盟。
千萬(wàn)億次HPC的技術(shù)儲(chǔ)備
在峰值為180.6萬(wàn)億次的曙光5000A研發(fā)成功之后,聶華表示,針對(duì)千萬(wàn)億次的高性能計(jì)算機(jī)的相關(guān)技術(shù)儲(chǔ)備已經(jīng)開(kāi)始,不過(guò)什么時(shí)候完成千萬(wàn)億次HPC的研發(fā),現(xiàn)在還很難說(shuō)。
“總體而言,整個(gè)技術(shù)是連續(xù)的,并不會(huì)等到千萬(wàn)億次項(xiàng)目真的通過(guò)審批才開(kāi)始準(zhǔn)備?!甭櫲A表示。
根據(jù)此前曙光公司總裁歷軍的觀點(diǎn),通過(guò)百萬(wàn)億次曙光5000A的研發(fā),他們至少已經(jīng)確認(rèn)了現(xiàn)在的研發(fā)方向是大體正確的,盡管千萬(wàn)億次是一個(gè)層級(jí)上的飛躍,但是他們相信技術(shù)難度并不會(huì)很大。
“現(xiàn)在的問(wèn)題是,千萬(wàn)億次HPC會(huì)不會(huì)跟龍芯有一定的結(jié)合?怎么結(jié)合,有多大范圍的節(jié)點(diǎn)需要用到龍芯?”聶華說(shuō)。根據(jù)他的觀點(diǎn),在曙光5000A中當(dāng)時(shí)也是設(shè)想有部分節(jié)點(diǎn)使用龍芯的,但是由于龍芯目前還不太成熟,因此沒(méi)有采用。但是無(wú)論是國(guó)家的要求還是企業(yè)的技術(shù)儲(chǔ)備,在千萬(wàn)億次的HPC中,都會(huì)有龍芯的節(jié)點(diǎn)。至于到底是獨(dú)立計(jì)算節(jié)點(diǎn)還是作為加速計(jì)算的節(jié)點(diǎn),現(xiàn)在很難決定。
龍芯尚不成熟
聶華表示,現(xiàn)在龍芯還不太成熟,面臨兩大主要的挑戰(zhàn)。***就是目前龍芯的性能還有待提高。在HPC領(lǐng)域,對(duì)節(jié)點(diǎn)的要求相當(dāng)高,也要求很高的穩(wěn)定性?!皩?duì)于龍芯來(lái)說(shuō),必須要做到四核或者八核,才能夠滿足千萬(wàn)億次HPC的要求?!甭櫲A表示。
此外,目前龍芯的相關(guān)應(yīng)用還不成熟。“我們不要求短期內(nèi)龍芯能夠有廣泛的應(yīng)用,但是從目前的角度來(lái)看,給用戶一個(gè)龍芯產(chǎn)品的話,是一個(gè)不負(fù)責(zé)任的做法?!甭櫲A認(rèn)為。
不過(guò)他也表示,龍芯的研究屬于計(jì)算所的范圍,曙光公司只是在積極地為龍芯在服務(wù)器領(lǐng)域的應(yīng)用提供支持。
虛擬化結(jié)合HPC
Dell公司技術(shù)工程師連陳航在其博客中表示,虛擬化技術(shù)并不適合高性能計(jì)算領(lǐng)域。不過(guò),聶華有著不同的看法。他認(rèn)為通過(guò)服務(wù)器虛擬化,可以解決一些機(jī)器資源再分配的問(wèn)題,從而進(jìn)一步提高服務(wù)器的利用率問(wèn)題。
“這一點(diǎn),對(duì)于HPC來(lái)講,虛擬化的價(jià)值其實(shí)更大,相關(guān)的收益也更多?!甭櫲A說(shuō)。他認(rèn)為,對(duì)于HPC中的胖節(jié)點(diǎn)(比如說(shuō)8路服務(wù)器系統(tǒng)),使用虛擬化能夠得到更高的效率,也能夠讓操作系統(tǒng)更靈活,這個(gè)就比此前的網(wǎng)格技術(shù)更為靈活。
“在此之前,在網(wǎng)格體系中的機(jī)器很難解決收費(fèi)與產(chǎn)權(quán)的問(wèn)題,現(xiàn)在通過(guò)虛擬機(jī)分配資源之后,通過(guò)與云計(jì)算概念的結(jié)合,使得相關(guān)的資源分配變得透明了,這就是虛擬化跟HPC結(jié)合的意義?!甭櫲A表示,“這將對(duì)我們HPC未來(lái)的發(fā)展產(chǎn)生非常深遠(yuǎn)的影響。”
不過(guò),在筆者看來(lái),聶華的觀點(diǎn)應(yīng)該是針對(duì)曙光5000A這樣的通用HPC平臺(tái)而言的,畢竟,該平臺(tái)用于對(duì)公眾服務(wù),其節(jié)點(diǎn)的利用率并不一定很高;而一般的HPC平臺(tái)是用于專項(xiàng)研究,其節(jié)點(diǎn)的利用效率可能達(dá)到90%甚至以上,沒(méi)有虛擬化的需要。
保持樂(lè)觀的2009
面對(duì)2009年,聶華表示,曙光公司還是保持著樂(lè)觀的態(tài)度,畢竟HPC領(lǐng)域受到的波及相對(duì)會(huì)小一些。“從2008年的經(jīng)歷之后,我們?cè)絹?lái)越認(rèn)識(shí)到產(chǎn)品是企業(yè)發(fā)展真正的動(dòng)力和源泉。”聶華說(shuō)。
他表示,現(xiàn)在曙光需要做的就是盡力推動(dòng)產(chǎn)品和技術(shù)研發(fā),研發(fā)有特色的產(chǎn)品,研發(fā)有差異性的產(chǎn)品?!巴ㄓ眯彤a(chǎn)品,至少不是曙光目前的策略,我們要堅(jiān)持走差異化的創(chuàng)新之路,一年干不成,就兩三年乃至更多年?!甭櫲A說(shuō)。
【編輯推薦】