CERN如何應(yīng)對(duì)未來(lái)EB級(jí)的高能物理數(shù)據(jù)?
歐洲核子研究中心(CERN)成立于1954年,是世界上***的粒子物理學(xué)實(shí)驗(yàn)室,主要業(yè)務(wù)是探索宇宙本源,促進(jìn)人類進(jìn)步,培養(yǎng)下一代科技接班人。CERN有22個(gè)成員國(guó),主要來(lái)自歐洲,合作伙伴遍布全球機(jī)構(gòu)和院校,大約1.2萬(wàn)來(lái)自70國(guó)家和105不同國(guó)籍的科學(xué)家來(lái)到CERN從事研究, 這是世界上一半的粒子物理學(xué)家。2012年,聞名世界的希格斯玻色子(俗稱“上帝粒子”)就是在CERN的大型強(qiáng)子對(duì)撞機(jī)(LHC,Large Hadron Collider)實(shí)驗(yàn)中發(fā)現(xiàn)的。
近日,CERN IT部門(mén)的資源管理團(tuán)隊(duì)負(fù)責(zé)人Jan van Eldik在2017華為全聯(lián)接大會(huì)(HUAWEI CONNECT 2017)上,介紹了CERN正在采用的一些方法,應(yīng)對(duì)未來(lái)其實(shí)驗(yàn)產(chǎn)生的快速增長(zhǎng)的數(shù)據(jù)洪流。
圖1 Jan van Eldik 在Huawei Connect 2017上發(fā)言
海量數(shù)據(jù)的源頭
CERN擁有大型強(qiáng)子對(duì)撞機(jī)LHC——世界上***的粒子加速器。LHC是一個(gè)全長(zhǎng)27公里的環(huán)(如下圖),位于瑞士日內(nèi)瓦近郊,貫穿瑞法邊境。LHC把環(huán)超導(dǎo)磁體安裝在地下100米,創(chuàng)造出比地球磁場(chǎng)強(qiáng)10萬(wàn)倍以上的磁場(chǎng),在抽成真空的磁體管道里,粒子被加速到接近光速的水平,在4個(gè)大型實(shí)驗(yàn)的粒子探測(cè)器里進(jìn)行碰撞:ATLAS, CMS, ALICE, LHCb。
在大型強(qiáng)子對(duì)撞機(jī)實(shí)驗(yàn)的探測(cè)器中,每秒可進(jìn)行多達(dá)10億次的粒子對(duì)撞,我們不可能讀出所有這些事件,因此“Trigger(觸發(fā))”系統(tǒng)用于層層過(guò)濾數(shù)據(jù),并選擇那些對(duì)進(jìn)一步分析有潛在價(jià)值的事件。
這些操作產(chǎn)生的數(shù)據(jù)隨后通過(guò)全球LHC計(jì)算網(wǎng)格(WLCG,World LHC Computing Grid)的系統(tǒng)從CERN數(shù)據(jù)中心分發(fā)到42個(gè)國(guó)家的170個(gè)計(jì)算中心。在撰寫(xiě)本文時(shí),CERN數(shù)據(jù)中心已經(jīng)在磁帶上存儲(chǔ)了超過(guò)200 PB的數(shù)據(jù),預(yù)計(jì)每月增加PB級(jí)的新數(shù)據(jù)。
圖2. LHC與其試驗(yàn)場(chǎng)景
為什么選擇公有云
自2013年以來(lái),CERN部署了一個(gè)基于OpenStack的私有云,用于管理位于瑞士梅蘭(Meyrin)的主數(shù)據(jù)中心資源,以及位于匈牙利布達(dá)佩斯的遠(yuǎn)程擴(kuò)展數(shù)據(jù)中心。今天,這朵私有云包括大約10,000臺(tái)雙CPU服務(wù)器,約300,000個(gè)處理器內(nèi)核,服務(wù)于約3600個(gè)項(xiàng)目,包括高密度計(jì)算,物理數(shù)據(jù)分析和虛擬服務(wù)配置。
計(jì)劃升級(jí)LHC及在CERN進(jìn)行的更多實(shí)驗(yàn),意味著對(duì)計(jì)算和存儲(chǔ)的需求將大大增加。例如,當(dāng)LHC的后繼者,高亮度LHC在2026年上線的時(shí)候,ATLAS和CMS的實(shí)驗(yàn)期望收集和重建的碰撞事件比現(xiàn)在多5到10倍。使用當(dāng)前的軟件,硬件和分析技術(shù),所需的計(jì)算能力預(yù)計(jì)比現(xiàn)在高出大約50-100倍。到那時(shí),數(shù)據(jù)存儲(chǔ)需求預(yù)計(jì)將達(dá)到EB級(jí)(1EB=109G)。
簡(jiǎn)單地按ICT新增資源量來(lái)等比增加預(yù)算,以縮小“資源缺口”是不現(xiàn)實(shí)的。為確保資源利用的***效率,探索新技術(shù)和方法至關(guān)重要,目前正在研究的一種方法是采用混合模式,在內(nèi)部資源不夠的情況下,CERN可以使用商用的云服務(wù)資源來(lái)動(dòng)態(tài)擴(kuò)展其內(nèi)部資源。
攜手Open Telecom Cloud 來(lái)應(yīng)對(duì)未來(lái)挑戰(zhàn)
目前CERN正在通過(guò)Helix Nebula(“螺旋星云”)項(xiàng)目來(lái)進(jìn)行公有云試點(diǎn)。今年早些時(shí)候,三家公司通過(guò)公開(kāi)競(jìng)標(biāo)被選中進(jìn)入了“原型階段”。
其中一家就是基于OTC(Open Telekom Cloud)提供解決方案。OTC是由德國(guó)電信和華為共同構(gòu)建的公共云平臺(tái),華為提供基于OpenStack的架構(gòu)并支持相關(guān)的解決方案。在“原型開(kāi)發(fā)”階段,OTC已經(jīng)在科學(xué)計(jì)算領(lǐng)域向CERN交付了HPC公共云解決方案,部署了數(shù)千個(gè)HPC節(jié)點(diǎn),并分析了高能粒子碰撞的結(jié)果。
“OTC***的優(yōu)點(diǎn)是基于OpenStack,架構(gòu)與CERN現(xiàn)有的私有云相同,這意味著它可以靈活動(dòng)態(tài)地?cái)U(kuò)展CERN的內(nèi)部資源。”Eldik說(shuō)。
CERN與華為都是OpenStack開(kāi)源項(xiàng)目的貢獻(xiàn)者,同時(shí),華為還是OpenStack基金會(huì)的鉑金會(huì)員,未來(lái)CERN與華為將在OpenStack領(lǐng)域進(jìn)行更多的深度技術(shù)合作
“通過(guò)CERN openlab項(xiàng)目,我們已經(jīng)開(kāi)始共同努力改進(jìn)OpenStack,尤其是在大規(guī)模運(yùn)行OpenStack的時(shí)候......這將允許OpenStack社區(qū)的每個(gè)人都從這些社區(qū)的努力中受益,我對(duì)這些特別的項(xiàng)目非常興奮,我期待在未來(lái)幾年看到它們?cè)贑ERN的云中開(kāi)花結(jié)果,“Eldik先生補(bǔ)充說(shuō)。