科卓8100-TC II高性能計算工作站
科卓Quadro 8100-TC II與前面8100-TC***的區(qū)別在于把Tesla C1060計算處理器增加到2塊,從而使流處理器浮點運算性能輕松翻倍。同時在上一套方案的基礎上,將CPU升級到3.0GHz主頻的Xeon X5450(如有需要還可選擇更高的X5472、5492等處理器),內(nèi)存標配8GB(***支持128GB),硬盤選擇了目前15000rpm企業(yè)級硬盤中容量***的450GB SAS(還可以增加硬盤數(shù)量并組建RAID)。由于每塊Tesla C1060的***功耗達到200W(典型功耗160W),而X系列高性能Intel Xeon處理器的單個功耗也有120~150W,因此配備1050W大功率電源很有必要。
HP xw8600 + 2×NVIDIA Tesla C1060
配置信息:
T10:NVIDIA第二代CUDA處理器
CUDA雖然發(fā)布只有一年半的時間,但現(xiàn)在已經(jīng)有很多領域在使用。NVIDIA所要做的是要讓人們可以在網(wǎng)上找到免費的軟件,而且讓自身的GPU產(chǎn)品支持CUDA。NVIDIA T8系列以上Tesla產(chǎn)品都將支持CUDA。截止到目前,CUDA GPU的市場保有量已經(jīng)達到了8000萬顆。
在2008年的8月,NVIDIA向市場提供了其第二代CUDA處理器--T10系列。T10 GPU可謂是當前世界上***的芯片,擁有14億個晶體管,共有240個流處理器計算核心,一塊這樣的GPU卡的浮點運算性能可達到1萬億次每秒(Tflops),而現(xiàn)在1顆四核CPU只有每秒700億次浮點計算。
跟T8系列相比,T10在性能和顯存容量上都增加了一倍,還增加了雙精度浮點運算的支持,從而能更好地加速汽車飛機設計、CFD計算流體動力學以及金融分析等需要高準確度的應用。由于高性能計算應用的數(shù)據(jù)量往往很大,需要用到大容量內(nèi)存,所以T10的板載顯存容量也從原來的1.5GB提升到了4GB。NVIDIA工程師在逆時偏移測試時發(fā)現(xiàn),在同樣配置1.5GB內(nèi)存時,T10僅比G80提升了1.9倍,而如果把內(nèi)存加大到4GB,性能會提高到3.5倍。
NVIDIA推出了兩款基于T10的GPU新產(chǎn)品:一款是Tesla S1070 1U機架服務器,共有4個GPU卡,共960個計算核心,性能達到每秒4萬億次浮點運算,功耗只有700瓦,而如果要達到相同計算性能,需要一個小服務器集群才能實現(xiàn),而功耗可能達到幾萬瓦;另一款產(chǎn)品是Tesla C1060,可以用到普通的PC和工作站中,單精度和雙精度浮點運算性能分別為933Gflops、78Gflops(峰值),典型功耗只有160瓦。
假設要構建一個具有100萬億次規(guī)模的數(shù)據(jù)中心,如果完全采用基于CPU 的1U服務器,需要用到1429臺四核服務器,成本高達310萬美元,功耗571KW(千瓦);而如果采用CPU+GPU的異構模式,則僅需要25臺CPU服務器和25臺Tesla系統(tǒng),僅需31萬美元,功耗只有27KW。
據(jù)了解,在GPGPU集群中,CPU服務器負責執(zhí)行順序型任務,如操作系統(tǒng)和數(shù)據(jù)庫,CPU服務器與GPU服務器之間通過Infiband進行連接通信,GPU服務器則作為“一種協(xié)處理器的拓展”,通過PCI-E 2.0連到CPU服務器上,承擔并行計算任務。由于GPU服務器上沒有CPU,所以操作系統(tǒng)的啟用需要用到CPU服務器。用戶可以根據(jù)順序任務和并行任務的比率,來配備CPU核與GPU核的不同數(shù)量。
【編輯推薦】