雙路6500至強(qiáng) DELL R810機(jī)架服務(wù)器評(píng)測(cè)(圖)
Nehalem-EX時(shí)代DELL一共發(fā)布了三款機(jī)器,一款之前測(cè)過的刀片服務(wù)器M910,以及兩款機(jī)架式服務(wù)器R810和R910。它們都是四路的機(jī)器,不過M910和R810都是屬于可以做四路也可以做二路配置的機(jī)型(51CTO推薦閱讀:配4路Nehalem-EX 戴爾M910服務(wù)器評(píng)測(cè))。
DELL PowerEdge R810
筆者測(cè)試過Intel官方送測(cè)的Nehalem-EX樣機(jī),對(duì)7500系列處理器的表現(xiàn)已經(jīng)有了一個(gè)大致的認(rèn)識(shí)。但是筆者還沒有接觸過同為Nehalem-EX系列的6500系列處理器。R810剛好補(bǔ)全了我們的資料,它是基于6500系列Nehalem-EX:兩個(gè)Xeon E6540,規(guī)格上看,它和E7540很相似,只是它只能組建兩路系統(tǒng)而已。#p#
較為“輕便”的2U機(jī)架服務(wù)器
前面板就是傳統(tǒng)的DELL造型,可以搭載6個(gè)2.5"熱插拔存儲(chǔ)
冗余電源、4個(gè)全高2個(gè)半高擴(kuò)展槽位置,此外還具備了4個(gè)網(wǎng)絡(luò)接口
#p#
和常見的結(jié)構(gòu)不太一樣,R810的風(fēng)扇位于機(jī)箱靠后的位置,位于處理器和擴(kuò)展卡之間
電源
處理器前方有一個(gè)導(dǎo)風(fēng)罩
熱插拔風(fēng)扇組件
#p#
可以安裝四個(gè)處理器
處理器板與IO板之間的連接
這個(gè)模塊就是DELL的FlexMemory Bridge模塊了
做成了CPU的樣子
內(nèi)部是SMI和QPI的通道
真正的CPU是這樣的:Xeon E6540
#p#
中央黑色散熱器下的就是SMB芯片
內(nèi)置的H700陣列卡,PERC 6/i的下一代,SAS 6Gb/s接口
雙Broadcom BCM5709C芯片,每個(gè)芯片提供兩個(gè)千兆端口,并且每個(gè)端口都支持8個(gè)RSS隊(duì)列
擴(kuò)展槽Riser
#p#
通過FlexMemory Bridge模塊,達(dá)到雙路使用128GB內(nèi)存的配置(32 DIMMs)。
#p#
SiSoftware Sandra Pro Business 2010
|
||||||
---|---|---|---|---|---|---|
測(cè)試對(duì)象
|
雙路Intel Nehalem-EP Xeon X5570 2.93GHz |
雙路Intel Westmere-EP Xeon X5670 2.93GHz |
雙路Intel Westmere-EP Xeon X5680 3.33GHz |
Dawning I840-H 四路Intel Dunnington Xeon X7460 2.66GHz @Sandra 2009 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 2.0GHz |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 2.0GHz |
Processor Arithmetic Benchmark
處理器算術(shù)性能測(cè)試 |
||||||
Aggregate Arithmetic Performance
|
147.17GOPS | 218.69GOPS | 249.2GOPS | 298.6GOPS | 152GOPS | |
Dhrystone iSSE4.2
|
172.5GIPS | 257GIPS | 291.36GIPS | 292201MIPS | 350.47GIPS | 174.32GIPS |
Whetstone iSSE3
|
121.84GFLOPS | 180.41GFLOPS | 207GFLOPS | 208685MFLOPS | 246.73GFLOPS | 129.73GFLOPS |
Processor Multi-Media Benchmark
處理器多媒體性能測(cè)試 |
||||||
Aggregate Multi-Media Performance
|
277MPixel/s | 410.36MPixel/s | 465.8MPixel/s | 753.51MPixel/s | 562.11MPixel/s | 288.38MPixel/s |
Multi-Media Int x16 iSSE4.1
|
317.13MPixel/s | 470.51MPixel/s | 534.13MPixel/s | 283.27MPixel/s | 646.86MPixel/s | 330.77MPixel/s |
Multi-Media Float x8 iSSE2
|
237MPixel/s | 350.2MPixel/s | 397.47MPixel/s | 501.36MPixel/s | 477.37MPixel/s | 246MPixel/s |
Multi-Media Double x4 iSSE2
|
128.62MPixel/s | 190.87MPixel/s | 216.17MPixel/s | 260.18MPixel/s | 260MPixel/s | 133.57MPixel/s |
Multi-Core Efficiency Benchmark
多核效率測(cè)試 |
||||||
Inter-Core Bandwidth
|
71.15GB/s | 80.7GB/s | 84GB/s | 12.88GB/s | 106.67GB/s | |
Inter-Core Latency
(越小越好) |
18ns | 18ns | 16ns | 110ns | 23ns | |
Cryptography Benchmark
加密解密性能測(cè)試 |
||||||
Cryptographic Bandwidth
|
1.26GB/s | 10.33GB/s | 11.72GB/s | 3GB/s | 1.52GB/s | |
AES128-ECB iAES
Cryptographic Bandwidth |
1GB/s | 18.45GB/s | 21GB/s | 2.88GB/s | 1.46GB/s | |
SHA256 iSSE4 Hashing Bandwidth
|
1.49GB/s | 2.22GB/s | 2.52GB/s | 3GB/s | 1.58GB/s | |
.NET Arithmetic Benchmark
.NET算術(shù)性能測(cè)試 |
||||||
Aggregate .NET Performance
|
55.84GOPS | 73.6GOPS | 80.22GOPS | 89.47GOPS | 58.34GOPS | |
Dhrystone .NET
|
32.11GIPS | 32.2GIPS | 37GIPS | 75397MIPS | 31.67GIPS | 33.36GIPS |
Whetstone .NET
|
79.56GFLOPS | 115GFLOPS | 123.43GFLOPS | 136088MFLOPS | 147.26GFLOPS | 83.32GFLOPS |
.NET Multi-Media Benchmark
.NET多媒體性能測(cè)試 |
||||||
Aggregate .NET Multi-Media Performance
|
42.13MPixel/s | 63.18MPixel/s | 71.4MPixel/s | 90MPixel/s | 45.8MPixel/s | |
Multi-Media Int x1 .NET
|
59MPixel/s | 88.64MPixel/s | 100.36MPixel/s | 119.30MPixel/s | 127.38MPixel/s | 64.34MPixel/s |
Multi-Media Float x1 .NET
|
25.22MPixel/s | 37.73MPixel/s | 42.42MPixel/s | 31.74MPixel/s | 52.7MPixel/s | 27.27MPixel/s |
Multi-Media Double x1 .NET
|
48.3MPixel/s | 68.45MPixel/s | 78.48MPixel/s | 58.72MPixel/s | 102.48MPixel/s | 52.22MPixel/s |
大致上,雙路E6540的運(yùn)算性能是四路E7540的一半多一些,和預(yù)想的差不多。
#p#
SiSoftware Sandra Pro Business 2010
|
||||||
---|---|---|---|---|---|---|
測(cè)試對(duì)象
|
雙路Intel Nehalem-EP Xeon X5570 2.93GHz |
雙路Intel Westmere-EP Xeon X5670 2.93GHz |
雙路Intel Westmere-EP Xeon X5680 3.33GHz |
Dawning I840-H 四路Intel Dunnington Xeon X7460 2.66GHz @Sandra 2009 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 2.0GHz |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 2.0GHz |
Memory Bandwidth Benchmark
內(nèi)存帶寬測(cè)試 |
||||||
Aggregate Memory Performance
|
38GB/s | 35GB/s | 35.2GB/s | 33.86GB/s | 33.2GB/s | |
Int Buff'd iSSE2 Memory Bandwidth
|
38GB/s | 35GB/s | 35.2GB/s | 3.49GB/s | 33.86GB/s | 33.18GB/s |
Float Buff'd iSSE2 Memory Bandwidth
|
38GB/s | 35GB/s | 35.18GB/s | 3.49GB/s | 33.85GB/s | 33.23GB/s |
Memory Latency Benchmark(Random)
內(nèi)存延遲測(cè)試(隨機(jī)) |
||||||
Memory(Random Access) Latency
(越小越好) |
80ns | 83ns | 82ns | 192ns | 161ns(min) | |
Speed Factor
(越小越好) |
55.50 | 57.00 | 64.60 | 98.10 | 90 | |
Internal Data Cache
|
4clocks | 4clocks | 4clocks | 4clocks | 4clocks | |
L2 On-board Cache
|
11clocks | 10clocks | 10clocks | 10clocks | 9clocks | |
L3 On-board Cache
|
49clocks | 57clocks | 60clocks | 84clocks | 97clocks | |
Memory Latency Benchmark(Linear)
內(nèi)存延遲測(cè)試(線性) |
||||||
Memory(Linear Access) Latency
(越小越好) |
7ns | 7ns | 7ns | 41ns | 32ns(min) | |
Speed Factor
(越小越好) |
4.80 | 5.10 | 5.50 | 20.70 | 17.20 | |
Internal Data Cache
|
4clocks | 4clocks | 4clocks | 4clocks | 4clocks | |
L2 On-board Cache
|
10clocks | 11clocks | 11clocks | 10clocks | 9clocks | |
L3 On-board Cache
|
13clocks | 13clocks | 13clocks | 34clocks | 35~45clocks | |
Cache and Memory Benchmark
緩存及內(nèi)存測(cè)試 |
||||||
Cache/Memory Bandwidth
|
142GB/s | 183.26GB/s | 195.6GB/s | 315GB/s | 182GB/s | |
Speed Factor
(越小越好) |
21.20 | 31.00 | 35.20 | 34.80 | 17.60 | |
Internal Data Cache
|
471GB/s | 663.51GB/s | 744.49GB/s | 919.66GB/s | 489.14GB/s | |
L2 On-board Cache
|
295.4GB/s | 537.88GB/s | 611GB/s | 749GB/s | 382.72GB/s | |
L3 On-board Cache
|
112GB/s | 146.33GB/s | 159GB/s | 336.6GB/s | 215.64GB/s |
內(nèi)存帶寬上,雙路E6540和四路E7540差不多,因?yàn)殡p路配置下E6540使用了所有的內(nèi)存控制器,而四路E7540只使用了一個(gè),兩個(gè)配置下總的內(nèi)存通道數(shù)量是一樣的。延遲上,雙路E6540配置還要略低一些。
#p#
SPEC CPU 2006整數(shù)運(yùn)算主要包含編譯、壓縮、人工智能、視頻壓縮轉(zhuǎn)換、XML處理等,此外,各種日常操作也主要是基于整數(shù)操作。SPEC CPU 2006的整數(shù)運(yùn)算包含了400.perlbench PERL編程語(yǔ)言、401.bzip2 壓縮、403.gcc C編譯器、429.mcf 組合優(yōu)化、445.gobmk 人工智能:圍棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:國(guó)際象棋、462.libquantum 物理:量子計(jì)算、464.h264ref 視頻壓縮、471.omnetpp 離散事件仿真、473.astar 尋路算法、483.xalancbmk XML處理共12項(xiàng)。
前面得出,純計(jì)算能力單個(gè)E6540和E7540沒什么差別,組成雙路的效率比四路的效率還要略高一點(diǎn)?,F(xiàn)在,SPEC得出的整數(shù)運(yùn)算吞吐量,R810達(dá)到了M910的69.4%,這表明,R810的雙路處理器因?yàn)槭褂昧送暾膬蓚€(gè)內(nèi)存控制器而得到了實(shí)際運(yùn)算效果的提升,比較明顯的462.libquantum 量子計(jì)算項(xiàng)目就是這樣。
#p#
SPEC CPU 2006的浮點(diǎn)運(yùn)算測(cè)試包括的全部都是科學(xué)運(yùn)算,科學(xué)運(yùn)算需要用到大量的高精度浮點(diǎn)數(shù)據(jù),如410.bwaves 流體力學(xué)、416.gamess 量子化學(xué)、433.milc 量子力學(xué)、434.zeusmp 物理:計(jì)算流體力學(xué)、435.gromacs 生物化學(xué)/分子力學(xué)、436.cactusADM 物理:廣義相對(duì)論、437.leslie3d 流體力學(xué)、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 線形編程、優(yōu)化、453.povray 影像光線追蹤、454.calculix 結(jié)構(gòu)力學(xué)、459.GemsFDTD 計(jì)算電磁學(xué)、465.tonto 量子化學(xué)、470.lbm 流體力學(xué)、481.wrf 天氣預(yù)報(bào)、482.sphinx3 語(yǔ)音識(shí)別共17項(xiàng)測(cè)試。
在浮點(diǎn)運(yùn)算吞吐量上,R810還要比M910高一些(4%),雖然不同的項(xiàng)目有高有低,但是這表明了內(nèi)存帶寬也是很重要的。
#p#
CineBench R11.5 64bit
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
顯卡 | - | - | - | - | - |
CPU Benchmark
|
|||||
Rendering (1 CPU) | 1.02 pts | 1.02 pts | 1.16 pts | 0.78 pts | 0.79 pts |
Rendering (x CPU) | 9.92 pts | 14.58 pts | 16.40 pts | 19.26 pts | 10.32 pts |
Threads | 16 | 24 | 24 | 48 | 24 |
Multiprocessor Speedup | 9.68x | 14.33x | 14.18x | 24.65x | 13.14x |
這個(gè)測(cè)試比較側(cè)重于更多的計(jì)算核心。
#p#
MMM - Matrix-Matrix Multiplicaion Benchmark
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
單位 | GFLOPS | GFLOPS | GFLOPS | GFLOPS | GFLOPS |
Threads 1
|
|||||
5000 step | 7.821975 | 7.842319 | 8.877563 | 5.867645 | 6.007474 |
10000 step | 7.890761 | 7.840417 | 8.883291 | 5.865347 | 5.984136 |
15000 step | 7.888751 | 7.845479 | 8.881528 | 5.826604 | 5.90173 |
Threads 2
|
|||||
5000 step | 15.59136 | 15.62796 | 17.5891 | 11.570261 | 11.815215 |
10000 step | 15.7544 | 15.66469 | 17.73566 | 11.689317 | 11.870882 |
15000 step | 15.7445 | 15.64657 | 17.67208 | 11.602247 | 11.796412 |
Threads 4
|
|||||
5000 step | 30.69218 | 29.99696 | 34.85343 | 21.788607 | 22.342354 |
10000 step | 31.02227 | 29.75883 | 34.90105 | 22.21115 | 22.337463 |
15000 step | 31.04954 | 30.55926 | 34.92557 | 22.073702 | 22.299975 |
Threads 8
|
|||||
5000 step | 36.2252 | 49.03697 | 45.99856 | 41.228878 | 28.497565 |
10000 step | 38.21083 | 50.30305 | 45.99856 | 43.472432 | 29.396352 |
15000 step | 40.71236 | 56.00031 | 47.74417 | 43.37777 | 37.193253 |
Threads 16
|
|||||
5000 step | 59.38371 | 64.04222 | 66.10022 | 73.379889 | 44.935817 |
10000 step | 61.44583 | 62.42291 | 72.38159 | 78.596851 | 51.056532 |
15000 step | 61.83442 | 64.3761 | 73.2495 | 79.099092 | 54.979568 |
Threads 24
|
|||||
5000 step | 54.82514 | 84.13599 | 66.10022 | 94.000418 | 60.406535 |
10000 step | 54.82514 | 88.58685 | 72.38159 | 124.028823 | 63.634763 |
15000 step | 59.18915 | 90.12297 | 73.2495 | 124.574801 | 64.72546 |
Threads 48
|
|||||
5000 step | 97.335138 | ||||
10000 step | 119.780984 | ||||
15000 step | 121.637469 |
和Sandra得出的結(jié)果差不多。
SunGard Adaptiv Analytics Benchmark v4.0
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
Threads | 16 | 24 | 24 | 48 | 24 |
Time (lower is better) |
138.076s | 110.331s | 94.911s | 139.512s | 147.716s |
black_scholes
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
Threads | 16 | 24 | 24 | 48 | 24 |
Time (lower is better) |
9.17s | 6.16s | 5.51s | 4.40s | 8.28s |
更多的計(jì)算能力在這兩個(gè)測(cè)試?yán)锩媸歉玫摹?/p>
#p#
16萬(wàn)TPS左右,比M910還要高點(diǎn)。數(shù)據(jù)庫(kù)測(cè)試對(duì)內(nèi)存帶寬和內(nèi)存延遲比較敏感。
測(cè)試時(shí)網(wǎng)絡(luò)占用率
#p#
R810是DELL推出的基于Nehalem-EX處理器的2U服務(wù)器,它可以配置為2路也可以配置為4路。R810提供了32個(gè)DIMM的內(nèi)存支持能力,***容量達(dá)512GB,通過DELL的FlexMemory Bridge技術(shù),R810在2路配置下也能完全使用這32個(gè)DIMM。R810還支持冗余電源和四個(gè)BCM5709C千兆網(wǎng)絡(luò)端口,通過H700提供了SAS 6Gb/s的陣列支持能力。R810支持6個(gè)2.5"熱插拔硬盤。
DELL PowerEdge R810
樣機(jī)配置的是兩個(gè)Xeon E6540處理器,它和E7540基本沒什么區(qū)別,除了只能用于雙路配置之外。在使用了兩個(gè)DELL的FlexMemory Bridge模塊之后,每個(gè)E6540處理器可以應(yīng)用完整的兩個(gè)內(nèi)存控制器以及對(duì)應(yīng)的16個(gè)DIMM,從而獲得了不錯(cuò)的性能表現(xiàn),和四路配置的M910相比是互有上下,因?yàn)楹笳呙總€(gè)處理器僅使用了一個(gè)內(nèi)存控制器。我們認(rèn)為,M910和R910都更適合于雙路配置,不過,一些應(yīng)用下,四路配置也是可以選擇的。
【編輯推薦】
- 官方機(jī)啥樣?看英特爾Nehalem-EX樣機(jī)超詳評(píng)測(cè)
- 配4路Nehalem-EX 戴爾M910服務(wù)器評(píng)測(cè)
- 簡(jiǎn)約不簡(jiǎn)單 惠普迷你工作站評(píng)測(cè)(多圖)