單路PK 英特爾E3、E5性能對比(圖)
3月初,英特爾在北京發(fā)布了新一代服務器處理器——至強E5-2600/1600系列。其中,至強E5-2600定位在雙路應用,包括了十余款產品,面向主流市場。同時發(fā)布的至強E5-1600系列則面向單路應用,服務器和工作站均可。這讓我們不由得想起之前英特爾在單路服務器中布局的至強E3系列,究竟至強E3與E5有哪些區(qū)別,它們的性能有多大差異呢?
按照英特爾的定位,至強E5-1600僅支持單路處理器配置,但并不是為了取代E3產品。E3-1200微處理器的目標是主流的單路服務器市場,而Xeon E5-1600 CPU主要定位于高性能的單路服務器市場。E5的這個單處理器家族將包括三個型號:E5-1620、E5-1650和E5-1660。
至強E5-1620是一個四核芯片,主頻為3.6GHz,10MB三級緩存。其它的兩個——Xeon E5-1650和E5-1660具有6顆CPU核,但是主頻比E5-1620要低。E5-1650的主頻為3.2GHz,并具有12MB的三級緩存。Intel E5-1660有3.3GHz主頻和15MB的三級緩存。
就規(guī)格來說,E5-1600產品集成了所有Sandy Bridge特性,其中包括Hyper-Threading、Turbo Boost、可信賴執(zhí)行、VT-c/d/x以及AES和AVX。
同樣是定位單路,E5與E3的性能差距究竟有多大?類似的架構下,E3與E5僅僅在于核心上的差異,那么這些差異真的明顯嗎?下面我們將通過測試具體驗證一下。#p#
本次我們選取了至強E3-1240和至強E5-1650處理器進行測試。這兩款處理器在主頻上較為接近,具備對比價值。
至強E3-1240處理器
至強E3-1240處理器信息
我們先來看看至強E3-1240處理器,它的主頻為3.3GHz,睿頻之后可以達到3.7GHz。這款處理器具備4核心8線程,TDP為80W。
至強E5-1650處理器實物圖
至強E5-1650處理器信息
被測E5-1650處理器主頻為3.2GHz,同樣采用32nm工藝,核心數量為6個,線程數為12個,TDP為130W。
#p#
測試平臺信息
|
||
產品名稱 | 至強E5-1650 | 至強E3-1240 |
處理器子系統(tǒng) | ||
---|---|---|
處理器型號 | Intel Xeon E3-1220 | Intel Xeon E3-1240 |
處理器架構 | Intel 32nm Sandy Bridge | Intel 32nm Sandy Bridge |
代號 | Sandy Bridge | Sandy Bridge |
處理器封裝 | Socket 2011 LGA | Socket 1155 LGA |
核心/線程數量 | 6/12 | 4/8 |
主頻 | 3.2GHz | 3.3GHz |
處理器指令集 |
MMX,SSE,SSE2,SSE3, |
MMX,SSE,SSE2,SSE3, |
外部總線 |
DMI 5.0GT/S |
DMI 5.0GT/S |
L1 Code Cache | 6× 32KB 8路集合關聯(lián) | 4× 32KB 8路集合關聯(lián) |
L1 Data Cache | 6× 32KB 8路集合關聯(lián) | 4× 32KB 4路集合關聯(lián) |
L2 Cache | 6× 256KB 8路集合關聯(lián) | 4× 256KB 8路集合關聯(lián) |
L3 Cache | 12MB 16路集合關聯(lián) | 8MB 16路集合關聯(lián) |
服務器主板 | ||
主板芯片組 | Intel C600 | Intel C206 |
北橋芯片特性 | 2×QPI VT-d Gen 2 |
2×QPI VT-d Gen 2 |
子系統(tǒng)內存 | ||
控制器內存 | 每集成四通道U-ECC DDR3 1333CPU | 每集成雙通道U-ECC DDR3 1333CPU |
內存類型 | 8GB R-ECC DDR3 1333 SDRAM ×4條 | 4GB R-ECC DDR3 1333 SDRAM ×4條 |
軟件環(huán)境 | ||
操作系統(tǒng) | Microsoft Windows Server 2008 Enterprise R2 x64 | Microsoft Windows Server 2008 Enterprise R2 x64 |
本次測試中,為兩顆處理器提供了近似的配置,區(qū)別在于E5平臺的主頻比E3平臺略低0.1GHz,而內存容量增加了一倍。
#p#
SiSoftware Sandra Pro Business 2012
|
||
產品名稱 | 至強E5-1650 | 至強E3-1240 |
平臺類型 | 單路Intel SandyBridge-EP | 單路Intel SandyBridge |
Processor Arithmetic Benchmark 處理器算術運算測試 |
||
---|---|---|
總計本地功效 | 163.35GOPS | 103.19GOPS |
總計本地功效對比速度 | 43.09MOPS/MHz | 27.95MOPS/MHz |
Dhrystone iSSE4.2 | 208.78GIPS | 131.6GIPS |
Dhrystone iSSE4.2 vs SPEED | 55.07MIPS/MHz | 35.65MIPS/MHz |
Whetstone iSSE3 | 127.8GFLOPS | 81GFLOPS |
Dhrystone iSSE3 vs SPEED | 33.71MFLOPS/MHz | 21.9MFLOPS/MHz |
Processor Multi-Media Benchmark 處理器多媒體測試 |
||
總計多媒體功效 | 364.88MPixel/s | 170MPixel/s |
總計多媒體功效對比速度 | 96.25kPixels/s/MHz | 46.06kPixels/s/MHz |
Multi-Media Int x16 iSSE4.1 | 314MPixel/s | 195.12MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 82.81kPixels/s/MHz | 52.85kPixel/s/MHz |
Multi-Media Float x8 iSSE2 | 424.08MPixel/s | 148.2MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 111.87kPixels/s/MHz |
40.14kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 242.8MPixel/s | 81MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 64.05kPixels/s/MHz |
21.93kPixels/s/MHz |
Multi-Core Efficiency Benchmark 處理器效能測試 |
||
內聯(lián)核帶寬 | 33.75GB/s | 21.24GB/s |
內聯(lián)核帶寬對比速度 | 9.12MB/s/MHz | 5.89MB/s/MHz |
內聯(lián)核延遲(越小越好) | 48.0ns | 43.3ns |
內聯(lián)核延遲對比速度(越小越好) | 0.13ns/MHz | 0.12ns/MHz |
Java算數性能測試 | ||
總計 Java 功效 | 112.66GOPS |
75.7GOPS |
總計 Java 功效對比速度 | 29.72MOPSMHz | 20.50MOPSMHz |
Dhrystone Java | 199.84GIPS | 119GIPS |
Dhrystone Java對比速度 | 52.71MIPS/MHz | 32.21MIPS/MHz |
Whetstone Java | 63.51GFLOPS | 48.18GFLOPS |
Whetstone Java對比速度 | 16.75MFLOPSMHz | 13.05MFLOPS/MHz |
Java多媒體性能測試 | ||
總計多媒體Java功效 | 42MPixel/s | 29.5MPixel/s |
總計多媒體Java功效對比速度 | 11.09kPixels/s/MHz | 7.99kPixels/s/MHz |
多媒體整數 x1 Java | 44.16MPixel/s | 28.82MPixel/s |
多媒體整數 x1 Java對比速度 | 11.65kPixels/s/MHz | 7.80kPixels/s/MHz |
多媒體浮點數 x1 Java | 40MPixel/s | 30.2MPixel/s |
多媒體浮點數 x1 Java對比速度 | 10.56kPixels/s/MHz | 8.18kPixels/s/MHz |
多媒體雙精度 x1 Java | 39.53MPixel/s | 25.9MPixel/s |
多媒體雙精度 x1 Java對比速度 | 10.43kPixels/s/MHz | 7.02kPixels/s/MHz |
.NET Arithmetic Benchmark .NET算術運算測試 |
||
總計 .NET 功效 | 29.25GOPS | 29.1GOPS |
總計 .NET 功效對比速度 | 7.72MOPS/MHz | 7.88MOPS/MHz |
Dhrystone .NET | 10.45GIPS | 17.48GIPS |
Dhrystone .NET vs SPEED | 2.76MIPS/MHz | 4.73MIPS/MHz |
Whetstone .NET | 81.86GFLOPS | 48.48GFLOPS |
Whetstone .NET vs SPEED | 21.59MFLOPS/MHz | 13.13MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒體測試 |
||
總計多媒體.NET功效 | 44.56MPixel/s | 22MPixel/s |
總計多媒體.NET功效對比速度 | 11.75kPixels/MHz | 5.96kPixels/MHz |
多媒體整數 x1 .NET | 49.48MPixel/s | 36.46MPixel/s |
多媒體整數x1 .NET vs SPEED | 13.05kPixels/s/MHz | 9.87kPixels/s/MHz |
多媒體浮點數 x1 .NET | 20.3MPixel/s | 13.28MPixel/s |
多媒體浮點數 x1 .NET vs SPEED | 5.36kPixels/s/MHz | 3.60kPixels/s/MHz |
多媒體雙精度 x1 .NET | 40.14MPixel/s | 26.23MPixel/s |
多媒體雙精度 x1 .NET vs SPEED | 10.59kPixels/s/MHz | 7.10kPixels/s/MHz |
從上面的對比來看,除了個別項目中E5-1650的成績相比E3-1240來說低了一些之外,大部分項目的成績都有明顯提升,幅度達到了70%以上,部分項目的成績出現了翻幾倍的情況。雖然E5-1650相比E3-1240來說在主頻上略低,但是核心數量的優(yōu)勢在這里得到了充分體現,也是提升性能的關鍵。
#p#
SiSoftware Sandra Pro Business 2012
|
||
產品名稱 | 至強E5-1650 | 至強E3-1240 |
平臺類型 | 單路Intel SandyBridge | 單路Intel SandyBridge |
Memory Bandwidth Benchmark 內存帶寬測試 |
||
---|---|---|
總體內存性能 | 36.42GB/s | 17.27GB/s |
總體內存性能對比速度 | 23.31MB/sMHz | 13.28MB/sMHz |
整數 B/F iSSE2 內存帶寬 | 36.33GB/s | 17.27 |
整數 B/F iSSE2 內存帶寬對比速度 | 23.25MB/sMHz | 13.28MB/sMHz |
整數 B/F iSSE2 內存帶寬 | 36.51GB/s | 17.27GB/s |
整數 B/F iSSE2 內存帶寬對比速度 | 23.37MB/sMHz | 13.28MB/sMHz |
Memory Latency Benchmark 內存延遲測試 |
||
內存延遲(越小越好) | 26.7ns | 75.4ns |
內存延遲對比速度 (越小越好) | 0.02ns/MHz | 0.06ns/MHz |
速度因素 (越小越好) | 64.10ns | 68.30ns |
內部數據高速緩存 | 3.4clocks | 4clocks |
二級板載高速緩存 |
10.1clocks |
11clocks |
三級板載高速緩存 | 18.8clocks | 35clocks |
Cache and Memory Benchmark 緩存及內存測試 |
||
緩存/內存帶寬 | 181.32GB/s | 95.69GB/s |
緩存/內存帶寬對比速度 | 48.98MB/s/MHz | 26.54MB/s/MHz |
速度因素(越小越好) | 33.10 | 37.10 |
內部數據高速緩存 | 716.5GB/s | 414.17GB/s |
二級板載高速緩存 | 451GB/s | 280GB/s |
三級板載高速緩存 | 243GB/s | 129.5GB/s |
內存測試中我們看到E5-1650 與E3-1240存在非常大的差異,成績差距在一倍以上。這是因為E3平臺只能支持雙通道,而E5平臺支持四通道,更大的內存帶寬對于性能的幫助也是巨大的。因此從這個角度來說,同樣是單路應用的話,E5更適合大內存高帶寬的應用。
#p#
SPEC測試代表了絕大多CPU密集型的運算,包括編程語言、壓縮、人工智能、基因序列搜索、視頻壓縮及各種力學的計算等,包含了多種科學計算,可以用來衡量系統(tǒng)執(zhí)行這些任務的快慢。SPEC base測試包括浮點(fp)與整數運算(int)兩部分。
整數運算主要包含編譯、壓縮、人工智能、視頻壓縮轉換、XML處理等,此外,各種日常操作也主要是基于整數操作。SPEC CPU 2006的整數運算包含了400.perlbench PERL編程語言、401.bzip2 壓縮、403.gcc C編譯器、429.mcf 組合優(yōu)化、445.gobmk 人工智能:圍棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:國際象棋、462.libquantum 物理:計算、464.h264ref 視頻壓縮、471.omnetpp 離散事件仿真、473.astar 尋路算法、483.xalancbmk XML處理共12項。
SPEC CPU 2006整數測試成績
浮點運算包括的全部都是科學運算,科學運算需要用到大量的高精度浮點數據,如410.bwaves 流體力學、416.gamess 化學、433.milc 量子力學、434.zeusmp 物理:計算流體力學、435.gromacs 生物化學/分子力學、436.cactusADM 物理:廣義相對論、437.leslie3d 流體力學、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 線形編程、優(yōu)化、453.povray 影像光線追蹤、454.calculix 結構力學、459.GemsFDTD 計算電磁學、465.tonto 量子化學、470.lbm 流體力學、481.wrf 天氣預報、482.sphinx3 語音識別共17項測試。
SPEC CPU 2006浮點運算測試成績
從測試成績來看,整數測試中E3-1240還有略微占據優(yōu)勢的項目,畢竟主頻稍微高一點;但是在浮點中就已經是E5-1650全面領先了。從領先的幅度來看,基本是60%以上,比與線程提升的比率基本一致。
#p#
評價觀點:在英特爾以往的戰(zhàn)略中,3系列處理器僅僅是為單路平臺而設計的。但是從E7系列開始,我們越來越多的看到英特爾正在不斷調整策略,淡化處理器各個系列之間的界限,E7系列就有面向雙路應用大內存產品。
此次E5-1600的出現也切合了這種想法。這款定位單路應用的處理器在性能上秉承了SandyBridge-EP的優(yōu)勢,特別是在核心、線程上比E3有了明顯的提升。加上四通道內存的幫助,E5-1600在整體的表現上要大大強于E3處理器,性能提升接近一倍。換句話說,E5-1600系列提供了更好的單路解決方案。對于那些需要高性能應用、需要大容量內存卻又迫于價格壓力的用戶,單路E5-1600是取代E3的一個不錯選擇。用戶若沒有太多要求的話,E3系列的性能也可以接受。