十載寒窗 英特爾至強(qiáng)處理器歷代記
2011年4月6日,Intel在北京發(fā)布了采用全新命名的至強(qiáng)E7系列,回顧至強(qiáng)處理器發(fā)展的歷程,面向雙路的產(chǎn)品從最初的至強(qiáng)5000系列到5400系列,到Nehalem架構(gòu)的至強(qiáng)5500、Westmere架構(gòu)的至強(qiáng)5600;而四路及多路處理器方面,最初的至強(qiáng)7100、六核心的Dunnington至強(qiáng)7400、上一代的Westmere至強(qiáng)7500再到最新的至強(qiáng)E7,算下來(lái)Intel在雙路及四路以上服務(wù)器處理器中已經(jīng)整整更新了10代產(chǎn)品。
這些產(chǎn)品見(jiàn)證了至強(qiáng)這個(gè)品牌一步步走向輝煌,同時(shí)這些產(chǎn)品也幫助數(shù)以萬(wàn)計(jì)的企業(yè)獲得成功。今天,我們就來(lái)回顧一下最近幾年Intel至強(qiáng)的10代產(chǎn)品,為了那些曾經(jīng)忘卻的紀(jì)念。
Dempsey核心 至強(qiáng)5000系列
英特爾公司的“Bensley”平臺(tái)包括代號(hào)為“Dempsey”的雙核Xeon DP處理器和代號(hào)為“Blackford”的Intel 5000系列芯片組,另外還有一系列的新技術(shù),比如I/O AT技術(shù)、FBD內(nèi)存技術(shù)、更新的安全特性等等。
型號(hào) | 5080 | 5070 | 5060 | 5063(MV) | 5050 | 5040 | 5030 | 5020 |
sSpec | SL968 | SL969 | SL96A | SL96B | SL96C | SL96D | SL96E | SL96F |
主頻 | 3.73GHz | 3.46GHz | 3.2GHz | 3.2GHz | 3.0GHz | 2.83GHz | 2.66GHz | 2.5GHz |
CPUID string | 0F64 | 0F64 | 0F64 | 0F64 | 0F64 | 0F64 | 0F64 | 0F64 |
封裝類型 | 771pin | 771pin | 771pin | 771pin | 771pin | 771pin | 771pin | 771pin |
核心電壓 | 1.25-1.40 | 1.25-1.40 | 1.25-1.40 | 1.25-1.40 | 1.25-1.40 | 1.25-1.40 | 1.25-1.40 | 1.25-1.40 |
總線速度 | 1066MHz | 1066MHz | 1066MHz | 1066MHz | 667MHz | 667MHz | 667MHz | 667MHz |
Thermal Guideline | 130W | 130W | 130W | 95W | 95W | 95W | 95W | 95W |
Core stepping | C1 | C1 | C1 | C1 | C1 | C1 | C1 | C1 |
Thermal Spec | 78℃ | 78℃ | 78℃ | 68℃ | 68℃ | 68℃ | 68℃ | 68℃ |
L2 Cache Size | 4MB | 4MB | 4MB | 4MB | 4MB | 4MB | 4MB | 4MB |
L2 Cache Speed | 3.73GHz | 3.46GHz | 3.2GHz | 3.2GHz | 3.0GHz | 2.83GHz | 2.66GHz | 2.5GHz |
Manufacturing Technology | 65nm | 65nm | 65nm | 65nm | 65nm | 65nm | 65nm | 65nm |
Bus/Core Ratio | 14 | 13 | 12 | 12 | 18 | 17 | 16 | 15 |
英特爾當(dāng)時(shí)一共發(fā)布了8款基于“Dempsey”核心的處理器:Xeon 5080、Xeon 5070、Xeon 5060、Xeon 5063、Xeon 5050、Xeon 5040、Xeon 5030和Xeon 5020。這些處理器依然采用了NetBurest微架構(gòu),它們將會(huì)是最后一個(gè)采用該微架構(gòu)的Xeon系列產(chǎn)品。在Xeon 5000系列處理器中整合了兩個(gè)完整的NetBurst微架構(gòu)處理器,并且對(duì)于NetBurst微架構(gòu)進(jìn)行了進(jìn)一步的優(yōu)化——主要涉及到超管線技術(shù)(Hyper Pipelined Technology)和執(zhí)行追蹤緩存(Execution Trace Cache)。每個(gè)處理器擁有獨(dú)立的2MB二級(jí)緩存,其前端總線為1066MHz或者667MHz,可以提供8.5GB/s或者5.3GB/s的傳輸帶寬。
Xeon 5000系列處理器采用了65nm制程,這對(duì)于有效的抑制Xeon處理器的發(fā)熱量具有至關(guān)重要的作用。采用90nm制程的Irwindale核心的單核Xeon處理器TDP在130瓦左右,而Xeon 5000系列雙核處理器TDP也只有135瓦甚至更低。Xeon 5000系列處理器不再采用Socket604封裝,改用了FC-LGA6 LGA771封裝,可進(jìn)一步改進(jìn)處理器的電氣性能,更利于功率傳導(dǎo)。
這個(gè)系列的處理器依然支持超線程技術(shù)(Hyper-Threading Technology),這樣每個(gè)核心可以處理2個(gè)線程,每顆雙核心處理器可以并行處理4個(gè)線程,雙路配置的處理器則能可以同時(shí)處理8個(gè)線程。另外,這個(gè)系列的處理器支持EIST、EM64T、VT、XDbit等技術(shù),對(duì)于TM1功能也提供了支持。
#p#
Woodcrest核心 至強(qiáng)5100
基于Woodcrest核心的至強(qiáng)5100
英特爾目前已經(jīng)發(fā)布了7款基于Woodcrest核心的Xeon 5100處理器,它們是Xeon 5160、Xeon 5150、Xeon 5148、Xeon 5140、Xeon 5130、Xeon 5120和Xeon 5110。
Xeon 5100系列處理器的主頻變化很大,他們沒(méi)有延續(xù)上一代產(chǎn)品的主頻,已經(jīng)發(fā)布的處理器中主頻最低是1.6GHz,而最高的也只有3.0GHz。Xeon 5000系列處理器的最低主頻為2.5GHz,最高則達(dá)到了3.73GHz。處理器主頻的大幅度下降幫助Xeon 5100處理器明顯的降低了功耗,在7款處理器中只有5160的TDP為80瓦,5150/5140/5130/5120/5110等五款處理器TDP為65瓦,Xeon 5148的TDP只有40瓦。
Xeon 5100系列處理器(Xeon 5160/5150/5148/5140/5130)增加了對(duì)于1333MHz前端總線的支持,該總線實(shí)際運(yùn)行頻率為333MHz,可以4倍于其頻率的速率傳輸數(shù)據(jù),因此理論上每秒可傳輸10.66 GB的數(shù)據(jù)。而部分低端的處理器(Xeon 5120/5110)則支持1066 MHz前端總線,此時(shí)其系統(tǒng)時(shí)鐘頻率為266MHz,帶寬為8.5 GB/s。之前的Xeon 5000系列處理器中則有4款產(chǎn)品采用了1066MHz前端總線,還有4款產(chǎn)品采用了667MHz前端總線。前端總線的技術(shù)并沒(méi)有明顯地的改變,依然利用了分離傳輸(split-transaction)、延遲應(yīng)答協(xié)議(deferred reply protocol)和地址和數(shù)據(jù)的源同步傳輸(Source-Synchronous Transfer,SST)等技術(shù)。
從英特爾公布的文檔來(lái)看,Xeon 5100系列處理器還進(jìn)一步改進(jìn)了熱量和功率管理能力,它除了支持原有的TM1和EIST技術(shù)之外,還增加了對(duì)于TM2的支持——它主要增加了調(diào)節(jié)處理器電壓的作用。另外,雙核英特爾Xeon 5100系列處理器也支持EDBit(Execute Disable Bit)功能和英特爾虛擬化技術(shù)(Intel VT)。不過(guò)超線程技術(shù)并沒(méi)有應(yīng)用在Xeon 5100系列處理器上。
#p#
代號(hào)Clovertown 至強(qiáng)5300系列
Quad-core Xeon 5300系列處理器是定位于雙路服務(wù)器/工作站應(yīng)用的處理器,代號(hào)為Clovertown,它將兩個(gè)雙核核心整合在一個(gè)處理器基板上,率先向市場(chǎng)上推出了四核雙路處理器。
英特爾首先發(fā)布了5款處理器X5355、E5345、E5335、E5320和E5310,隨后又陸續(xù)發(fā)布了L5335、X5365等處理器。這些處理器均采用了65納米制程和LGA6封裝(LGA771),配置了8MB L2緩存(每顆處理器4MB L2緩存),主頻分別為最高達(dá)到了3.0GHz。型號(hào)最后一位是“5”的FSB頻率為1333MHz,傳輸帶寬可達(dá)10.6GB/s,型號(hào)最后一位是“0”的FSB頻率為1066MHz,傳輸帶寬可達(dá)8.5GB/s。
四核Xeon 5300系列的TDP提升到了一個(gè)新的水平,X5355/X5365處理器TDP為120瓦,E系列的四款均為80瓦,L系列為50瓦。雙核Xeon 5100系列處理器中,Xeon 5160的TDP為80瓦,Xeon 5148 LV的TDP為40瓦,其余的均為65瓦。從英特爾公布的這些TDP數(shù)據(jù)來(lái)看,雖然四核處理器是兩顆雙核處理器的“簡(jiǎn)單整合”,但是其功率應(yīng)該并非兩個(gè)雙核處理器的功率之和。
![]() |
上圖顯示的是Xeon 5320處理器的基本信息:Intel Xeon 5320處理器,主頻為1.86GHz,前端總線頻率為1066MHz,每個(gè)核心配置有32KB L1數(shù)據(jù)緩存,32KB L1代碼緩存,每個(gè)DIE則整合有4MB L2緩存(也就是兩個(gè)核心共享4MB L2緩存),整個(gè)處理器總共具有8MB L2緩存。總的來(lái)說(shuō),Xeon 5100所有的特性,Xeon 5300全都具有,最大的改變無(wú)非是核心的數(shù)量從2個(gè)增加到了4個(gè)。但是,毫無(wú)疑問(wèn)的是四核處理器的出現(xiàn)使得計(jì)算資源的密度大幅度提升,而功耗基本保持不變,這對(duì)于寸土寸金的IDC而言絕對(duì)是有重大意義的。
#p#
代號(hào)Harpertown 至強(qiáng)5400系列
Intel嚴(yán)格的按照其“Tick-Tock”戰(zhàn)略,在2007年的11月份推出了基于45nm制程的四核處理器,代號(hào)Harpertown。相對(duì)于上一代65nm Clovertown核心的產(chǎn)品,Harpertown進(jìn)一步優(yōu)化了微架構(gòu),添加了功能并且升級(jí)了主要規(guī)格。

Xeon E5430處理器,2.66GHz,12M緩存,1333MHz FSB,具有適中的性能、功耗及價(jià)格
從65nm到45nm的轉(zhuǎn)變,不僅僅是當(dāng)前芯片設(shè)計(jì)在體積上的縮小。此類處理器中還增加了許多新的特性,如全新的英特爾SIMD流指令擴(kuò)展4(SSE4),可通過(guò)47條全新指令加快包括視頻編碼在內(nèi)的工作負(fù)載的處理速度,從而支持高清晰度畫(huà)質(zhì)和照片處理,以及重要的HPC和企業(yè)應(yīng)用。
較高端的X5460處理器,后來(lái)Intel還發(fā)布了頻率更高的X5482處理器
和上一代Clovertown相比,Harpertown處理器將2 x 4MB的L2緩存提升到了2 x 6MB L2緩存,每?jī)蓚€(gè)核心共享6MB緩存。Harpertown處理器將不再使用舊的1066MHz FSB,而開(kāi)始支持更高的1333MHz/1600MHz FSB。由于采用了45nm High-k制程技術(shù),四核Harpertown的功耗依然保持同現(xiàn)有的雙核大致相當(dāng)?shù)乃?,TDP為80瓦、120瓦和150瓦,并且頻率規(guī)格也有所提高,最高端的Xeon X5492處理器可以達(dá)到3.4GHz,而上一代Xeon X5365只有3.00GHz。
#p#
Nehalem核心 至強(qiáng)5500系列
對(duì)于Intel的Tick-Tock戰(zhàn)略已經(jīng)是老生常談了;從另一方面講,這標(biāo)明了Tick-Tock戰(zhàn)略的成功之處,一個(gè)簡(jiǎn)單、明晰、有序和易于理解的發(fā)展計(jì)劃,對(duì)合作廠商、用戶和投資者都是極為有利的。TIck-Tock戰(zhàn)略簡(jiǎn)而言之就是Intel處理器在奇數(shù)年進(jìn)行制程轉(zhuǎn)換(Tick),例如2005年的65nm和2007年的45nm,而在偶數(shù)年進(jìn)行處理器的架構(gòu)更新(Tock),Nehalem架構(gòu)發(fā)布的2008年輪換到了Tock,也就是處理器的架構(gòu)更新。
Nehalem作為Intel用以取代Penryn微架構(gòu)的新一代處理器架構(gòu),和Penryn相比,Nehalem的微架構(gòu)并非是全新的,不過(guò),架構(gòu)上則是一個(gè)很大的飛躍:Nehalem采用了直聯(lián)架構(gòu)。除此之外,Nehalem還具有一個(gè)鮮明的設(shè)計(jì)理念,就是采用了可擴(kuò)展的模塊化設(shè)計(jì),它將處理器劃分為兩個(gè)部分:Core核心和Uncore非核心(或者叫“核外”),所有產(chǎn)品線的Nehalem處理器,其Core核心部分都是一樣的,只是Uncore部分可能不同,以滿足Intel對(duì)其提出的動(dòng)態(tài)可擴(kuò)展的要求。Nehalem滿足了這個(gè)要求,它的內(nèi)核具有可擴(kuò)展的高可伸縮架構(gòu)。
由于共處在一個(gè)Tick-Tock上,因此Nehalem和Penryn都同樣屬于45nm工藝,從65nm工藝轉(zhuǎn)變到45nm工藝帶來(lái)的巨大能耗降低已經(jīng)無(wú)法再次重現(xiàn),因此Nehalem就不再注重于能耗的降低,而是注重于性能的提升,這樣的設(shè)計(jì)理念,帶來(lái)了處理器架構(gòu)的巨大變化,這些變化均面向性能的提高,也即是說(shuō),我們可以期望Nehalem具有著強(qiáng)大的性能。
#p#
Westmere核心 至強(qiáng)5600系列
雙路六核服務(wù)器版本和雙核客戶版本W(wǎng)estmere處理器配置
Westmere處理器家族是Nehalem處理器家族的下一代,Nehalem基于45nm制程,Westmere則基于32nm制程,它們都使用了high-κ metal-gate(高K金屬柵極)工藝,在微架構(gòu)上,Westmere就是Nehalem的增強(qiáng)版本。
Intel High-k Metal Gate晶體管,這兩個(gè)技術(shù)都是為了增強(qiáng)晶體管的場(chǎng)效應(yīng)和降低其漏電
除了工藝之外,Westmere最大的特點(diǎn)就是最高集成了6個(gè)處理器核心,包括12MB L3緩存,共多達(dá)11.7億晶體管,四核心的Nehalem包括8MB L3緩存則有7.31億晶體管,而這兩者具有接近的核心面積(Westmere的還要小一點(diǎn))。
雙核和六核Westmere晶圓圖
和Nehalem一樣,Westmere也實(shí)現(xiàn)了Power Gates技術(shù),和Nehalem不同的是,Westmere的Power Gates不僅僅限于關(guān)閉處理器核心,它還擴(kuò)展到了可以關(guān)閉L3緩存以及Uncore上的全局隊(duì)列(Westmere晶圓上正中央下方的部分)。在所有核心都被Power Gate之后,L3緩存將會(huì)被部分刷新并且Uncore部分的供電將會(huì)線形地降低,L3/Uncore的漏電樓將得到降低。在最限制的情況下,L3緩存和全局隊(duì)列將會(huì)全部刷新并Power Gated關(guān)閉,只有一塊附屬于L3的SRAM會(huì)用來(lái)保持所有核心的關(guān)鍵狀態(tài)。
和Nehalem一樣,Westmere也使用了Long-Le晶體管(Long Channel長(zhǎng)溝道晶體管)技術(shù),Nehalem-EX和Dunnington也有使用,只是“分量”有些不同。Westmere有60%的核心部分使用了長(zhǎng)溝道晶體管,Uncore部分則同時(shí)使用了超低漏電晶體管和長(zhǎng)溝道晶體管。Nehalem則是58%的核心部分使用了長(zhǎng)溝道晶體管。
最后,Westmere的漏電功耗大約是總功耗的23%。Nehalem上這個(gè)數(shù)值是16%。
什么是長(zhǎng)溝道晶體管技術(shù)呢?
樣表:溝道長(zhǎng)度(橫坐標(biāo))與漏電流(縱坐標(biāo))的關(guān)系,請(qǐng)自行理解(越低的延遲,越高的漏電電流)
在IC設(shè)計(jì)當(dāng)中通常需要根據(jù)不同的情況使用不同溝道長(zhǎng)度的晶體管,非時(shí)序關(guān)鍵(non-timing-critical)的線路可以使用性能略差的長(zhǎng)溝道MOSFET晶體管以減少亞閾值漏電。亞閾值漏電:subthreshold leakage,MOSFET的subthreshold亞閾值特性被廣泛利用在低電壓線路上。
#p#
基于Tulsa核心的至強(qiáng)7100系列
型號(hào) | 制程 | 緩存 | 主頻 | 前端總線 | TDP | SMP | 雙核心 | 超線程 |
7150N | 65 nm | 16 MB L3 2x1 MB L2 |
3.50 GHz | 667 MHz | 150W | MP | 支持 | 支持 |
7140M | 65 nm | 16 MB L3 2x1 MB L2 |
3.40 GHz | 800 MHz | 150W | MP | 支持 | 支持 |
7140N | 65 nm | 16 MB L3 2x1 MB L2 |
3.33 GHz | 667 MHz | 150W | MP | 支持 | 支持 |
7130M | 65 nm | 8 MB L3 2x1 MB L2 |
3.20 GHz | 800 MHz | 150W | MP | 支持 | 支持 |
7130N | 65 nm | 8 MB L3 2x1 MB L2 |
3.10 GHz | 667 MHz | 150W | MP | 支持 | 支持 |
7120M | 65 nm | 4 MB L3 2x1 MB L2 |
3 GHz | 800 MHz | 95W | MP | 支持 | 支持 |
7120N | 65 nm | 4 MB L3 2x1 MB L2 |
3 GHz | 667 MHz | 95W | MP | 支持 | 支持 |
7110M | 65 nm | 4 MB L3 2x1 MB L2 |
2.60 GHz | 800 MHz | 95W | MP | 支持 | 支持 |
7110N | 65 nm | 4 MB L3 2x1 MB L2 |
2.50 GHz | 667 MHz | 95W | MP | 支持 | 支持 |
7041 | 90 nm | 2x2 MB | 3 GHz | 800 MHz | N/A | MP | 支持 | 支持 |
7040 | 90 nm | 2x2 MB | 3 GHz | 667 MHz | N/A | MP | 支持 | 支持 |
7030 | 90 nm | 2x1 MB | 2.8 GHz | 800 MHz | N/A | MP | 支持 | 支持 |
7020 | 90 nm | 2x1 MB | 2.66 GHz | 667 MHz | N/A | MP | 支持 | 支持 |
采用Paville核心的Xeon MP處理器屬于Xeon 7000系列,而采用Tulsa核心的Xeon MP處理器屬于Xeon 7100系列。Xeon 7100系列處理器主頻范圍在2.5GHz到3.5GHz之間,前端總線分為667MHz和800MHz兩種,型號(hào)后綴為N的前端總線為667MHz,型號(hào)后綴為M的前端總線為800MHz。Xeon 7000利用處理器主頻和前端總線頻率來(lái)區(qū)隔不同型號(hào)的產(chǎn)品(Xeon 5000/5100系列處理器也是如此),而Xeon 7100則不僅利用主頻、前端總線還利用L3緩存來(lái)區(qū)隔不同型號(hào)的產(chǎn)品。
![]() |
從我們所掌握的資料來(lái)看,Tulsa和Paville在處理器微架構(gòu)上并沒(méi)有明顯的區(qū)別。因此Tulsa處理器如果要具有比Paxville更吸引人的性能,除了提升頻率之外,就是在緩存上做文章了。
每個(gè)Xeon 7100處理器均包含兩個(gè)完整的核心,每核心均配置了1MB L2緩存,這僅是Xeon 7030/7040處理器L2緩存容量的一半。不過(guò),Xeon 7100的兩個(gè)核心可以共享“新增”的L3緩存,比如7110和7120均配置了4MB L3緩存,7130配置了8MB L3緩存,而7140和7150都配置了16MB L3緩存,因此縮減了L2緩存容量并不一定會(huì)犧牲處理器整體性能。特別需要說(shuō)明的是,7140和7150的L3緩存容量達(dá)到了16MB,僅次于Intel于今年發(fā)布的雙核Itanium 2 9000處理器24MB L3緩存的容量。但是增加L3緩存并非創(chuàng)新,從Xeon MP的歷史來(lái)看,這樣的“改變”僅僅是一次回歸而已。
65納米制程的應(yīng)用使得Tulsa處理器得以集成更大容量的緩存。不過(guò)即便如此,Tulsa核心面積依然達(dá)到了424平方毫米,而之前的單核Potomac核心面積為354平方毫米,Paville的核心面積也只有299平方毫米。如果處理器復(fù)雜程度變化不大,從90納米制程升級(jí)到65納米制程則意味著同樣尺寸的晶圓可以切出更多的芯片,從而大幅度降低成本,但是Tulsa集成度遠(yuǎn)遠(yuǎn)高于前兩代產(chǎn)品,因此其成本不會(huì)因此有明顯降低。
同樣,因?yàn)榧啥鹊奶岣撸╔eon 7100處理器內(nèi)包含13億個(gè)晶體管),Tulsa的功耗的絕對(duì)值也維持著較高的水平。Xeon 7110/7120的TDP為95W,而7130、7140和7150則均達(dá)到了150W。考慮到Xeon 7100系列處理器主頻更高,而且整合了L3緩存,其相對(duì)于Paxville處理器在能耗控制上還是取得了很大的進(jìn)步的。
Intel提供的資料顯示,采用Tulsa核心的Xeon 7100系列處理器在ERP、SCM、CRM等商業(yè)應(yīng)用中性能有60%以上的提升,更可以將交易處理速度提升70%以上(TPC-C測(cè)試,Tulsa 320000 TPM,Paxville 188000 TPM,Potomac 115000TPM),部分電子商務(wù)應(yīng)用軟件中其性能提升1倍以上。同時(shí),Intel還宣稱Xeon 7100系列處理器的每瓦特性能是上一代產(chǎn)品的2.8倍。
大容量L3緩存除了可為處理器提供速度數(shù)據(jù)緩存之外,還可供Tulsa處理器內(nèi)部的兩個(gè)核心交換L2緩存數(shù)據(jù)之用,而無(wú)需經(jīng)過(guò)FSB和北橋,這將大大提升緩存命中率,改善延遲效能。
#p#
代號(hào)Tigerton 至強(qiáng)7300系列
![]() |
Tigerton分為四核和雙核兩個(gè)版本 |
隨Caneland平臺(tái)一起發(fā)布的有兩個(gè)系列的處理器:Xeon 7300四核處理器和Xeon 7200雙核處理器,代號(hào)分別為Tigerton-QC和Tigerton-DC。從上圖可以看出,這兩個(gè)系列的處理器均是將兩個(gè)DIE封裝在一起,每個(gè)DIE均有4MB L2緩存。其中Tigerton-DC的設(shè)計(jì)非常有意思,它沒(méi)有采用單個(gè)DIE雙核的設(shè)計(jì)——英特爾稱這種設(shè)計(jì)可以在現(xiàn)有條件下讓雙核處理器具有更大容量的緩存,適于某些高性能計(jì)算和財(cái)務(wù)服務(wù)等有較大緩存需求的應(yīng)用。
處理器型號(hào) | 主頻 | L2緩存 | FSB | TDP | 按需配電(DBS) | 封裝 |
X7350 | 2.93GHz | 8MB | 1066MT/s | 130瓦 | 是 | FC-mPGA6 |
L7345 | 1.86GHz | 8MB | 1066MT/s | 50瓦 | 否 | FC-mPGA6 |
E7340 | 2.40GHz | 8MB | 1066MT/s | 80瓦 | 是 | FC-mPGA6 |
E7330 | 2.40GHz | 6MB | 1066MT/s | 80瓦 | 是 | FC-mPGA6 |
E7320 | 2.13GHz | 4MB | 1066MT/s | 80瓦 | 是 | FC-mPGA6 |
E7310 | 1.6GHz | 4MB | 1066MT/s | 80瓦 | 否 | FC-mPGA6 |
E7220 | 2.93GHz | 8MB | 1066MT/s | 80瓦 | 是 | FC-mPGA6 |
E7210 | 2.40GHz | 8MB | 1066MT/s | 80瓦 | 是 | FC-mPGA6 |
Xeon 7300系列處理器包括6款產(chǎn)品,其中4款E系列主頻在1.6GHz-2.4GHz之間,4-8MB L2緩存,1066MT/s,TDP均為80瓦,適用于機(jī)架式/刀片式服務(wù)器;L系列只有一款L7345,主頻為1.86GHz,8MB L2緩存,TDP為50瓦,適用于高密度機(jī)架式/刀片式服務(wù)器;X系列的也只有一款X7350,主頻高達(dá)2.93GHz,TDP也達(dá)到了130瓦,適用于高性能應(yīng)用。
Xeon 7200/7300擴(kuò)容了二級(jí)緩存去掉了三級(jí)緩存,因此我們估計(jì)Tigerton的復(fù)雜程度并不會(huì)明顯的增加,所以功耗的降低主要來(lái)自頻率的降低和65nm制程的進(jìn)一步改進(jìn)。Xeon 7200/7300處理器支持TM1、TM2功能,利用英特爾智能功率控制技術(shù)可單獨(dú)控制每個(gè)核心的功率狀態(tài)。
系列名稱 | 代號(hào) | 型號(hào) | 主頻范圍 | L2緩存 | L3緩存 | FSB | TDP范圍 | DC/QC | 制程 |
Xeon 7000 | Paxville | 7041、7040、7030、7020 | 2.66-3.0GHz | 2x(1-2)MB | 0 | 667-800MT/s | - | DC | 90nm |
Xeon 7100 | Tulsa | 7110N/M-7150N | 2.5-3.5GHz | 2x1MB | 4-16MB | 667-800MT/s | 95-150瓦 | DC | 65nm |
Xeon 7200 | Tigerton-DC | E7210、E7220 | 2.4-2.93GHz | 2x(2-4)MB | 0 | 1066MT/s | 50-80-130瓦 | DC | 65nm |
Xeon 7300 | Tigerton-QC | E/L/X三個(gè)系列,共6款 | 1.6-2.93GHz | 2x4MB | 0 | 1066MT/s | 80瓦 | QC | 65nm |
Tulsa相對(duì)于Paxville在微架構(gòu)上并沒(méi)有改進(jìn),最大的改變是開(kāi)始采用65nm制程,為了進(jìn)一步的提升性能,只有在主頻和L3緩存上打主意。棄用Netburst微架構(gòu),采用高效能的Core微架構(gòu)(內(nèi)置WDEE,寬位動(dòng)態(tài)執(zhí)行引擎)并且升級(jí)到四核是Xeon 7200/7300系列處理器相對(duì)于之前的Xeon 7000/7100系列處理器最大的不同。此外,Xeon 7200/7300還擴(kuò)容了二級(jí)緩存(從2x1MB升級(jí)到了2x4MB,支持智能緩存和智能內(nèi)存訪問(wèn)),去掉了三級(jí)緩存(也不排除今后為了提升性能再增加),同時(shí)前端總線升級(jí)為1066MT/s,按照英特爾Xeon DP路線圖來(lái)看,今后Xeon MP處理器的FSB升級(jí)到1333MT/s甚至1600MT/s也是可能的。
代號(hào)Tigerton,基于Core微架構(gòu)的Xeon 7300處理器
所有的Xeon 7200/7300都支持EM64T、EIST、EDbit、VT等技術(shù),提供豐富的功能來(lái)滿足多種應(yīng)用的需求。
#p#
Dunnington采用其后來(lái)者Nehalem一樣的45nm CMOS工藝,采用了金屬柵極High-K電介質(zhì)晶體管以及9層銅互聯(lián)技術(shù),總晶體管數(shù)量則為1.9 Billion——19億,已經(jīng)和Nehalem-EX的23億很接近了,新增加的核心和大容量的L3都需要占據(jù)很多的晶體管。Dunnington的核心面積為503.2mm。
六核心45nm Penryn Dunnington——Xeon X7460的結(jié)構(gòu)圖,和其他Penryn不同,是一整塊“原生”的核心
來(lái)源:ISSCC2009 Over 1 Million TPC-C with a 45nm 6-Core Xeon CPU
對(duì)于一款處理器來(lái)說(shuō),除了外部平臺(tái)的架構(gòu)之外,處理器內(nèi)部架構(gòu)和處理器微架構(gòu)都是對(duì)性能有很大影響的主要因素。如圖所示的Dunnington屬于最高規(guī)格的一款,型號(hào)是X7460(曙光I840-H就采用了這款處理器),架構(gòu)上具有6個(gè)Penryn核心,每個(gè)核心帶有64KB L1緩存(32KB L1-I,2KB L1-D),每?jī)蓚€(gè)處理核心共享3MB的L2緩存(果然還是帶有“粘”的性質(zhì)),三對(duì)處理器內(nèi)核就總共帶了9MB容量的L2,每個(gè)核心通過(guò)一條128Bytes的緩存線聯(lián)結(jié)L2。Intel宣稱不同的一對(duì)核心之間的L2是具有其他互通界面的(被命名為Advanced Transfer Cache Architecture),不過(guò)語(yǔ)焉不詳。其他的四核45nm Penryn也具有這個(gè)高級(jí)緩存?zhèn)鬏敿軜?gòu)。X7460的核心頻率為2.66GHz,不算太高。Dunnington里面最高主頻就是2.93GHz。
7400系列處理器的規(guī)格,注意7400系列處理器里面也有4核心的型號(hào)
7400系列處理器的緩存架構(gòu)細(xì)節(jié)
重點(diǎn)來(lái)了,除了上面這些傳統(tǒng)的架構(gòu)之外,Dunnington特別的地方是多了一個(gè)Uncore結(jié)構(gòu),這個(gè)結(jié)構(gòu)包括了容量達(dá)到了16MB的L3緩存,所有的處理核心經(jīng)過(guò)L2聯(lián)結(jié)到中央系統(tǒng)邏輯,如下圖所示,標(biāo)明為Uncore的中央電路聯(lián)結(jié)著所有的核心以及16MB L3緩存,并通過(guò)一個(gè)傳統(tǒng)的FSB總線與處理器外部通信,由于所有處理內(nèi)核是通過(guò)新的總線與Uncore聯(lián)結(jié),而與以往的“粘結(jié)產(chǎn)品”使用FSB互聯(lián)不同,大部分的交通都發(fā)生在內(nèi)部,從而可以大為節(jié)約處理器的FSB帶寬。Xeon X7460的FSB頻率為1066MHz,提供8.5GB/s的帶寬,現(xiàn)在的Xeon MP都支持MIB(Multiple Independent Bus,多重獨(dú)立總線,Xeon DP的DIB的進(jìn)階版本),每一個(gè)處理器都通過(guò)獨(dú)立的FSB與MCH聯(lián)結(jié),因此效率上還可以。
"Uncore"是六核心45nm Penryn至強(qiáng)Dunnington的重要部分
#p#
代號(hào)為Nehalem-EX的服務(wù)器處理器是x86架構(gòu)中第一個(gè)具有8個(gè)核心的產(chǎn)品,Nehalem-EX擁有8個(gè)CPU核心,配置了24MB的L3。我們知道Intel的x86服務(wù)器產(chǎn)品線通常分為兩個(gè)層次:2個(gè)Socket以及2個(gè)Socket以上,如Nehalem-EP就是用于2個(gè)及以下Socket,Nehalem-EX就是用于4個(gè)或4個(gè)以上Socket。臺(tái)式機(jī)產(chǎn)品線的Nehalem處理器:Core i7(Bloomfield)在2008年11月發(fā)布,Nehalem-EP則預(yù)計(jì)在2009年3月中發(fā)布,Nehlam-EX若無(wú)意外則會(huì)是在下半年的晚些時(shí)候。由于競(jìng)爭(zhēng)對(duì)手AMD的6核心Operton Istanbul就目前來(lái)看也就和Nehalem-EP打個(gè)不分上下,因此提前推出的“意外”應(yīng)該很難發(fā)生。
Intel 45nm/32nm 處理器 |
此次Nehalem-EX是由位于California加利福尼亞州Santa Clara研發(fā)中心推出的。一般認(rèn)為該研發(fā)中心擔(dān)任Itanium處理器的研發(fā)工作。順便提一下,Pentium Pro、Pentium 4處理器都是出自Hillsboro研發(fā)中心,HTT超線程技術(shù)也是,因此Nehalem和Pentium Pro這么相像、Nehalem上搭載Pentium 4上的超線程改良版也就順理成章、容易理解了——現(xiàn)在大家清楚為什么Pentium 4、Nehalem有超線程而Cornoe沒(méi)有超線程了吧?
來(lái)源:ISSCC2009 A 45nm 8-Core Enterprise Xeon® Processor
上圖是Intel在ISSCC09 "A 45nm 8-Core Enterprise Xeon® Processor"論文當(dāng)中給出的Nehalem-EX核心分布圖,基本構(gòu)成是處理器核心分布在四個(gè)角落,所有核心共享的L3緩存則居于內(nèi)核中部,在內(nèi)核正中央則具有兩個(gè)Hub集線器和一個(gè)Router路由器來(lái)負(fù)責(zé)所有核心的數(shù)據(jù)共享,管理內(nèi)存、QPI以及L3緩存之間的數(shù)據(jù)流向。Nehalem-EX在核心正上面具有4個(gè)QPI——QuickPath Interconnect總線,核心正下方則是兩個(gè)內(nèi)存界面,總共有4個(gè)DDR3內(nèi)存通道。下圖是另一個(gè)形式的核心分布圖,帶有一些猜測(cè)性質(zhì):
眾所周知,Nehalem-EX的生產(chǎn)工藝和其他Nehalem都一樣,都是45nm CMOS工藝,采用了金屬柵極High-K電介質(zhì)晶體管以及9層銅互聯(lián)技術(shù),總晶體管數(shù)量則為2.3 Billion——23億,是4核心Bloomfield的三倍以上,和Tukwila Itanium處理器一樣,然而Tukwila不斷跳票,因此Nehalem-EX有幸成為現(xiàn)在Intel晶體管數(shù)量最多的處理器。此外,雖然晶體管數(shù)量劇增,Nehalem-EX的面積卻只提升了約2.4倍左右。除了核心數(shù)量是Bloomfield的兩倍之外,額外加入的晶體管被用在了更多數(shù)量的L3上,QPI/IMC以及中央系統(tǒng)邏輯(Hub和Router)的變化不算太大。
【編輯推薦】