自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPU受寵 新Sandy Bridge增強(qiáng)圖形性能

運(yùn)維 服務(wù)器運(yùn)維
英特爾這次將大幅度增強(qiáng)Sandy Bridge的圖形核心性能。而增強(qiáng)的主要部分,總體上是現(xiàn)在的"GPU核心"化。換句話說(shuō),隨著NVIDIA和AMD逐漸都朝著GPU內(nèi)核的方向發(fā)展,英特爾也開(kāi)始朝著相同方向邁進(jìn)。

相比之前,英特爾這次將大幅度增強(qiáng)Sandy Bridge的圖形核心性能。而增強(qiáng)的主要部分,總體上是現(xiàn)在的"GPU核心"化。換句話說(shuō),隨著NVIDIA和AMD逐漸都朝著GPU內(nèi)核的方向發(fā)展,英特爾也開(kāi)始朝著相同方向邁進(jìn)。不管是英特爾過(guò)去的特有架構(gòu),還是和其他公司合作的眾多架構(gòu)都將面臨著巨大的改變。

Sandy Bridge處理器圖形核心

簡(jiǎn)而言之,就是特別重視低成本化,英特爾的CPU已是普遍銷(xiāo)售了,但圖形核心還沒(méi)達(dá)到此種程度。這是因?yàn)槠湫阅苄室约俺绦蛲ㄓ眯远急容^弱。與此相反的是,Sandy Bridge的圖形核心比較注重GPU性能和電源效率之間的成本比,更多的考慮了通用性。

Sandy Bridge圖形核心的目標(biāo)在于,將較高的3D圖形性能和面向通用計(jì)算功能,以及有效進(jìn)行媒體處理組合為一體。具體來(lái)說(shuō),(1)固定在處理器上的功能單元組合保證了3D圖形的有效實(shí)現(xiàn),(2)補(bǔ)充面向通用計(jì)算和媒體處理的指令和功能,(3) 由此強(qiáng)化媒體處理的固定功能單元。這些的改進(jìn)將從新一代Sandy Bridge開(kāi)始。

這些改進(jìn)多半是為了跟進(jìn)其他公司在GPU內(nèi)核上的發(fā)展。而英特爾獨(dú)有的部分與其他公司的GPU內(nèi)核技術(shù)上還存在著許多差距。英特爾在其9月舉辦的英特爾信息技術(shù)峰會(huì)(IDF)上已做過(guò)簡(jiǎn)要的說(shuō)明,從其說(shuō)明看來(lái),傳統(tǒng)英特爾圖形的弱點(diǎn)還是顯而易見(jiàn)的。而NVIDIA和AMD的GPU的優(yōu)勢(shì)也是相當(dāng)明顯的。

#p#

基本的整體架構(gòu)繼承了傳統(tǒng)的英特爾圖形核心

Sandy Bridge圖形核心的整體架構(gòu)遵循了英特爾傳統(tǒng)的內(nèi)核架構(gòu)。下圖是根據(jù)英特爾的基本描述而得到的標(biāo)準(zhǔn)GPU結(jié)構(gòu)圖。利用這樣的方式可以清楚地說(shuō)明英特爾所保持的大框架相關(guān)內(nèi)容。

 

 

Sandy Bridge圖形內(nèi)核的整體架構(gòu)

圖上方的排列是3D通道和控制單元群。這些圖形通道頂部是必要的像素處理單元,可進(jìn)行早期的Z檢驗(yàn)。

Intel架構(gòu)中的各個(gè)處理器被稱之為"EU(執(zhí)行單元)"。如果要計(jì)算Intel圖形處理器的數(shù)量,一般以EU來(lái)計(jì)數(shù),EU實(shí)際上就是SIMD(單指令多數(shù)據(jù)流)型的運(yùn)算處理器。

EU陣列右上角是媒體堆棧。除有固定功能的視頻解碼器, EU陣列還運(yùn)行媒體處理和控制單元。

EU陣列右邊是從內(nèi)存中讀取數(shù)據(jù)的紋理采樣器處理單元。紋理采樣器在內(nèi)存中讀取紋理以過(guò)濾3D圖形管道,它為各個(gè)EU所共有。

紋理采樣器內(nèi)存(Sandy Bridge內(nèi)部的環(huán)形總線)直接連接在總線的內(nèi)存接口。傳統(tǒng)的英特爾圖形核心從緩存中讀取紋理。從圖中可推斷,Sandy Bridge的圖形核心可能采用了相同的結(jié)構(gòu)。而核心的存儲(chǔ)器層次結(jié)構(gòu)則可能發(fā)生了變化。

另一個(gè)是媒體采樣器,是媒體處理專用的過(guò)濾器。它也與系統(tǒng)內(nèi)存接口相連,并有可能與紋理采樣器共享。

此外,也像普通的GPU一樣進(jìn)行像素單位操作(ROP)。像素操作內(nèi)存(Sandy Bridge內(nèi)部的環(huán)形總線)也是與系統(tǒng)內(nèi)存接口直接相連。

因此,Sandy Bridge圖形核心具備了一般的GPU單元。而這一點(diǎn),即使是同樣的英特爾架構(gòu)幾乎也沒(méi)有固定處理功能塊,而軟件處理器Larrabee就大為不同。Larrabee的光柵和ROP單元沒(méi)有GPU所必需的功能塊。

#p#

固定硬件處理器運(yùn)行EU的卸載

Sandy Bridge圖形核心的基本結(jié)構(gòu)遵循了英特爾傳統(tǒng)的圖形核心。而在3D圖形和媒體處理方面卻與傳統(tǒng)存在著很大區(qū)別。這是處理器的軟件處理等固定功能單元執(zhí)行的硬件處理。

 

 

軟件處理和硬件處理的比較

據(jù)說(shuō)新一代英特爾集成顯卡設(shè)計(jì)已在處理器EU的3D圖形管道中模擬了許多內(nèi)核程序的固定處理。英特爾表示這是為了減少圖形核心的晶片面積。減少固定單元所占有的晶片面積,可降低核心的可編程單元。

這種方法使得每晶片面積的性能有所提高,但在電力消耗方面卻表現(xiàn)不佳。通常,固定功能單元功耗最低,而可編程處理器功耗更多。因此,傳統(tǒng)的英特爾圖形核心每瓦的性能決不會(huì)很高。于是,3D圖形管道的固定功能基本是封裝在固定硬件上。

英特爾研究員兼圖形架構(gòu)總監(jiān)Thomas Piazza 表示:"過(guò)去曾考慮過(guò)每部分管道是否可以運(yùn)行程序,如果可能的話,將會(huì)被設(shè)計(jì)用于運(yùn)行程序。然而,Sandy Bridge考慮是否需要運(yùn)行程序,如果沒(méi)有必要,將通過(guò)硬件封裝固定功能來(lái)實(shí)現(xiàn)"。

#p#

卸載固定硬件的驅(qū)動(dòng)程序

處理器運(yùn)行的同時(shí),也盡可能多的卸載固定功能單元。這是優(yōu)先考慮吞吐量和電力效率的常規(guī)性方法。這樣一來(lái)便可提高圖形處理的電源效率,降低延遲,增加吞吐量。

 

Sandy Bridge處理器顯卡的性能優(yōu)化

Sandy Bridge圖形核心的這些改進(jìn)結(jié)果原理上不只提高了每瓦的性能,還卸載了驅(qū)動(dòng)程序。因?yàn)榫哂泄潭üδ艿腁PI,將不再需要處理器程序的JIT編譯器進(jìn)行轉(zhuǎn)換。Piazza表示:"驅(qū)動(dòng)程序相比之前在運(yùn)行時(shí)間上將有顯著的減少"。

英特爾表示降低了驅(qū)動(dòng)程序所需的CPU性能如時(shí)鐘,也降低CPU功耗。換句話說(shuō),當(dāng)圖形處理時(shí),圖形核心的電源效率以及驅(qū)動(dòng)程序的運(yùn)行時(shí)間都將有所改善。

英特爾新的圖形核心改善了固定功能硬件效率,它對(duì)比于其他廠商,并沒(méi)多大創(chuàng)新。而重要的一點(diǎn)是,英特爾設(shè)計(jì)策略的180度大轉(zhuǎn)彎--"GPU圖形核心猜想"。

這和Larrabee時(shí)"CPU的圖形核心猜想"是完全相反的。固定硬件將盡可能消除英特爾Larrabee試圖用處理器進(jìn)行處理的情況。

#p#

擴(kuò)展現(xiàn)有EU運(yùn)行的應(yīng)用軟件

由于在3D圖形管道中固定處理,固定處理硬件可實(shí)現(xiàn)高效率運(yùn)行3D圖形。EU將本來(lái)集中處理的利用固定功能模擬分開(kāi)。Sandy Bridge架構(gòu)這樣的改進(jìn)已經(jīng)開(kāi)始。

 

 

Sandy Bridge的改進(jìn)點(diǎn)

同時(shí)Sandy Bridge處理器EU的改進(jìn)使它們可以得到更廣泛的應(yīng)用。更復(fù)雜的著色器和非圖形通用計(jì)算程序的改善使得處理器更容易運(yùn)行媒體處理程序。

具體來(lái)說(shuō),擴(kuò)展寄存器文件,強(qiáng)化控制矢量的流量控制,減少數(shù)量的復(fù)合必須加強(qiáng)定點(diǎn)整數(shù)運(yùn)算,通過(guò)削減指令步驟來(lái)減少 CISC(復(fù)雜指令集計(jì)算機(jī))指令復(fù)合,強(qiáng)化固定硬件的整數(shù)運(yùn)算,附加數(shù)據(jù)格式轉(zhuǎn)換及其他指令,變換矢量大小,增加超越函數(shù)吞吐量,以上均由官方在IDF 上發(fā)布。Sandy Bridge EU的這些改進(jìn)部分不僅提高了架構(gòu)的吞吐量,還拓展了程序有效的運(yùn)行范圍。

#p#

消除在增加寄存器時(shí)寄存器的溢出量

首先, EU寄存器文件大小增加了。到目前為止,英特爾圖形核心寄存器文件是有限的,但寄存器是不夠的。因此,EU必須有能力處理寄存器文件溢出,這就不得不從高速緩存和內(nèi)存寄存器撤出數(shù)據(jù)。

然而,這樣處理寄存器溢出可降低吞吐量,通過(guò)移動(dòng)不必要的數(shù)據(jù)也可減少電力消耗。因此,英特爾Sandy Bridge擴(kuò)展寄存器文件,在大多數(shù)情況下,都必須存儲(chǔ)在物理寄存器中。Piazza 解釋道,據(jù)估計(jì)寄存器溢出功能都是由硬件負(fù)責(zé)處理。

 

Sandy Bridge的晶片布局

一般而言,GPU在每線程的物理寄存器的數(shù)量是不固定的,比如在本地著色器在運(yùn)行期間被分配給圖形指令。通常圖形只需要少量的寄存器(一般4到8個(gè)),而通用程序最佳情況是需要32個(gè)寄存器。但當(dāng)啟動(dòng)一個(gè)線程時(shí),必須減少寄存器的每個(gè)線程。

GPU的多線程較強(qiáng)的隱藏了內(nèi)存延遲,大量的啟動(dòng)線程需要大量的寄存器。如果限制啟動(dòng)線程數(shù)量,將有可能停頓內(nèi)存延遲。隱藏CPU緩存延遲,也將隱藏GPU的寄存器延遲。

通用程序和復(fù)雜著色器需要更多的寄存器來(lái)壓入寄存器文件。在這種情況下,要啟動(dòng)一定數(shù)量的線程,物理寄存器將從內(nèi)部和外部存儲(chǔ)器上讀取數(shù)據(jù)以避免不回收而造成的數(shù)據(jù)丟失。據(jù)推測(cè)目前的英特爾圖形就是這種情況。

這將解決寄存器文件擴(kuò)展名的問(wèn)題。當(dāng)然增加寄存器數(shù)量也會(huì)占據(jù)晶片面積。事實(shí)上,NVIDIA和AMD的GPU都存在著寄存器占用晶片面積的情況。英特爾圖形核心也將面臨這種情況。

【編輯推薦】

  1. 英特爾下代Sandy Bridge處理器評(píng)測(cè)(多圖)
  2. 八核心50MB緩存 Sandy Bridge駕臨安騰
  3. IDF課堂:Sandy Bridge架構(gòu)與AVX圖解
責(zé)任編輯:景琦 來(lái)源: zdnet
相關(guān)推薦

2010-08-30 15:28:15

Sandy BridgSNB

2011-05-08 17:23:15

英特爾優(yōu)勢(shì)

2010-09-14 13:37:33

IDF 2010Intel Sandy

2011-04-08 09:25:26

AMDLlanoSandy Bridg

2011-03-31 14:01:23

Sandy Bridg主板

2010-04-16 09:38:23

Sandy BridgAVX

2010-11-19 09:56:38

Sandy Bridg英特爾奔騰

2011-04-06 09:22:29

英特爾至強(qiáng)Sandy Bri處理器

2010-12-20 14:22:27

Nvidia英特爾Sandy Bridg

2011-05-04 15:20:42

Sandy Bridg

2011-02-22 14:10:07

Sandy Bridg至強(qiáng)編號(hào)

2011-01-04 15:24:09

IntelSandy Bridg評(píng)測(cè)

2010-11-04 09:53:47

IntelSandy BridgGPU

2009-09-25 10:36:13

32nm Sandy

2011-01-12 11:27:28

Sandy Bridg內(nèi)核

2010-08-20 09:48:28

英特爾Sandy Br

2011-05-20 09:27:08

英特爾Sandy Bridg至強(qiáng)

2011-07-13 10:27:35

Sandy Bridg服務(wù)器

2010-11-26 11:20:21

Sandy Bridg安騰

2011-04-28 14:29:21

Sandy Bridg低功耗服務(wù)器中小企業(yè)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)