聚合的力量 AMD Llano移動版評測

前用戶采購整機往往是過于在乎處理器性能,但隨著GUI圖形加速技術(shù)的發(fā)展,和人民群眾日益增長的對于多媒體和娛樂功能需求,GPU的性能也愈發(fā)重要。但對于預(yù)算并不寬裕的普通用戶,性能強勁的CPU和GPU似乎不可兼得,而只能退而求其次使用性能孱弱的集成GPU系統(tǒng)。
而AMD在收購ATI之后,使得其具備了競爭對手諸如Intel或者NVIDIA都不具備的同時掌握的CPU和GPU的雙方面技術(shù)優(yōu)勢,而AMD利用這一優(yōu)勢提出了“融聚” Fusion的理念,將CPU和GPU融為一體。
年初稍早時候推出Bobcat是聚合的首次嘗試,可將Netbook的性能在極低成本控制情況下提高到“可用”的級別,使得上網(wǎng)本重新獲得新的生命。而現(xiàn)在全新Llano聚合處理器則是針對主流級乃至性能級市場,為廣大主流用戶提供高性價比、并能帶來愉悅娛樂體驗的CPU+GPU的融聚平臺方案。

從AMD的PPT上看,Llano A系列相比競爭對手的方案全面占優(yōu),是完全勝利者#p#
Llano的CPU架構(gòu)
AMD用一個核心修修補補,一直從250nm時代走近了32nm時代,Llano也許是最后的EV6,同時也是新的起點。EV6的演化正好也是一個融合的過程,從L2 Cache外置,一直到連GPU都內(nèi)置。Llano CPU本身并沒有什么太多好說,核心部分還是延續(xù)EV6的“”Shanghai”微架構(gòu),但由于每個核心L2緩存增大到了1MB,改進(jìn)的硬件預(yù)拾取單元和更大的載入/存儲緩存使得Llano的CPU核心效能相比之前的 Athlon II/Phenom II 略有提升。Llano真正值得關(guān)注的重點則是其“融聚”的進(jìn)程。

Llano(以最高規(guī)格為例)同時集成了4個CPU核心,每個核心對應(yīng)1MB L2緩存(左側(cè)),而右部的大部分區(qū)域這是GPU部分,由于GPU擁有400個流處理器、20個紋理單元和8個光柵化單元,再加上外圍集成的內(nèi)存控制器、北橋、PCIE接口,使得其面積十分巨大,晶體管數(shù)量更是高達(dá)14.5億,在規(guī)模上甚至要大于六核心的Gulftown。不過Llano得益于Global Foundries 32nm的SOI工藝,使得其的Die Size還在可以接受的范圍。不過處理器工藝要求相比GPU在漏電控制上有更高要求,所以也使得Llano在GPU部分的電路成本相比獨立的GPU單位面積成本更高。

Llano的GPU架構(gòu)
而GPU部分,Llano采用的Sumo架構(gòu)則是在Redwood體系上進(jìn)行改良,增加了UVD3,并針對APU內(nèi)部北橋互聯(lián)的方式,對顯存控制器進(jìn)行了改進(jìn)。

Llano內(nèi)部集成的GPU 和Radeon HD5xxx一樣,80個流處理器為一組SIMD,從低到高依次有2至5組SIMD,而每組SIMD對應(yīng)4個紋理單元,最高規(guī)格的Radeon HD 6620G則擁有400個流處理器、20個紋理單元和8個光柵單元,使得其規(guī)模跟獨立的Radeon HD5570類似。但由于 GPU內(nèi)置,其核心和Shader頻率則要明顯低于獨立的Radeon HD5570,并且其由于是將內(nèi)存作為共享顯存,其顯存帶寬相比5570也更低,同時還需要考慮CPU部分對于內(nèi)存帶寬占用的情況,所以APU的實際性能相比類似規(guī)格的獨立GPU性能還是稍差。

Llano功耗控制

Llano也進(jìn)一步改進(jìn)了Turbo Core功耗管理機制,每個核心處理器都帶有功耗監(jiān)視器,通過P-state管理器依據(jù)應(yīng)用需求對單個核心的頻率、電壓進(jìn)行調(diào)整。

當(dāng)然,GPU和CPU的聚合使得功耗控制的需求更為復(fù)雜化, 在如3Dmark游戲測試這樣高GPU負(fù)載的應(yīng)用環(huán)境,圖像性能對于功耗的需求更為迫切,系統(tǒng)則會提升GPU部分的頻率同時,為了將熱設(shè)計功耗控制在TDP之內(nèi),而自動降低CPU部分的頻率。

而在3DMark CPU性能測試這樣典型的高CPU負(fù)載,低GPU負(fù)載場景,系統(tǒng)則會自動優(yōu)先提高CPU頻率。#p#
Llano游戲性能測試
DX11的游戲越來越成為游戲的主流配置,而A系列APU提供了如Compute Shader、Tessllation等完整的DX11特性支持,因此我們測試項目主要依然聚焦于如叛逆連隊2這些大家更為喜聞樂見的主流DX11游戲上,通過基于實際游戲的性能測試來告訴大家通過Llano可以獲得如何的游戲體驗。具體的畫面設(shè)定,我們都設(shè)定在Playable的設(shè)定,均關(guān)閉全屏抗鋸齒,保持游戲在30FPS以上,毫無疑問這樣的測試設(shè)定對于玩家而言更為有參考價值。

《生化危機5》是CAPCOM采用Frameworks引擎開發(fā)的第三人稱動作射擊游戲,我們采用游戲自帶Benchmark進(jìn)行測試,融合單顯HD 6520G在High設(shè)定下基本可以做到基本流暢可玩。
Dirt 3是Codemaster采用EGO引擎開發(fā)的DX11賽車游戲,其支持Tessllation等DX11特效,但對于APU平臺而言,我們同樣采用游戲自帶Benchmark進(jìn)行測試。
魔獸世界必然是最多玩家關(guān)心的測試項目,我們采用新建血精靈角色的過程動畫為測試場景,使用Fraps進(jìn)行Benchmark,在高畫質(zhì)下APU平臺依然保持在30FPS可玩性能之下。
《戰(zhàn)地:叛逆連隊2》是DICE開發(fā)的DX11第一人稱射擊游戲,采用“寒霜”引擎,我們采用Cold War開頭擴充動畫為測試場景,在開啟CrossFire后可以流暢運行。#p#
Llano頻率及性能分析
另外我們還用3Dmark 11配合AMD System Monitor對系統(tǒng)資源分配進(jìn)行了分析:

游戲性能測試,GPU為400MHz高頻,占用大部分資源,CPU頻率為1.4GHz。

CPU高負(fù)載的物理性能測試,GPU工作在275MHz的中間頻率段,CPU使用TDP允許范圍內(nèi)的大部分功耗,但頻率依然為1.4GHz。

而CPU和GPU負(fù)載都很高的混合測試,GPU工作在400MHz的高頻,同時CPU核心也有較大的負(fù)載,但系統(tǒng)功耗主要集中在CPU部分。#p#
Llano展望
Llano是繼Bobcat后AMD在聚合道路上向前邁出的又一堅實一步,其最大的意義在于其為普通消費者提供了可以承擔(dān)的主流級性能集成解決方案,使得集顯玩動主流游戲并不再是夢想。
AMD是唯一有雄厚x86架構(gòu)CPU和GPU研發(fā)實力的廠商,在聚合方面做了頗多的努力,AMD競爭對手Intel雖然從Clarkdale到SandyBridge架構(gòu)進(jìn)化很大,但其始終受制于僅有的CPU核心研發(fā)實力,而GPU部分則是依靠PowerVR的第三方IP架構(gòu),不僅其性能無法滿足主流應(yīng)用的性能需求,更深層次來說也很難實現(xiàn)深層次的架構(gòu)融合。NVIDIA雖然在通用計算領(lǐng)域暫時領(lǐng)先AMD,其也有“丹佛”所謂CPU的計劃,但其本質(zhì)是是整合ARM核心作為CUDA Core的控制器和調(diào)度器,而不是作為真正意義的CPU,僅僅只會活躍在Tesla的狹義“通用”計算領(lǐng)域,這使得其在真正意義的“通用”用途上難有作為,而Tegra 3押寶必然失敗的Windows 8 ARM版和Android平板平臺,自然會重蹈Tegra 2失敗的命運。
當(dāng)然現(xiàn)在Bobcat和Llano僅僅是聚合長征的開始,后面AMD還有很多的工作要做,我們可以預(yù)計后繼的Llano會有更大的改進(jìn):一方面GPU核心由5D架構(gòu)進(jìn)化到4D,再進(jìn)化到“Sourthern Island”的1D架構(gòu),使得架構(gòu)有更強的靈活性和通用性。當(dāng)然更為值得的期待是APU聚合方式的改變:全新的Bulldozer內(nèi)核相比之前的架構(gòu)更像是為聚合而生,GPU和CPU可以不通過北橋而直接相連,同時互聯(lián)帶寬進(jìn)得到一步提升,并共用緩存和寄存器資源,甚至共享浮點運算單元,讓GPU部分更多的協(xié)助CPU處理通用運算,從而達(dá)成更深層次的“聚合”。
【編輯推薦】