AMD GPU虛擬化圖卡大爆料
千呼萬喚始出來,期待已久的新一代基于硬件的圖形虛擬化顯卡相繼隆重登場了。作為業(yè)界***的顯卡廠商AMD、NVIDIA亦推出了自己的虛擬化顯卡,其各自的旗艦產品FirePro S7150x2與NVIDIA M60更是受到了市場的熱捧。兩大廠商也一致表示,其虛擬化顯卡可為虛擬機桌面基礎設施環(huán)境提供理想的工作站級圖形性能。果真是這樣嗎?正好筆者有幸參與了FirePro S7150x2與NVIDIA M60的測試活動,究竟誰優(yōu)誰劣,誰更適合在那些環(huán)境使用,下面小編就為大家一探究竟吧。
一、什么是FirePro S7150x2與NVIDIA M60
FirePro S7150x2與NVIDIA M60分別是AMD、NVIDIA廠商推出的服務器顯卡。其專為虛擬化環(huán)境而設計,可提供出色的圖形性能。該顯卡易于設置和管理,可組織物理服務器、設備移到數(shù)據(jù)中心,并輕松保護數(shù)據(jù)安全,從而提供簡單、安全、高效的解決方案。
(1)參數(shù)上,如下圖所示:
規(guī)格 |
S7150x2 |
M60 |
處理器核心 |
4096 |
4096 |
顯存大小 |
16GB GDDR5 |
16GB GDDR5 |
散熱 |
被動 |
主動式/被動式 |
功耗 |
265W |
240W/300W(可選225W) |
支持用戶數(shù)量 |
Up to 32 |
Up to 32 |
API Support |
DirectX11.1,OpenGL4.4, OpenCL2.0 |
DirectX12,OpenGL4.5, OpenCL2.0,CUDA |
User License Cost |
$0 |
$600 |
(2)原理上,如下圖所示:
AMD Multiuser GPU工作方式
AMD FirePro S7150x2采用了SR-IOV標準,讓實體圖形卡FirePro S7150x2在PCIe總線上化身多個虛擬設備。然后硬件通過時分的方式,在32個虛擬環(huán)境間進行循環(huán)切換,執(zhí)行運算并向客戶機反饋結果。
AMD Multiuser GPU資源共享方法
AMD虛擬化技術將FirePro S7150x2顯卡Framebuffer切割成若干單元,每個Framebuffer單元與整個GPU Engines共同組合形成新的虛擬設備,然后直通給虛擬環(huán)境執(zhí)行運算。此時,虛擬環(huán)境使用的是真實的物理顯卡,只不過Framebuffer小了一些。
AMD Multiuser GPU在虛擬環(huán)境中的部署方法
如下圖所示,通過直通方式將切割后的物理顯卡單元直接指配給虛擬機。
GRID vGPU工作方式
vGPU 管理器將 GPU 劃分為獨立的 vGPU 實例,這些實例會直接傳遞至安裝在虛擬機上的原生 NVIDIA 驅動程序。當用戶登錄到自己的虛擬機上并開始工作時,NVIDIA 驅動程序會通過 Hypervisor 將命令發(fā)送至 vGPU 引擎,該引擎會對物理 GPU 所要處理的任務進行調度,然后將結果發(fā)回至虛擬機。
GRID vGPU 資源共享方法
vGPU 管理器將 GPU 劃分為若干獨立 vGPU 實例,每個VGPU實例享有固定且專用的Framebuffer,并通過分時機制在其碎片時間中占用整個GPU Engines。
GRID vGPU在虛擬環(huán)境中的部署方法
如下圖所示:通過VGPU管理器,將劃分后的獨立VGPU實例指配給虛擬機。
S7150x2與NVIDIA M60對比總結:
類別 型號 |
AMD S7150x2 |
NVIDIA M60 |
說明 |
劃分虛擬設備方式 |
硬件方式劃分多個虛擬設備 |
完全采用軟件方式 |
NVIDIA M60會出現(xiàn)測試階段性能高于生產,而S7150則在測試階段與生產階段性能一模一樣。 |
實現(xiàn)虛擬方式代碼數(shù)量 |
六七十行 |
一千多行 |
代碼越多安全性越低 |
License Cost |
$0 |
$600 |
AMD S7150x2性價比高 |
二、實際應用測試
(1)測試工具
本次采用solidworks性能基準測試。其主要通過模擬預裝的大型裝配體來實現(xiàn)軟件在安裝計算機上的表現(xiàn)。通過對大型模型打開、移動、旋轉、復制以及模型渲染、工程圖標注等基本功能進行模擬,來判斷計算機對于軟件安裝是否有壓力,也可以通過***的測試結果數(shù)據(jù)來判斷該計算機硬件配置基礎是否符合軟件要求。預裝模型為三千級數(shù)量裝配體,滿足企業(yè)大部分大型裝配要求,并具備拓展開孔、陣列、標準件的功能,通過測試的計算機在實際中既具備了理論上流暢運行軟件的能力。
(2)測試環(huán)境:
主機型號 |
DL380 G9 |
DL380 G9 |
虛擬化軟件 |
VMWAR Vsphere 6.2/Horizon 7.0 |
VMWAR Vsphere 6.2/Horizon 7.0 |
CPU |
E5-2643v4 |
E5-2643v4 |
內存 |
48GB |
48GB |
存儲 |
2*600G SAS(raid0) |
2*600G SAS(raid0) |
顯卡 |
AMD S7150x2 |
NVIDIA M60 |
虛擬機 |
CPU:E5-2643v4(1核心) 內存:8GB 顯卡:S7150x2微處理單元 測試項目:Solidworks 2016性能基準測試 |
CPU:E5-2643v4(1核心) 內存:8GB 顯卡:M60 VGPU 測試項目:Solidworks 2016性能基準測試 |
NVIDIA GRID M60可被VGPU管理器劃分為若干不同類型的VGPU實例,本次solidworks性能基準測試分別測試了M60-8Q、M60-4Q、M60-2Q及M60-1Q專為圖形設計而劃分的實例的性能表現(xiàn)。
Physical GPUS |
GRID Virtual GPU |
Intended Use Case |
Frame Buffer (Mbytes) |
Virtual Display Heads |
Maximum Resolution Per Display Head |
Maximum vGPUS per Board |
2 |
M60-8Q |
Designer |
8192 |
4 |
4096x2160 |
2 |
2 |
M60-4Q |
Designer |
4096 |
4 |
4096x2160 |
4 |
2 |
M60-2Q |
Designer |
2048 |
4 |
4096x2160 |
8 |
2 |
M60-1Q |
Designer |
1024 |
2 |
4096x2160 |
16 |
AMD Multiuser GPU S7150x2虛擬化顯卡可被切割成若干不同類型的微處理單元,本次solidworks性能基準測試分別測試了S7150VF(8GB Framebuffer)、S7150VF(4GB Framebuffer)、S7150VF(2GB Framebuffer)及S7150VF(1GB Framebuffer)實例下的圖形性能表現(xiàn)。
Physical GPUS |
微單元 |
Intended Use Case |
Frame Buffer (Mbytes) |
Virtual Display Heads |
Maximum Resolution Per Display Head |
Maximum vGPUS per Board |
2 |
S7150VF |
Designer |
8192 |
4 |
4096x2160 |
2 |
2 |
S7150VF |
Designer |
4096 |
4 |
4096x2160 |
4 |
2 |
S7150VF |
Designer |
2048 |
4 |
4096x2160 |
8 |
2 |
S7150VF |
Designer |
1024 |
2 |
4096x2160 |
16 |
⑶測試方法與結果對比
●測試結果衡量標準
通常情況下,測試數(shù)值越低越好。不過,只要滿足表格內的要求就具備了理論上流暢運行軟件的能力。
Solidworks基準測試結果參考表
測試項目 |
測試數(shù)值(秒) |
圖形 |
30-50 |
處理器 |
30-50 |
輸入/輸出 |
<80 |
總體 |
<100 |
渲染 |
沒固定值,但越小越好 |
RealView性能 |
沒固定值,但越小越好 |
模擬 |
80-100 |
●測試方法
由于受條件限制,本次NVIDIA M60和AMD S7150x2虛擬化顯卡測試均采用單Physical GPU核心參與solidworks性能基準測試,并做了如下分配:
***、將單核心8GB Framebuffer只分配給一個虛擬機
第二、將單核心8GB Framebuffer均等切割,分配給兩個虛擬機并同時做基準測試
第三、將單核心8GB Framebuffe均等切割為四份,分配給四個虛擬機并同時做基準測試
第四、將單核心8GB Framebuffe均等切割為八份,分配給四個虛擬機并同時做基準測試
●測試結果分析
測試結果圖表
類別 項目 |
8GB Framebuffer |
4GB Framebuffer |
2GB Framebuffer |
1GB Framebuffer |
||||
M60-8Q |
S7150VF |
M60-4Q |
S7150VF |
M60-2Q |
S7150VF |
M60-1Q |
S7150VF |
|
圖形 |
23.6 |
14.0 |
24.3 |
27.5 |
28.1 |
42.8 |
28.8 |
86.3 |
處理器 |
32.7 |
46.3 |
33.2 |
48.6 |
38.9 |
52.4 |
42.7 |
51.7 |
I/O |
19.2 |
27.9 |
19.4 |
28.9 |
20.6 |
32.4 |
28.5 |
38 |
總體 |
75.6 |
88.2 |
77.0 |
104.9 |
87.6 |
127.4 |
99.5 |
181.9 |
渲染 |
79.1 |
119.6 |
79.1 |
122.0 |
81.0 |
126.5 |
97.7 |
123.4 |
RealView |
36.4 |
11.9 |
37.8 |
24.2 |
39.6 |
41.5 |
42.0 |
86.9 |
模擬 |
82.1 |
117.4 |
84.4 |
130.5 |
90.6 |
144.8 |
108.1 |
153.0 |
由于本次測試只考察不同圖卡對Solidworks大型轉配體性能的影響,因此我們只對測試結果圖表中的圖形、渲染、RealView、模擬做詳細分析。
圖形:指對圖形的各種操作,如:模型打開、移動、旋轉、復制以及工程圖標注等
渲染:指圖形的真實效果,側重渲染的結果
RealView:圖形的真實效果,側重渲染過程
模擬:指對實體三維粒子空間效果檢查,如:干涉檢查、碰撞檢查、質量檢查等
結果判定:
⑴在圖形操作與RealView,S7150x2明顯比NVIDIA GRID M60 性能更高。而在渲染與模擬中NVIDIA GRID M60比S7150x2性能要好。
⑵NVIDIA GRID M60通過純軟件的方式劃分與切換虛擬設備,而AMD S7150x2則完全采用硬件方式。硬件劃分與切換虛擬設備效率高,而軟件方式效率低,因此NVIDIA M60會出現(xiàn)測試階段性能高于生產,而S7150則測試階段與生產階段性能一模一樣。
⑶AMD虛擬化解決方案無需使用者授權,而NVIDIA Grid VGPU需要單獨購買license,以SOLIDWORKS軟件為例,如果只做圖形與Realview操作,則AMD FirePro S7150x2服務器GPU比NVIDIA M60性價比更高。
⑷NVIDIA M60實現(xiàn)劃分與切換虛擬設備的代碼為一千多行,而AMD S7150x2代碼則六七十行,而代碼越多漏洞會越多,因此AMD S7150安全性明顯高于NVIDIA M60
以上是小編以達索SOLIDWORKS軟件為基礎。為各位拋磚引玉,站在中立的角度為大家呈現(xiàn)的當世最***兩款圖形虛擬化顯卡的對比測試,根據(jù)應用行業(yè)軟件不同,虛擬圖卡性能表現(xiàn)也會有所不同,后續(xù)我們也會繼續(xù)按照各行業(yè)應用為基礎,幫助大家更加客觀、全面的了解圖形虛擬化技術的發(fā)展現(xiàn)狀和***趨勢,希望能對廣大讀者有所幫助!