Intel AVX-512指令集復(fù)活!小核心終于也能跑了
AVX-512指令集,曾經(jīng)是Intel的殺手锏,但是隨著12代酷睿引入大小核混合架構(gòu),E核無法支持AVX-512,不得不整體屏蔽,反倒是AMD Zen4架構(gòu)加入了AVX-512,形勢(shì)瞬間逆轉(zhuǎn)。
現(xiàn)在,Intel公布了全新的“APX”(高級(jí)性能執(zhí)行),以及全新的指令集“AVX10”(高級(jí)指令擴(kuò)展10),第一次可以讓P大核、E小核都支持AVX-512!
基本層面上,大核可以完整執(zhí)行256/512位指令,小核則只能執(zhí)行融合256位指令(可以粗略理解為支持到AVX-256)。
更深層面上,AVX10可以說是AVX-512的超集,不但包含所有的AVX-512指令,對(duì)應(yīng)的功能標(biāo)識(shí)為AVX-512VL,還有256位的矢量寄存器、八個(gè)32位的掩碼寄存器、支持嵌入式舍入的新版256位指令。
其中,P大核可以可以使用512位矢量,E小核則限制在256位矢量長(zhǎng)度。
AVX10推出后,AVX-512也將徹底凍結(jié),不會(huì)再有變化,未來對(duì)于它的使用都通過AVX10來實(shí)現(xiàn)。
Intel AVX-512指令集復(fù)活!小核終于也能跑了
Intel強(qiáng)調(diào),現(xiàn)有應(yīng)用基于AVX-512、AVX10的性能是一樣的,至少在同等矢量長(zhǎng)度下沒有區(qū)別。
AVX2編譯的程序,重新編譯支持AVX10,會(huì)獲得性能提升,且無需再次對(duì)軟件調(diào)優(yōu)。
對(duì)矢量寄存器壓力敏感的AVX2程序,獲得的性能提升最明顯,這要感謝額外的16個(gè)矢量寄存器和新的指令。
高度線程化的矢量化應(yīng)用在E核上運(yùn)行時(shí),可獲得更高的總吞吐量。
Intel AVX-512指令集復(fù)活!小核終于也能跑了
Intel下一代消費(fèi)級(jí)酷睿處理器是Meteor Lake,依然不會(huì)有AVX-512,再下一代的Arrow Lake是否會(huì)首次加入AVX10,尚不確認(rèn)。
今年底,Intel將推出第五代可擴(kuò)展至強(qiáng)Emerald Rapids,只是現(xiàn)有第四代Sapphire Rapids的升級(jí)版,因此要到明年的第六代至強(qiáng)Granite Rapids,才會(huì)加入AVX10。
至于明年首款純小核設(shè)計(jì)的Sierra Forest,是否也會(huì)加入AVX10,暫時(shí)不清楚。
不過,AVX10的落地分為兩步,第一步是AVX10.1,用于六代至強(qiáng)Granite Rapids,僅支持512位矢量指令,而不支持融合256位矢量指令。
第二步是AVX10.2,應(yīng)該用于七代至強(qiáng)Clearwater Forest,加入融合256位矢量指令,并加入其他新功能,比如AI數(shù)據(jù)類型和轉(zhuǎn)換、數(shù)據(jù)轉(zhuǎn)移優(yōu)化等等。
Intel AVX-512指令集復(fù)活!小核終于也能跑了