騰訊云推出國內(nèi)首款FPGA云服務(wù)器,F(xiàn)PGA的普及化應(yīng)用時代到來
1月20日,騰訊云宣布,推出國內(nèi)首款高性能異構(gòu)計(jì)算基礎(chǔ)設(shè)施——FPGA云服務(wù)器,以云服務(wù)方式將大型公司才能長期支付使用的FPGA推廣到更多企業(yè)。通過FPGA云服務(wù)器,企業(yè)可以進(jìn)行FPGA硬件編程,可將性能提升至通用CPU服務(wù)器的30倍以上,而只需支付相當(dāng)于通用CPU約40%的費(fèi)用。此舉讓騰訊云成為國內(nèi)首家在云端開放FPGA計(jì)算服務(wù)的云服務(wù)商。
騰訊云官網(wǎng)現(xiàn)已開放FPGA使用申請
與已經(jīng)深入人心的高性能計(jì)算的代表GPU相比,F(xiàn)PGA具有硬件可編程、低功耗、低延時的特性,代表了高性能計(jì)算的未來發(fā)展趨勢。企業(yè)可以在火熱的深度學(xué)習(xí)領(lǐng)域,將FPGA用于深度學(xué)習(xí)的檢測階段,與主要用于訓(xùn)練階段的GPU互為補(bǔ)充。不僅如此,F(xiàn)PGA還可應(yīng)用于金融分析、圖像視頻處理、基因組學(xué)等需要高性能計(jì)算的領(lǐng)域,是這類對效率要求高的行業(yè)應(yīng)用的***選擇。
例如金融行業(yè)實(shí)時處理交易數(shù)據(jù),使用通用CPU處理延時大、成本高,而使用FPGA可以很好的解決上述問題,F(xiàn)PGA在搜索領(lǐng)域也因?yàn)榈脱訒r被互聯(lián)網(wǎng)搜索公司深度應(yīng)用。FPGA之所以比CPU甚至GPU能效高,本質(zhì)上是無指令、無需共享內(nèi)存的體系結(jié)構(gòu)帶來的福利。
騰訊云副總裁王慧星認(rèn)為,F(xiàn)PGA從底層開始變革人工智能的設(shè)計(jì)邏輯,加速企業(yè)業(yè)務(wù)在云端的處理能力,推動全行業(yè)在人工智能領(lǐng)域的創(chuàng)新步伐。他進(jìn)一步指出,F(xiàn)PGA已經(jīng)在QQ、微信等騰訊海量業(yè)務(wù)中長期使用,具備深厚的技術(shù)積累和復(fù)雜的場景實(shí)踐,希望這項(xiàng)的技術(shù)開放大大降低企業(yè)的使用門檻,讓大中小型企業(yè)都搭上人工智能這班列車。
FPGA的應(yīng)用場景:深度學(xué)習(xí)、圖片處理等領(lǐng)域測評優(yōu)勢明顯
FPGA誕生至今已有30余年,此前主要應(yīng)用于大型互聯(lián)網(wǎng)和科技公司,騰訊等互聯(lián)網(wǎng)大型企業(yè)均在數(shù)據(jù)中心批量部署了FPGA,為自身的深度學(xué)習(xí)等應(yīng)用提供硬件加速平臺。
與傳統(tǒng)的計(jì)算架構(gòu)相比,F(xiàn)PGA能夠更好地支撐深度學(xué)習(xí)等大規(guī)模并行計(jì)算需求。通過與通用CPU橫向測試對比表明,F(xiàn)PGA在深度學(xué)習(xí)、圖片壓縮和分類檢測等應(yīng)用場景中,在成本、性能上具有明顯優(yōu)勢。
FPGA在騰訊的深度學(xué)習(xí)領(lǐng)域被廣泛應(yīng)用,深度學(xué)習(xí)在圖片分類識別、語音識別、個性化內(nèi)容推薦算法等領(lǐng)域廣泛應(yīng)用。其中,微信、QQ為了增強(qiáng)社交通訊等業(yè)務(wù)的違規(guī)圖片檢測的處理能力,降低圖片檢測成本,通過FPGA對深度學(xué)習(xí)模型的CNN算法進(jìn)行加速后,F(xiàn)PGA處理性能是通用CPU的4倍,單位成本是通用CPU的1/3。
FPGA在圖片處理的優(yōu)勢也很明顯,用戶每天通過微信和QQ等社交平臺上傳了海量的圖片,如果采用WEBP圖片壓縮格式替代標(biāo)準(zhǔn)的JPEG格式,圖片大小可減少三分之一,同時給用戶帶來更好的圖片下載體驗(yàn)。而通過FPGA對大小為853x640的圖片轉(zhuǎn)碼進(jìn)行加速測試得出,F(xiàn)PGA的處理延時比通用CPU降低20倍,處理性能是通用CPU的6倍,而FPGA單位成本僅為通用CPU的1/3。
另一項(xiàng)測試表明,F(xiàn)PGA在DNN計(jì)算加速上有較明顯的優(yōu)勢。國內(nèi)外的搜索引擎公司普遍使用DNN算法用于廣告搜索,騰訊使用FPGA對DNN計(jì)算進(jìn)行加速測試得出,在使用50%的FPGA資源的情況下,將4000個樣本的DNN計(jì)算時延減小為1.2毫秒,吞吐率達(dá)到6000集合/s(4000個樣本為1個集合),不僅達(dá)到了系統(tǒng)對低延時的要求,而且極大地提高系統(tǒng)的吞吐能力:處理延時降低100倍,處理吞吐率提高5倍,而成本是通用CPU服務(wù)器的1/5。
FPGA的部署革命:從數(shù)月到數(shù)分鐘
過去,中小企業(yè)部署FPGA面臨諸多問題:FPGA硬件成本高、靈活性差、一次性采購?fù)度氪螅枰甙旱馁M(fèi)用和巨大精力進(jìn)行FPGA的定制和采購,并需配備相應(yīng)的硬件工程師和軟件工程師。
同時企業(yè)接下來還會面臨FPGA芯片更新?lián)Q代帶來的資源閑置流轉(zhuǎn)問題。雖然FPGA知識產(chǎn)權(quán)(FPGA IP,F(xiàn)PGA Intellectual Property)提供了業(yè)務(wù)所需的硬件加速功能,但研發(fā)周期長,研發(fā)投入和風(fēng)險高,令諸多企業(yè)望而卻步。
騰訊云帶來的革命性進(jìn)展是:將FPGA部署時間從數(shù)月縮短到數(shù)分鐘,企業(yè)可按需付費(fèi)使用FPGA,極大降低FPGA的使用成本,實(shí)現(xiàn)高性能FPGA硬件加速處理。同時騰訊云率先在國內(nèi)提供第三方FPGA知識產(chǎn)權(quán)市場,通過騰訊云服務(wù)市場,FPGA開發(fā)者和使用者可以更高效地交易。
長期以來,F(xiàn)PGA行業(yè)內(nèi)的提供者和使用者一直缺乏交易平臺和信用保證,導(dǎo)致交易環(huán)節(jié)冗長,很難達(dá)成交易。騰訊云服務(wù)市場搭建一個簡單可靠的FPGA知識產(chǎn)權(quán)交易市場。對于FPGA使用者而言,可以在騰訊云服務(wù)市場購買已開發(fā)并驗(yàn)證好的FPGA知識產(chǎn)權(quán)功能,可節(jié)約長達(dá)數(shù)月的FPGA研發(fā)周期,同時采用按需使用付費(fèi)的模式,能***化地幫助使用者節(jié)省硬件投入成本。
而FPGA開發(fā)者可以通過使用騰訊云FPGA的開發(fā)框架,顯著提升研發(fā)效率,更專注于核心功能開發(fā),將圖像處理功能、深度學(xué)習(xí)功能等已有的成熟FPGA知識產(chǎn)權(quán)通過簡單封裝適配,集成并投放到騰訊云服務(wù)市場,開放給FPGA使用者使用,分?jǐn)侳PGA知識產(chǎn)權(quán)的研發(fā)成本。
王慧星認(rèn)為,對于云計(jì)算行業(yè)而言,在云端提供FPGA是云計(jì)算IaaS層面革命性的推進(jìn),從底層開始加速云計(jì)算在各個場景中的應(yīng)用,云計(jì)算將從純粹的資源服務(wù)邁向人工智能云服務(wù)時代。
了解騰訊云FPGA 云服務(wù)器的更多信息https://www.qcloud.com/product/fpga