AI芯片初創(chuàng)企業(yè)探索落地路徑 在發(fā)展中走向成熟
過去幾年,AI芯片初創(chuàng)企業(yè)如雨后春筍般涌現(xiàn)。如今,一批早期參與的企業(yè)已經(jīng)開始走向成熟,并通過增加模塊及芯片卡等方案擴展其產(chǎn)品范圍,同時憑借出色的芯片設(shè)計與全球分銷渠道建立起自己的市場競爭優(yōu)勢。
Hailo模塊
來自以色列的AI芯片初創(chuàng)企業(yè)Hailo已經(jīng)推出兩款基于其Hailo-8 AI加速器芯片的AI加速器模塊,主要面向邊緣應(yīng)用場景。這些模塊采用標準的M.2與mini-PCIe格式,適用于智慧城市、智能零售、智能家居以及工業(yè)4.0應(yīng)用場景中的無風(fēng)扇“邊緣設(shè)備”。這些邊緣設(shè)備主要用于執(zhí)行多視頻流分析等任務(wù),旨在以邊緣部署方式減少延遲并避免數(shù)據(jù)集中引發(fā)的隱私問題。
Hailo-8的“結(jié)構(gòu)定義數(shù)據(jù)流”架構(gòu)使其能夠以3 TOPS/瓦的性能獲得26 TOPS處理通性。其擁有車載級應(yīng)用許可,適用于ASIL-B應(yīng)用并獲得了AEC-Q100 Grade 2認證。
Hailo公司最近還公布了新數(shù)據(jù),表示其模塊在各類性能基準(包括針對谷歌Edge TPU進行了優(yōu)化的EfficientNet-EdgeTPU)測試中全面擊敗了英特爾Myriad-X與谷歌Edge TPU(Coral M.2)模塊??紤]到Hailo-8擁有高達26 TOPS的性能,而另外兩位對手的峰值性能僅為可憐的4 TOPS,這樣的結(jié)果絲毫不令人意外。但讓人驚訝的是,Hailo的內(nèi)部測試發(fā)現(xiàn),谷歌Edge TPU模塊的平均性能可達參數(shù)看似相近的英特爾Myriad-X模塊的2倍。
Hailo芯片與兩大市場領(lǐng)導(dǎo)者正面對壘,圖中柱狀所示為各種模塊的每秒處理幀數(shù)。
Hailo-8已經(jīng)在富士康的邊緣設(shè)備BOXiedge中使用,該邊緣設(shè)備主要用于在邊緣位置上處理視頻。這款無風(fēng)扇設(shè)備配備有Socionext提供的SynQuacer SCA11并行處理器外加Hailo-8,可用于加速深度學(xué)習(xí)推理過程。
這家位于特拉維夫的初創(chuàng)企業(yè)成立于2017年,目前擁有100多名員工。迄今為止,他們已經(jīng)從NEC及ABB等戰(zhàn)略投資機構(gòu)手中籌集到超過8800萬美元資金。
Groq卡
Groq目前正以服務(wù)器節(jié)點的形式出售其張量流處理器(TSP)芯片,該芯片將8張PCIe卡集成于一體,借此在數(shù)據(jù)中心內(nèi)快速執(zhí)行AI推理。Groq的TSP達到1 POPS(1000 TOPS),這使其成為業(yè)界功能最強大的TSP之一。根據(jù)Groq公布的數(shù)據(jù),其在ResNet-50 v2數(shù)據(jù)集上批次大小為1的測試中,可以達到18900 IPS(每秒推理次數(shù)),這無疑是目前速度最快的商用AI加速器芯片。
Groq的處理器具有極為精簡的硬件設(shè)計,且執(zhí)行規(guī)劃任務(wù)在軟件層面進行。Groq的編譯器負責(zé)協(xié)調(diào)所有數(shù)據(jù)流及時序,確保計算不會發(fā)生停頓,借此讓延遲及性能具有更好的可預(yù)測性。
該公司最近宣布已獲得新的資金注入,但拒絕透露具體資金籌措數(shù)額。此外,Groq還暗示正在擴大受眾市場,包括汽車行業(yè)。
Groq節(jié)點是一臺包含8塊TPU芯片的5U設(shè)備,可提供高達6 POPS的AI推理性能。
新的Groq節(jié)點整合有8塊Groq卡(8個TPU芯片),可提供6 POPS性能,尺寸為5U且功率為3.3千瓦。Groq方面解釋稱,這種性能與功耗的完美結(jié)合,將使該產(chǎn)品在優(yōu)化數(shù)據(jù)中心總體擁有成本(TCO)方面擁有顯著優(yōu)勢。
Graphcore分銷網(wǎng)絡(luò)
來自英國的AI加速器初創(chuàng)企業(yè)Graphcore宣布已經(jīng)正式建立起全球渠道合作伙伴網(wǎng)絡(luò)。
該公司是2018年率先推出芯片產(chǎn)品的廠商之一,并于今年夏季公布了第二代芯片。Colossus Mark 2的推出,承載著Graphcore與市場領(lǐng)先者英偉達正面競爭的野心,其可在數(shù)據(jù)中心內(nèi)帶來高達約250 TFLOPS的AI訓(xùn)練性能。Graphcore的系統(tǒng)級解決方案IPU設(shè)備是一款1U服務(wù)器刀片,其中包含4塊Colossus Mark 2芯片,可提供FP16精度的Petaflop級AI計算能力。其同時提供IPU-POD,可保證16臺IPU設(shè)備串連或并行運作。
Graphcore的IPU-POD內(nèi)裝有16臺面向HPC類應(yīng)用的IPU設(shè)備(共64塊IPU芯片)。
Graphcore方面表示,其IPU已經(jīng)在金融服務(wù)、醫(yī)療保健、消費級互聯(lián)網(wǎng)、學(xué)術(shù)研究等眾多領(lǐng)域得到實際應(yīng)用。
Graphcore的“精英合作伙伴計劃”意在建立一套IPU設(shè)備分銷商及轉(zhuǎn)售商網(wǎng)絡(luò)。合作方包括服務(wù)器制造商戴爾、浪潮、2CRSI以及科學(xué)超級計算機制造商Atos,歐洲分銷商Boston Limited,系統(tǒng)集成商BSI,中國分銷商Digital China,科學(xué)計算分銷商Lambda,總部位于香港的Macnica Cytech,面向美國聯(lián)邦政府客戶的Meadowgate Technologies,韓國分銷商Megazone,英國HPC技術(shù)分銷商OCF,HPC服務(wù)器制造商Penguin Computing,分銷商Tech Data Europe與US,外加關(guān)鍵任務(wù)/美國政府專業(yè)供應(yīng)商Wildflower International等。