自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

構(gòu)建大模型,GPU是唯一生命線?未必 原創(chuàng)

發(fā)布于 2024-9-29 12:55
瀏覽
0收藏

嘉賓丨楊龔軼凡、蔡哲文

撰稿丨張潔

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

OpenAI 前首席科學(xué)家伊利亞曾公開表示:“GPU 就是新時代的比特幣?!?/p>

大模型一朝起飛,算力需求激增。作為AI淘金熱里“賣鏟子的人”,英偉達(dá)也因此成為了這輪技術(shù)變革里的最大贏家。隨著AI軍備競賽的升級,即使GPU價格一路看漲,市面上也常?!耙豢y求”。

一方面,GPU產(chǎn)能吃緊,實(shí)在無法跟上需求;另一方面,若是算力供給受制于人,那就等于將領(lǐng)先窗口期拱手讓人。在這一背景下,眾多廠商要么自研芯片,要么尋找替代方案,在GPU之外尋找新的算力解決之道。

那么,面對“一卡難求”的困境,到底如何破局?蘋果放棄GPU選擇TPU的背后有何玄機(jī)?國產(chǎn)芯片創(chuàng)業(yè)企業(yè)如何在巨頭壟斷的賽道上實(shí)現(xiàn)突圍?

本期“AIGC實(shí)戰(zhàn)派”邀請中昊芯英創(chuàng)始人&CEO楊龔軼凡,以及賽智伯樂投資合伙人蔡哲文就上述議題進(jìn)行了探討。

1.GPU不會是整個AI大模型的終點(diǎn)

放眼當(dāng)前的AI芯片市場,英偉達(dá)可以說一枝獨(dú)秀。而英偉達(dá)之所以能占據(jù)如今的生態(tài)位,在蔡哲文看來,可以說“三分天注定,七分靠打拼”。

他談到,英偉達(dá)的成功首先得益于它抓住了AI技術(shù)發(fā)展的大趨勢。正所謂“時勢造英雄”,隨著大模型崛起,生成式AI遍地開花,算力需求激增,恰好市場上又缺乏專門針對這一領(lǐng)域的芯片,英偉達(dá)的GPU成為了一個自然的、合適的選擇,從而占據(jù)了市場的先機(jī)。

更重要的是,英偉達(dá)在發(fā)展過程中堅持不懈地做出了種種努力。“在2006年左右,英偉達(dá)推出了CUDA系統(tǒng),最初其實(shí)面臨非常大的內(nèi)部阻力,畢竟它不是一個能賺錢的東西,但最終英偉達(dá)堅持了下來,堅持推廣這一系統(tǒng),讓大家接受并認(rèn)可以此為中心構(gòu)建的生態(tài),從而自然而然地去用它的芯片?!弊罱K英偉達(dá)成功地培養(yǎng)了用戶習(xí)慣,建立了品牌忠誠度,也為它的產(chǎn)品創(chuàng)造了持續(xù)的需求。

那么英偉達(dá)是否會繼續(xù)這樣一騎絕塵下去呢?未必。

“從產(chǎn)品和技術(shù)角度上來說,我們不認(rèn)為英偉達(dá)的GPU會是整個AI大模型的終點(diǎn)?!睏铨忀W凡給出了這樣的判斷。

這位在人生的關(guān)鍵節(jié)點(diǎn)選擇了回國創(chuàng)業(yè)的年輕創(chuàng)始人直接指出:“因?yàn)檫@個市場過于大了,所以會讓大家對市場上的很多現(xiàn)象產(chǎn)生‘誤解’。為什么如今英偉達(dá)GPU可以形成‘壟斷’?因?yàn)檫€沒有專業(yè)的芯片出來,專業(yè)芯片還在設(shè)計、量產(chǎn)的路上,但此時整個行業(yè)應(yīng)用爆發(fā)了?!?/p>

人類歷史上,半導(dǎo)體的整個發(fā)展歷程總是以十年為一個周期發(fā)生重大變革。每一次變革都是因?yàn)楝F(xiàn)有應(yīng)用的需求超過了現(xiàn)有工具的能力,當(dāng)這個臨界點(diǎn)到來,自然會催生新的技術(shù)和產(chǎn)品。

楊龔軼凡表示:當(dāng)前AI的爆發(fā)正處于這樣一個節(jié)點(diǎn),雖然初期各種應(yīng)用可以利用現(xiàn)有芯片滿足需求,但隨著應(yīng)用的深化和市場擴(kuò)展,專業(yè)AI芯片的出現(xiàn)將不可避免地改變市場格局。

“(未來)GPU可能只占據(jù)10%到20%的市場,剩下80%的市場都是由新型的AI芯片去占據(jù)。我們希望TPU會成為80%的市場份額里面的主力軍。這是我們的愿景,也是我們?yōu)槭裁丛趪鴥?nèi)成立中昊芯英的原因。”

2.挑戰(zhàn)英偉達(dá):尋找破局的可能

當(dāng)然也有人說,英偉達(dá)的顯卡未必是最適合的AI訓(xùn)練工具,但它的CUDA生態(tài),全球僅此一家。

由于CUDA的普及,大量的開發(fā)者和研究人員開始基于CUDA開發(fā)應(yīng)用,形成了龐大的用戶基礎(chǔ)和應(yīng)用生態(tài)。這種廣泛的應(yīng)用基礎(chǔ)為英偉達(dá)GPU創(chuàng)造了強(qiáng)大的生態(tài)壁壘,使得其他競爭對手難以企及。但是隨著技術(shù)的發(fā)展和市場需求的變化,CUDA的局限性也逐漸暴露,一些初創(chuàng)公司和團(tuán)隊正在嘗試擺脫CUDA,尋求開發(fā)更高效、更適應(yīng)特定需求的解決方案。

楊龔軼凡認(rèn)為,任何行業(yè)包括人工智能行業(yè)在內(nèi),一般都可以分成兩個階段:在研發(fā)階段,迭代速度是關(guān)鍵,因此開發(fā)者傾向于使用更熟悉的工具,這些工具的性價比是否是最優(yōu)的反而不是主要考量因素;在產(chǎn)品化和商業(yè)運(yùn)營階段,尤其是大規(guī)模部署往往導(dǎo)致成本的敏感性增加,此時性價比往往會成為關(guān)鍵要素。這也是為什么 CUDA 生態(tài)雖然成熟,但到了產(chǎn)業(yè)化階段,就會顯現(xiàn)出其在性價比方面的劣勢。

“因?yàn)樗型ㄓ玫臇|西,它都是以損失絕對性能作為代價的。”楊龔軼凡強(qiáng)調(diào),CUDA作為一個通用的軟件棧,雖然提供了廣泛的支持,但這種通用性是以犧牲一定性能為代價的。在特定應(yīng)用場景下,這種性能損耗可能導(dǎo)致性價比不高,進(jìn)而促使行業(yè)去尋求更定制化、更優(yōu)化的軟件棧。

另外值得關(guān)注的一點(diǎn)是,英偉達(dá)不僅是GPU制造商,也是大模型的重要構(gòu)建者。遺憾的是,盡管英偉達(dá)在大模型領(lǐng)域投入巨大,但其GPU架構(gòu)和CUDA軟件??赡軣o法滿足未來技術(shù)演進(jìn)對計算性能、成本效益和網(wǎng)絡(luò)互聯(lián)的更高要求。

楊龔軼凡指出,對于一個科技公司尤其是芯片公司而言,“它沒有任何可能性更改自己的核心構(gòu)架,完全去革自己的命”。因?yàn)檫@涉及到從零開始重新設(shè)計和開發(fā),這是一個漫長且復(fù)雜的過程,相應(yīng)的,建構(gòu)在此之上的軟件棧同樣也要從頭開始。換言之,無論是芯片還是軟件棧,后續(xù)迭代都是基于前一代產(chǎn)品的實(shí)驗(yàn)結(jié)果和真實(shí)場景。

某種程度上,“GPU最大的優(yōu)勢可能就是CUDA,但它的最大的劣勢也是CUDA”。

“因?yàn)镃UDA軟件棧限制了它。如果將來我決定不再使用GPU,轉(zhuǎn)而采用TPU、LPU等其他更適合執(zhí)行深度學(xué)習(xí)任務(wù)的硬件架構(gòu),這種慣性依賴就會變成它的限制條件。盡管GPU可以通過優(yōu)化提高性能,但它存在一個理論上的天花板。相比之下,專門為AI設(shè)計的芯片如TPU,其性能上限可能遠(yuǎn)高于GPU。隨著大模型的應(yīng)用落地規(guī)模化產(chǎn)業(yè)化,更有效的AI芯片如TPU可能就會迎來爆發(fā),因?yàn)樗鼈兡芴峁└叩男阅芎透偷某杀??!?/p>

蔡哲文對此也表達(dá)了認(rèn)同。在他看來,終有一天 GPU也會變得不那么合時宜,正如當(dāng)年GPU取代了CPU在圖形處理方面的功能一樣,現(xiàn)在出現(xiàn)了專門為AI設(shè)計的芯片,這些專用芯片在處理AI任務(wù)時比GPU更加高效。只要未來整個 AI 應(yīng)用的場景持續(xù)不斷迭代,整個市場變得足夠大,專用芯片逐漸取代GPU在AI領(lǐng)域的主導(dǎo)地位也是一個必然的趨勢。

此外,蔡哲文還提到一點(diǎn):GPU雖然在并行處理方面表現(xiàn)出色,但其能耗相對較高。隨著對能效比要求的提升,高能耗可能會成為GPU在AI領(lǐng)域的一個劣勢,尤其是在大規(guī)模計算任務(wù)中。不同地區(qū)在電力供應(yīng)和新能源技術(shù)方面的差異可能會影響AI硬件的選擇。如果GPU的高能耗成為限制因素,而專用AI芯片能提供更低的能耗和更高的性能,它們可能會成為更受歡迎的選擇。

3.TPU 啟示錄:谷歌往事 & 蘋果的選擇

隨著歷史的車輪滾滾向前,GPU 可能不再有今日的地位,但是當(dāng)下GPU 依舊主導(dǎo)了當(dāng)前這個 AI 時代的硬件供應(yīng),而就在這樣強(qiáng)勢的包圍下,谷歌 TPU 依舊穿越了重重考驗(yàn),在時間的歷練中成長為一個真正富有競爭力的對手。

2016年5月,谷歌在I/O大會上首次公布了TPU,并且稱這款芯片已經(jīng)在谷歌數(shù)據(jù)中心使用了一年之久,李世石大戰(zhàn) AlphaGo 時,谷歌直接將 TPU 稱之為 AlphaGo 擊敗李世石的“秘密武器”。那么在已有 GPU 的前提下,谷歌為何執(zhí)意要開發(fā)TPU呢?

楊龔軼凡提到,谷歌開發(fā)TPU的過程實(shí)際是一個“無心插柳柳成蔭”的故事。TPU的產(chǎn)生并非谷歌高層直接規(guī)劃的結(jié)果,而是內(nèi)部團(tuán)隊自發(fā)探索、逐步驗(yàn)證、進(jìn)而抓住時代契機(jī)實(shí)現(xiàn)商業(yè)化的過程。

最初,它誕生于一個內(nèi)部創(chuàng)業(yè)項(xiàng)目。因?yàn)楣雀鑳?nèi)部的創(chuàng)業(yè)環(huán)境允許團(tuán)隊進(jìn)行自主探索和創(chuàng)新,TPU正是這種機(jī)制下的產(chǎn)物。不過鑒于軟件項(xiàng)目的增長潛力、變現(xiàn)速度遠(yuǎn)大于硬件,所以 TPU 本身價值是不符合創(chuàng)始人愿景的,它需要驗(yàn)證其在特定領(lǐng)域的發(fā)展?jié)摿Α?/p>

于是, TPU 流轉(zhuǎn)于谷歌內(nèi)部不同部門之間,在不同的應(yīng)用場景下接受考驗(yàn)。幸運(yùn)的是,通過不斷地試用和迭代,TPU逐漸展現(xiàn)出其在模型訓(xùn)練和推理中的效率和成本優(yōu)勢。特別是在谷歌廣告部門使用后,推薦系統(tǒng)的精準(zhǔn)度有所提升,這直接關(guān)聯(lián)到營收增長,證明了TPU的商業(yè)價值。

這也為谷歌繼續(xù)投入資源進(jìn)行TPU的研發(fā)和迭代提供了動力。最終,隨著AI技術(shù)的發(fā)展和大模型的崛起,TPU成為了谷歌在AI領(lǐng)域的一個重要競爭力。

不過在很長一段時間內(nèi),TPU 還是在 GPU 的暗影下低調(diào)發(fā)展。直到最近,蘋果公布Apple Intelligence的細(xì)節(jié),才再次讓 TPU 走到臺前,接受聚光燈的洗禮。根據(jù)相關(guān)論文的披露,蘋果并沒有采用常見的英偉達(dá) H100 等 GPU,而是選了谷歌的 TPU,訓(xùn)練 Apple Intelligence 的基礎(chǔ)模型,一時引起了諸多討論。

對此,楊龔軼凡表示,起初TPU是谷歌自家使用的技術(shù),并未開放供外部使用,但其開源文化昭示著它終會將TPU集群作為云服務(wù)的一部分對外開放,以推動整個行業(yè)的發(fā)展。而蘋果是除了谷歌之外第一個使用 TPU 進(jìn)行大模型訓(xùn)練的大型玩家。

“從技術(shù)角度來說的話,它主要的商業(yè)驅(qū)動力還是性價比?!睏铨忀W凡介紹,TPU在相同制程、工藝和能耗條件下,由于其架構(gòu)的特殊性,在深度學(xué)習(xí)和大模型領(lǐng)域具有更高的芯片利用率,通??梢詫?shí)現(xiàn)3到5倍的性能提升,且在相同算力下成本可降低50%。而在商業(yè)化應(yīng)用中,成本節(jié)約變得至關(guān)重要,這時TPU的高性價比就成為了關(guān)鍵優(yōu)勢。因此隨著行業(yè)發(fā)展,像TPU這樣的專用芯片很可能會成為主流算力平臺。

蔡哲文則從行業(yè)角度對蘋果的這一選擇進(jìn)行了分析。在他看來蘋果轉(zhuǎn)向TPU主要有四個原因:

一是市場驅(qū)動,隨著人工智能的發(fā)展,市場需要性價比更高且易于復(fù)制的技術(shù);二是技術(shù)演進(jìn),最初人工智能缺乏專用芯片,GPU作為一種權(quán)宜之計被廣泛應(yīng)用。但現(xiàn)在隨著需求激增,需要更具成本效益的芯片。三是市場競爭規(guī)律,英偉達(dá)目前占據(jù)主導(dǎo)地位,但這也激發(fā)了競爭對手開發(fā)針對AI優(yōu)化的新芯片來挑戰(zhàn)其地位。尤其對于中小型新興企業(yè)而言,涉足TPU領(lǐng)域是個好機(jī)會;四是天然匹配度,TPU源自谷歌,在與谷歌的大模型框架的兼容性和商業(yè)匹配上具有天然優(yōu)勢??傮w來說,蘋果的選擇既是偶然也是必然。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者: 張潔

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦