助力初創(chuàng)企業(yè)破局:NVIDIA 2025年預(yù)測洞察AI未來關(guān)鍵趨勢
在市場環(huán)境瞬息萬變的背景下,企業(yè)之間的角逐不再單純局限于產(chǎn)品的品質(zhì)與功能,以及服務(wù)的質(zhì)量與效率,創(chuàng)新能力已然成為企業(yè)角逐市場的關(guān)鍵要素。
當我們把目光聚焦到2024年的科技圈時,如果要探尋這一年最引人矚目的焦點所在,那么生成式AI無疑會在眾多答案中脫穎而出?;厥讋倓傔^去的2024年,諸多行業(yè)紛紛探索如何利用該技術(shù)提升運營效率、創(chuàng)新能力和市場競爭力。
試水AI遭遇困境
據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的《全球人工智能和生成式人工智能支出指南》預(yù)測,?2025年全球企業(yè)在AI解決方案上的支出將達到3070億美元,并且到2028年將增長至6320億美元,復(fù)合年均增長率為29.0%。這一系列數(shù)據(jù)清晰地展現(xiàn)出,人工智能所蘊含的巨大市場需求與發(fā)展?jié)摿?,同時也預(yù)示著在未來幾年,該技術(shù)將在各個領(lǐng)域扮演更加重要的角色。
在人工智能飛速發(fā)展的當下,一群特殊的參與者值得關(guān)注——初創(chuàng)企業(yè),正面臨著諸多挑戰(zhàn)。由于技術(shù)儲備不足、資金相對匱乏,以及業(yè)務(wù)場景適配困難等因素,它們在采用AI技術(shù)方面進展緩慢,大多仍停留在測試階段,或是僅開展一些孤立的項目,也難以將其全面、深入地融入自身業(yè)務(wù)體系,從而導(dǎo)致AI技術(shù)的潛力未能在其業(yè)務(wù)中得到充分釋放。
一面是市場壓力如影隨形,另一面是采用AI面臨困境。初創(chuàng)企業(yè)亟需找到破局之法,借助AI技術(shù)在激烈的市場競爭中謀得發(fā)展契機。
把握AI未來趨勢
值得一提的是,F(xiàn)orrester?Research的2024年AI現(xiàn)狀調(diào)查,為我們帶來了新的思路與啟示。調(diào)研顯示,三分之二的受訪者認為其組織的AI項目投資回報率即使未達到50%,也可以認為是成功的。對于初創(chuàng)企業(yè)而言,無疑是一個積極的信號。
不僅如此,NVIDIA在各個行業(yè)領(lǐng)域的專家在前不久對未來一年進行了預(yù)測。他們指出,下一個即將到來的重要趨勢是代理式AI,這種自主或“推理型”AI需要使用多樣化的語言模型、精密復(fù)雜的檢索增強生成堆棧以及先進的數(shù)據(jù)架構(gòu)。這一預(yù)測或許能為正在探索AI破局之路的初創(chuàng)企業(yè)提供新的方向和可能。具體來看:
第一,多樣化的語言模型
NVIDIA?AI智能體高級研究科學(xué)家LINXI(JIM)FAN認為,推理是AI智能體的核心能力。以O(shè)penAI在2024年9月發(fā)布的新型大語言模型OpenAI?o1(又稱?“Strawberry”)為例,該模型經(jīng)過強化學(xué)習(xí)訓(xùn)練,可執(zhí)行復(fù)雜推理任務(wù)。在回復(fù)用戶前,會先生成一條長內(nèi)部思維鏈,糾正錯誤同時,將復(fù)雜步驟拆解為簡單步驟,最后再響應(yīng)用戶。
展望2025年,大量計算將開始向邊緣推理轉(zhuǎn)移,這意味著數(shù)據(jù)的處理和分析將更多地在靠近數(shù)據(jù)源的設(shè)備或邊緣節(jié)點進行。在這種情況下,應(yīng)用程序可能需要成千上萬個的token來處理單次查詢,由于小語言模型能夠在微秒內(nèi)連續(xù)進行多次查詢直至生成答案,因此變得更加節(jié)能,對機器人技術(shù)的重要性也日益凸顯。借助小型模型,能創(chuàng)造出協(xié)助人類完成日常工作的人形機器人和普通機器人,進而推動移動智能應(yīng)用的發(fā)展。
由此可見,大、小模型協(xié)同發(fā)展已成為人工智能領(lǐng)域的重要趨勢。在此背景下,初創(chuàng)企業(yè)可借助這一趨勢,精準錨定自身業(yè)務(wù)方向,在不同應(yīng)用場景中充分發(fā)揮大、小模型各自優(yōu)勢,實現(xiàn)差異化競爭。
第二,精密復(fù)雜的檢索增強生成堆棧
隨著企業(yè)對AI應(yīng)用的深度與廣度不斷拓展,如何進一步提升AI的效率、增強其分析洞察能力以及優(yōu)化數(shù)據(jù)利用,成為了亟待解決的關(guān)鍵問題。
在NVIDIA生成式AI軟件副總裁KARI?BRISKI看來,AI編排器、多步推理及AI查詢引擎這三項功能,有望精準解鎖當前AI發(fā)展困境。
1、AI編排器:企業(yè)將部署大量AI智能體,這些智能體是經(jīng)過訓(xùn)練的半自主模型,能夠在企業(yè)內(nèi)部網(wǎng)絡(luò)進行客戶服務(wù)、人力資源、數(shù)據(jù)安全等任務(wù)。為了更大限度提高這些任務(wù)的效率,預(yù)計數(shù)量不斷增加的AI編排器能夠?qū)⑷祟惒樵兞鲿车匾龑?dǎo)至多個智能體,綜合結(jié)果并加以解釋,從而為用戶提供建議并采取行動。
編排器能夠深入理解內(nèi)容、具備多語言能力,并能夠流暢處理包括PDF、視頻流等多種數(shù)據(jù)類型。BRISKI表示,在自學(xué)數(shù)據(jù)飛輪的驅(qū)動下,AI編排器將持續(xù)完善對特定業(yè)務(wù)的洞察。以制造業(yè)這一具有代表性的領(lǐng)域為例,實時數(shù)據(jù)的準確分析對于企業(yè)的決策制定和運營效率提升至關(guān)重要,AI編排器憑借其強大的數(shù)據(jù)處理能力,能夠?qū)ζ髽I(yè)生產(chǎn)過程中產(chǎn)生的海量實時數(shù)據(jù)進行快速、精準且全面地分析,根據(jù)生產(chǎn)計劃和供應(yīng)商談判提出建議來優(yōu)化供應(yīng)鏈。
2、多步推理:隨著加速計算和新模型架構(gòu)的發(fā)展,AI模型將應(yīng)對越來越復(fù)雜的問題,并以更高的精準度且更深入的分析作出回答。
借助“多步推理”的功能,大而復(fù)雜的問題可以被分解為較小的任務(wù),有時甚至還會進行多次模擬,以便從多個角度解決問題。并且,多步推理還會整合來自各種來源的知識,使AI能夠建立邏輯聯(lián)系,并合成不同領(lǐng)域的信息。
這可能會影響金融、醫(yī)療健康、科研和娛樂等多個領(lǐng)域。例如,具備多步推理能力的醫(yī)療健康模型可以根據(jù)患者的診斷、用藥情況和對其他治療的反應(yīng),提出一系列建議供醫(yī)生參考。
可以肯定的是,多步推理能力必然會在諸多領(lǐng)域掀起一場變革的浪潮。以醫(yī)療健康領(lǐng)域為例,具備多步推理能力的先進模型,能夠全面綜合考慮患者的詳細診斷結(jié)果、過往用藥情況,以及對其他相關(guān)治療手段的反應(yīng)等多方面信息。通過對這些復(fù)雜信息的深度分析與多步推理,提出一系列具有針對性的建議,為醫(yī)生的臨床決策提供重要參考。
3、AI查詢引擎:對于擁有PB級數(shù)據(jù)的企業(yè)和研究機構(gòu)來說,他們所面臨的挑戰(zhàn)是如何快速訪問這些數(shù)據(jù)并提供可操作的洞察。而AI查詢引擎的出現(xiàn),將為企業(yè)挖掘數(shù)據(jù)的方式帶來了革命性的變化?;贏I查詢引擎,企業(yè)可篩選結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),包括文本、圖像和視頻等,利用自然語言處理以及機器學(xué)習(xí)來理解用戶意圖,并提供更加相關(guān)且全面的結(jié)果。
這將推動更智能的決策流程,增強客戶體驗并提高各行業(yè)的生產(chǎn)力。依靠自身持續(xù)學(xué)習(xí)的能力,AI查詢引擎將創(chuàng)造出能進行自我改進的數(shù)據(jù)飛輪,幫助應(yīng)用程序變得更加有效。
總的來說,初創(chuàng)企業(yè)應(yīng)積極探索如何將這些先進的AI功能融入自身的業(yè)務(wù)流程中,以實現(xiàn)更高的運營效率和更優(yōu)質(zhì)的客戶服務(wù)。此外,利用好這些工具還可以幫助他們在競爭激烈的市場中找到自己的獨特定位,并加速其成長和發(fā)展。
第三,先進的數(shù)據(jù)架構(gòu)
算力和網(wǎng)絡(luò)作為AI發(fā)展的兩大關(guān)鍵支柱,缺一不可。它們相互依存、相互促進,共同為AI的蓬勃發(fā)展提供了堅實的基礎(chǔ)和有力的保障。
在算力方面,NVIDIA?DGX平臺副總裁CHARLIE?BOYLE預(yù)測,液冷AI數(shù)據(jù)中心正成為新趨勢。當下,大規(guī)模設(shè)計、部署與運營智能制造會帶來沉重財務(wù)負擔,因此,越來越多企業(yè)放棄自建AI基礎(chǔ)設(shè)施,轉(zhuǎn)而選擇在托管設(shè)施中部署,或按需租用容量。如此一來,企業(yè)無須自行安裝與運營,就能充分利用最新的基礎(chǔ)設(shè)施。
而在另一邊,AI工作負載持續(xù)增長,為實現(xiàn)性能與能效的最大化,企業(yè)紛紛將目光投向液冷技術(shù)。這一技術(shù)轉(zhuǎn)向,無疑會加速液冷技術(shù)在行業(yè)內(nèi)的廣泛應(yīng)用,使其更快成為AI數(shù)據(jù)中心的主流解決方案。
在網(wǎng)絡(luò)方面,NVIDIA網(wǎng)絡(luò)高級副總裁GILAD?SHAINER預(yù)測,數(shù)據(jù)中心架構(gòu)正朝著統(tǒng)一計算網(wǎng)架構(gòu)(computing?fabric)演進。在這一架構(gòu)下,統(tǒng)一計算網(wǎng)能夠讓成千上萬的加速器借助橫向和縱向兩種通信擴展方式,利用英里級長度的線纜,實現(xiàn)多個數(shù)據(jù)中心設(shè)施之間的高效通信。
這種統(tǒng)一計算網(wǎng)涵蓋面向縱向擴展通信的NVIDIA?NVLink網(wǎng),以及面向橫向擴展通信的智能交換機、SuperNIC和DPU。這些組件不僅有助于在加速器之間安全地傳輸數(shù)據(jù),還能在傳輸過程中執(zhí)行計算,從而最大限度地減少數(shù)據(jù)移動。尤其值得一提的是,跨越全網(wǎng)的橫向擴展通信對于大規(guī)模AI數(shù)據(jù)中心的部署意義重大,能將AI數(shù)據(jù)中心從部署到開機運行的時間,從原本的數(shù)月乃至數(shù)年大幅縮短至數(shù)周。
此外,隨著代理式AI工作負載的不斷增長,AI模型的運行模式也發(fā)生了變化,不再依賴單一的本地化模型,而是需要多個相關(guān)的AI模型之間進行通信并協(xié)同工作。在這種情況下,計算網(wǎng)將成為實現(xiàn)實時生成式AI的關(guān)鍵所在。
因此,初創(chuàng)企業(yè)若要在AI領(lǐng)域立足并取得成功,就必須緊跟算力和網(wǎng)絡(luò)的發(fā)展趨勢,重視液冷技術(shù)和統(tǒng)一計算網(wǎng)架構(gòu)的應(yīng)用,積極探索如何利用這些先進技術(shù)來優(yōu)化自身的AI模型訓(xùn)練、部署和運行,從而降本增效。
用好AI關(guān)鍵在人
眾所周知,人才是企業(yè)的第一資源,其重要性不言而喻。NVIDIA開發(fā)者技術(shù)總監(jiān)NADER?KHALIL作出預(yù)測,到了2025年,提示詞(Prompt)工程師和AI個性設(shè)計師將變得廣為人知。隨著企業(yè)積極使用AI提高生產(chǎn)力,預(yù)計在初創(chuàng)企業(yè)和企業(yè)中將出現(xiàn)融合新技能和現(xiàn)有技能的新型骨干員工。
具體而言,提示詞工程師專注于為聊天機器人與代理式AI開展提示設(shè)計的創(chuàng)建、測試及迭代工作,并在此基礎(chǔ)上,優(yōu)化AI訓(xùn)練流程、產(chǎn)出預(yù)期結(jié)果的精確文本字符串。另外,隨著AI智能體的不斷普及,企業(yè)和初創(chuàng)企業(yè)將越來越依賴AI個性設(shè)計師為智能體賦予獨特的個性。
與此同時,越來越多的初創(chuàng)企業(yè)在與投資者及商業(yè)伙伴進行交流時,會將?“每位員工的收入貢獻”(RPE)納入重要的洽談話題。
這背后的原因在于,AI對員工工作的輔助作用,促使初創(chuàng)企業(yè)管理者的關(guān)注點發(fā)生轉(zhuǎn)變,從以往單純追求?“不惜一切代價實現(xiàn)增長”,轉(zhuǎn)向更加注重新員工如何助力企業(yè)內(nèi)其他員工創(chuàng)造更多收入。在探討AI投資回報,以及在與大型企業(yè)和科技公司激烈爭奪人才以填補空缺職位的過程中,RPE成為初創(chuàng)公司的一個很好的切入點。
寫在最后:
盡管初創(chuàng)企業(yè)在應(yīng)用AI技術(shù)的道路上面臨諸多挑戰(zhàn),但只要能夠敏銳把握AI發(fā)展趨勢,充分利用多樣化語言模型、精密復(fù)雜檢索增強生成堆棧、先進數(shù)據(jù)架構(gòu)等技術(shù),重視人才培養(yǎng)與引進,就可以有效地利用AI帶來的機會,推動業(yè)務(wù)增長和創(chuàng)新,在競爭激烈的市場中謀得一席之地,為企業(yè)的長遠發(fā)展奠定堅實基礎(chǔ)。