2024年人工智能領(lǐng)域十大預(yù)測(cè)
2023年人工智能領(lǐng)域如果只能篩選一個(gè)關(guān)鍵詞的話,恐怕非“大模型”莫屬。大模型的發(fā)展在過(guò)去一年中,讓各行各業(yè)發(fā)生了天翻地覆的變化,有企業(yè)因大模型而新生,有企業(yè)因大模型而消亡。企業(yè)的變遷跟技術(shù)迭代息息相關(guān),而大模型就是新一代人工智能技術(shù)下的產(chǎn)物,大模型已經(jīng)深入各行各業(yè)對(duì)具體業(yè)務(wù)進(jìn)行了全方位的干預(yù),可以說(shuō)未來(lái)沒(méi)有一個(gè)行業(yè)能脫離AI大模型的影子。新年伊始之際,人工智能的的發(fā)展也將進(jìn)入下一階段,對(duì)社會(huì)生產(chǎn)的改變也將更加明顯,下面是根據(jù)過(guò)去一年人工智能的發(fā)展現(xiàn)狀對(duì)未來(lái)一年人工智能發(fā)展的預(yù)測(cè)。
一、以MoE為主的方法將成為大模型研究的新方向
MoE,即Mixture-Of-Experts,是一種深度學(xué)習(xí)技術(shù),它通過(guò)門(mén)控網(wǎng)絡(luò)實(shí)現(xiàn)任務(wù)/訓(xùn)練數(shù)據(jù)在不同專家模型間的分配,讓每個(gè)模型專注處理其最擅長(zhǎng)的任務(wù),進(jìn)而實(shí)現(xiàn)模型的稀疏性。這種方法可以在保證運(yùn)算速度的情況下,將模型的容量提升>1000倍。
MoE模型由兩個(gè)關(guān)鍵組成部分構(gòu)成:門(mén)控網(wǎng)絡(luò)和專家網(wǎng)絡(luò)。門(mén)控網(wǎng)絡(luò)負(fù)責(zé)根據(jù)輸入數(shù)據(jù)的特征,動(dòng)態(tài)地決定哪個(gè)專家模型應(yīng)該被激活以生成最佳預(yù)測(cè)。專家網(wǎng)絡(luò)是一組獨(dú)立的模型,每個(gè)模型都負(fù)責(zé)處理某個(gè)特定的子任務(wù)。通過(guò)門(mén)控網(wǎng)絡(luò),輸入數(shù)據(jù)將被分配給最適合的專家模型進(jìn)行處理,并根據(jù)不同模型的輸出進(jìn)行加權(quán)融合,得到最終的預(yù)測(cè)結(jié)果。
MoE模型已經(jīng)在一些實(shí)際應(yīng)用中取得了顯著的效果。例如,Mo?t & Chandon,這是一家法國(guó)的精品酒莊,也是奢侈品公司LVMH Mo?t Hennessy Louis Vuitton SE的一部分。他們使用MoE模型來(lái)提升其產(chǎn)品的質(zhì)量和準(zhǔn)確性。
在2023年12月份,Mistral AI發(fā)布了類GPT-4架構(gòu)的開(kāi)源版本Mistral 8x7B模型,這8個(gè)70億參數(shù)的小模型組合起來(lái),直接在多個(gè)跑分上超過(guò)了多達(dá)700億參數(shù)的Llama 2。英偉達(dá)高級(jí)研究科學(xué)家Jim Fan推測(cè),Mistral可能已經(jīng)在開(kāi)發(fā)34Bx8E,甚至100B+x8E的模型了。而它們的性能,或許已經(jīng)達(dá)到了GPT-3.5/3.7的水平。
二、Transformer架構(gòu)的統(tǒng)治地位將受到挑戰(zhàn)
在過(guò)去的幾年中自從Transformer出現(xiàn)之后,它的架構(gòu)幾乎就是為大模型而量身制作的,簡(jiǎn)單的前饋神經(jīng)網(wǎng)絡(luò)模型能夠提供給模型足夠大的參數(shù),再加上帶有殘差和注意力模塊編解碼結(jié)構(gòu)的堆疊,不僅是參數(shù)量更進(jìn)一步的增大,巍模型提供更強(qiáng)大表示能力,稠密的多頭自注意力機(jī)制還為模型提供了數(shù)據(jù)內(nèi)部不可或缺的關(guān)系表達(dá)能力。
但是隨著底層基礎(chǔ)模型技術(shù)的研究和發(fā)展,逐漸有一些新的模型架構(gòu)對(duì)傳統(tǒng)Transformer造成了一定的挑戰(zhàn),當(dāng)然這種挑戰(zhàn)不僅僅局限于學(xué)術(shù)層面,更多的可能還會(huì)在后續(xù)的工業(yè)界得到證實(shí)。
由于Transformer本身參數(shù)的增加隨著token的增加成2次方的增長(zhǎng),這導(dǎo)致計(jì)算成本也在迅速的增長(zhǎng),其次Transformer在參數(shù)達(dá)到一定量級(jí)后也出現(xiàn)了表達(dá)瓶頸的現(xiàn)象,由此出現(xiàn)了一些在未來(lái)可能會(huì)替代Transformer的研究方案。
lRetNet:RetNet(Retentive Network)被設(shè)計(jì)為大型語(yǔ)言模型的基礎(chǔ)架構(gòu),RetNet的主要優(yōu)勢(shì)在于它能夠同時(shí)實(shí)現(xiàn)訓(xùn)練并行化、低成本推理和良好的性能。RetNet提出了一種名為"retention"的機(jī)制來(lái)替代傳統(tǒng)的"attention"機(jī)制。這種機(jī)制支持三種計(jì)算范式,即并行、循環(huán)和分塊循環(huán)。具體來(lái)說(shuō),其并行表示允許訓(xùn)練并行化,循環(huán)表示使得推理成本低,而分塊循環(huán)表示有助于有效地進(jìn)行長(zhǎng)序列建模。
lRWKV:RWKV(Receptance Weighted Key Value)將 Transformer 的高效可并行訓(xùn)練與 RNN 的高效推理相結(jié)合。RWKV的設(shè)計(jì)精良,能夠緩解 Transformer 所帶來(lái)的內(nèi)存瓶頸和二次方擴(kuò)展問(wèn)題,實(shí)現(xiàn)更有效的線性擴(kuò)展,同時(shí)保留了使 Transformer 在這個(gè)領(lǐng)域占主導(dǎo)的一些性質(zhì);
lMamba:Mamba 基于選擇性狀態(tài)空間模型(SSM),Mamba 將這些選擇性 SSM 集成到一個(gè)簡(jiǎn)化的端到端神經(jīng)網(wǎng)絡(luò)架構(gòu)中,無(wú)需注意力機(jī)制,甚至不需要 MLP 塊。Mamba 通過(guò)讓 SSM 參數(shù)作為輸入的函數(shù),解決了其離散模態(tài)的弱點(diǎn),允許模型根據(jù)當(dāng)前標(biāo)記選擇性地沿序列長(zhǎng)度維度傳播或忘記信息。Mamba 具有快速的推理(吞吐量比 Transformer 高 5 倍)和序列長(zhǎng)度線性縮放。在語(yǔ)言建模任務(wù)中,Mamba-3B 模型在預(yù)訓(xùn)練和下游評(píng)估中均優(yōu)于相同規(guī)模的 Transformer,并且與其兩倍大小的Transformer 模型相媲美。
lUniRepLKNet:UniRepLKNet是由騰訊和香港中文大學(xué)聯(lián)合發(fā)布的一種基于大核卷積神經(jīng)網(wǎng)絡(luò)(CNN)的大模型基礎(chǔ)架構(gòu)。UniRepLKNet采用大核CNN,可以處理多種模態(tài)的數(shù)據(jù),如圖像、音頻、時(shí)序預(yù)測(cè)等。UniRepLKNet提出了四條用于大核CNN架構(gòu)設(shè)計(jì)的指導(dǎo)原則,并設(shè)計(jì)了一種硬件感知的并行算法,實(shí)現(xiàn)了實(shí)際測(cè)速優(yōu)勢(shì),在多種模態(tài)上均實(shí)現(xiàn)了最先進(jìn)的性能。UniRepLKNet在時(shí)序預(yù)測(cè)的超大數(shù)據(jù)上用這一為圖像設(shè)計(jì)的backbone達(dá)到了最先進(jìn)的性能。這些特性使得UniRepLKNet成為了一種強(qiáng)大的模型架構(gòu),它有效地利用了大核CNN的優(yōu)點(diǎn);
lStripedHyena:StripedHyena是由Together AI發(fā)布的一種新型人工智能模型,它將注意力和門(mén)控卷積結(jié)合成了所謂的Hyena運(yùn)算符。StripedHyena采用了一種獨(dú)特的混合結(jié)構(gòu),將門(mén)控卷積和注意力結(jié)合成了Hyena運(yùn)算符。這種結(jié)構(gòu)使得StripedHyena在訓(xùn)練、微調(diào)和生成長(zhǎng)序列過(guò)程中具有更高的處理效率,更快的速度和更高的內(nèi)存效率。在短序列任務(wù)中,包括OpenLLM排行榜任務(wù),StripedHyena在性能上超越了Llama-27B、Yi7B以及最強(qiáng)大的Transformer替代品,如RWKV14B。StripedHyena能夠處理長(zhǎng)序列,這使得它在處理長(zhǎng)提示的各種基準(zhǔn)測(cè)試中表現(xiàn)出色。StripedHyena的設(shè)計(jì)優(yōu)化了計(jì)算效率,使得它在訓(xùn)練期間能夠進(jìn)行體系結(jié)構(gòu)修改。
lPanGu-Π:PanguΠ是一種新型的Transformer模型,它針對(duì)Transformer的特征坍塌問(wèn)題和非線性關(guān)系進(jìn)行了優(yōu)化。在 Transformer 更深層中,特征的秩顯著降低,導(dǎo)致所有 token 之間的相似性增加,這極大地降低了 LLM 的生成質(zhì)量和多樣性。非線性對(duì) Transformer 模型的能力有重大影響。增強(qiáng)非線性可以有效地緩解特征坍塌的問(wèn)題,并提高 Transformer 模型的表達(dá)能力。PanGuΠ在前饋網(wǎng)絡(luò)(FFN)中采用了級(jí)數(shù)激活函數(shù),并且在多頭自注意力(MSA)中集成了增強(qiáng)型快捷連接,這有效地為T(mén)ransformer 架構(gòu)引入了更多的非線性。并增廣 Shortcut(Augmented Shortcut)來(lái)緩解特征坍塌的問(wèn)題,提高大語(yǔ)言模型的表達(dá)能力。
以上這些基礎(chǔ)模型框架或者相關(guān)微調(diào)技術(shù)都將會(huì)對(duì)Transformer的統(tǒng)治地位造成一定的影響,能否完全替代Transformer在大模型一統(tǒng)天下的局面,不僅要看學(xué)術(shù)界的成果,更要看工業(yè)界的行動(dòng)。
三、大模型免微調(diào)方法得到一定的發(fā)展
大模型表現(xiàn)能力如此顯眼,其中少不了對(duì)模型的微調(diào),而近期的一些研究表明通過(guò)對(duì)alignment tuning的深入研究揭示了其“表面性質(zhì)”,即通過(guò)監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)調(diào)整LLMs的方式可能僅僅影響了模型的語(yǔ)言風(fēng)格,而對(duì)模型解碼性能的影響相對(duì)較小。具體來(lái)說(shuō),通過(guò)分析基礎(chǔ)LLMs和alignment-tuned版本在token分布上的差異,作者發(fā)現(xiàn)在大多數(shù)情況下,它們?cè)诮獯a上表現(xiàn)幾乎相同,主要的變化發(fā)生在文體方面,如話語(yǔ)標(biāo)記和安全聲明。
研究者提出了一種名為URIAL(Untuned LLMs with Restyled In-context ALignment)的簡(jiǎn)單、無(wú)需調(diào)優(yōu)的對(duì)齊方法。URIAL方法利用上下文學(xué)習(xí)(ICL),通過(guò)采用少量精心策劃的風(fēng)格示例和精心設(shè)計(jì)的系統(tǒng)提示,實(shí)現(xiàn)了對(duì)基礎(chǔ)LLMs的有效對(duì)齊,而無(wú)需調(diào)整其權(quán)重。在這個(gè)方法中,通過(guò)巧妙構(gòu)建上下文示例,首先肯定用戶查詢并引入背景信息,然后詳細(xì)列舉項(xiàng)目或步驟,最終以引人入勝的摘要結(jié)束,其中包括安全相關(guān)的免責(zé)聲明。
研究發(fā)現(xiàn)這樣一個(gè)直接的基準(zhǔn)方法能夠顯著減小基礎(chǔ)LLMs和經(jīng)過(guò)對(duì)齊的LLMs之間的性能差距。這表明,通過(guò)精心設(shè)計(jì)的上下文示例,可以在不進(jìn)行調(diào)優(yōu)的情況下實(shí)現(xiàn)對(duì)基礎(chǔ)LLMs的有效對(duì)齊,為對(duì)齊研究提供了新的思路。
事實(shí)證明,只要基礎(chǔ)模型設(shè)計(jì)的夠好,加以優(yōu)質(zhì)的數(shù)據(jù)和足夠的訓(xùn)練,完全可以省去微調(diào)的步驟,這不但提高了大模型訓(xùn)練的效率,也大大減低的大模型微調(diào)的成本。
四、多模態(tài)大模型將持續(xù)滲透各行各業(yè)
隨著最近一年來(lái)以ChatGPT為主的大模型逐漸走向應(yīng)用市場(chǎng),從最初的語(yǔ)言模型應(yīng)用,已經(jīng)發(fā)展到了視覺(jué)模型應(yīng)用、語(yǔ)音模型應(yīng)用等多個(gè)應(yīng)用領(lǐng)域,由此也誕生了多模態(tài)大模型。多模態(tài)大模型,即能夠處理多種類型輸入(如文本、圖像、語(yǔ)音等)的人工智能模型。多模態(tài)大模型正在逐漸改變各行各業(yè)。
多模態(tài)大模型已經(jīng)在自動(dòng)駕駛領(lǐng)域得到應(yīng)用,例如,可以利用多種不同的傳感器,例如攝像頭、激光雷達(dá)、超聲波等,來(lái)構(gòu)建一個(gè)更加全面和準(zhǔn)確的自動(dòng)駕駛系統(tǒng)。中國(guó)科學(xué)院自動(dòng)化研究所的“全媒體多模態(tài)大模型”結(jié)合新華社全媒體的海量數(shù)據(jù)積累和媒體融合業(yè)務(wù)場(chǎng)景,推動(dòng)了人工智能在視頻配音、語(yǔ)音播報(bào)、標(biāo)題摘要、海報(bào)創(chuàng)作等多元媒體業(yè)務(wù)場(chǎng)景的應(yīng)用。
微軟的研究員撰寫(xiě)的綜述預(yù)測(cè),多模態(tài)基礎(chǔ)模型將從專用走向通用,未來(lái)將有更多的研究關(guān)注如何利用大模型處理多模態(tài)任務(wù)。中國(guó)科學(xué)院預(yù)測(cè),“多模態(tài)大模型+小模型”的模式可能成為主流,多模態(tài)人工智能產(chǎn)業(yè)正在走向場(chǎng)景應(yīng)用的新階段。多模態(tài)大模型將在未來(lái)的人工智能發(fā)展中起到重要作用。
這些證據(jù)和預(yù)測(cè)表明,多模態(tài)大模型將持續(xù)滲透并改變各行各業(yè),為我們的生活帶來(lái)更多可能性。在新的一年,多模型模型的發(fā)展應(yīng)用將持續(xù)深入各行各業(yè),對(duì)具體的業(yè)務(wù)產(chǎn)生不可忽視的影響。
五、具身人工智能開(kāi)始迅速發(fā)展
具身人工智能,也被稱為Embodied AI,是指具有物理實(shí)體并能與真實(shí)世界進(jìn)行多模態(tài)交互的智能體。具身智能(Embodied Intelligence)是一種智能系統(tǒng)的設(shè)計(jì)理念,其目標(biāo)是通過(guò)將感知、決策和行動(dòng)融合在一起,使機(jī)器能夠像人類一樣具備身體和運(yùn)動(dòng)能力。具身智能的核心理念是利用機(jī)器的身體結(jié)構(gòu)和動(dòng)作能力來(lái)增強(qiáng)其智能表現(xiàn)和解決復(fù)雜任務(wù)的能力。傳統(tǒng)的人工智能系統(tǒng)主要關(guān)注于數(shù)據(jù)處理和算法的優(yōu)化,而具身智能則更加注重機(jī)器與環(huán)境的互動(dòng)和交流。
1986年,著名的人工智能專家布魯克斯 (Rodney Brooks)提出了具身智能的理論,他認(rèn)為智能是具身化和情境化的,傳統(tǒng)以表征為核心的經(jīng)典AI進(jìn)路是錯(cuò)誤的。
李飛飛教授提出了一套新的計(jì)算框架——DERL(deep evolution reinforcement learning)深度進(jìn)化強(qiáng)化學(xué)習(xí),這篇文章提到了生物進(jìn)化論與智能體進(jìn)化的關(guān)系,并借鑒了進(jìn)化論的理論應(yīng)用于假設(shè)的智能體(unimal宇宙動(dòng)物)的進(jìn)化學(xué)習(xí)中。
目前,具身智能已經(jīng)成為國(guó)際學(xué)術(shù)前沿研究方向,包括美國(guó)國(guó)家科學(xué)基金會(huì)在內(nèi)的機(jī)構(gòu)都在推動(dòng)具身智能的發(fā)展。谷歌公司的Everyday Robot已經(jīng)能夠?qū)C(jī)器人和對(duì)話模型結(jié)合到一起,形成一個(gè)更大的閉環(huán)。UC伯克利的LM Nav用三個(gè)大模型(視覺(jué)導(dǎo)航模型ViNG、大型語(yǔ)言模型GPT-3、視覺(jué)語(yǔ)言模型CLIP)教會(huì)了機(jī)器人在不看地圖的情況下按照語(yǔ)言指令到達(dá)目的地。
基于形態(tài)的具身智能研究,例如機(jī)器人關(guān)節(jié)控制,使機(jī)器人完全依靠自身形態(tài)即可實(shí)現(xiàn)對(duì)整體行為的控制。具身人工智能正在快速發(fā)展,并在人工智能領(lǐng)域中占據(jù)越來(lái)越重要的地位。
六、通用人工智將進(jìn)入爆發(fā)的前夜奇點(diǎn)
通用人工智能(Artificial General Intelligence,AGI)是指一種具備與人類相似或超越人類智能水平的人工智能形式。與狹窄人工智能(Narrow AI)不同,狹窄人工智能是專注于執(zhí)行特定任務(wù)或解決特定問(wèn)題的人工智能形式。通用人工智能則是更全面、靈活,能夠處理多個(gè)不同領(lǐng)域的任務(wù),具有類似人類的學(xué)習(xí)能力和智能適應(yīng)性。隨著生成式人工智能的發(fā)展,未來(lái)的人工智能技術(shù)發(fā)展已經(jīng)到了通用人工智能前夜的爆發(fā)奇點(diǎn)。
麥肯錫的最新年度全球調(diào)研結(jié)果證實(shí),生成式人工智能(簡(jiǎn)稱GenAI)工具已出現(xiàn)爆炸式增長(zhǎng)。許多此類工具至今推出尚不滿一年,但已有1/3的受訪者表示,其所在組織會(huì)在至少一項(xiàng)業(yè)務(wù)職能中經(jīng)常使用GenAI。
OpenAI發(fā)布了「AGI 路線圖」,詳細(xì)解釋了這家前沿研究機(jī)構(gòu)對(duì)通用人工智能研究的態(tài)度。OpenAI不斷構(gòu)建出更為強(qiáng)大的AI系統(tǒng),希望快速部署AGI,以積累在相應(yīng)的應(yīng)用經(jīng)驗(yàn);OpenAI正在努力創(chuàng)建更加一致和可控的模型;OpenAI希望全球范圍內(nèi)解決三個(gè)關(guān)鍵問(wèn)題:人工智能系統(tǒng)的治理問(wèn)題,AI系統(tǒng)產(chǎn)生的收益的分配問(wèn)題,以及訪問(wèn)權(quán)限的共享問(wèn)題。OpenAI預(yù)計(jì)給世界帶來(lái)巨大變化的AGI在最后階段一定會(huì)出現(xiàn)。
國(guó)內(nèi)科大訊飛副總裁、研究院院長(zhǎng)劉聰提出,未來(lái)通用人工智能發(fā)展將呈現(xiàn)三個(gè)趨勢(shì):一是向多模態(tài)、多語(yǔ)言的方向發(fā)展;二是更加可信和可解釋,解決幻覺(jué)問(wèn)題和安全問(wèn)題;三是必須站在軟硬件全自主創(chuàng)新的基礎(chǔ)上發(fā)展大模型技術(shù)和產(chǎn)業(yè)。
麥肯錫預(yù)測(cè),通用人工智能的潛在經(jīng)濟(jì)價(jià)值在17萬(wàn)億至26萬(wàn)億美元之間,并且追求這種價(jià)值的公司比例也在持續(xù)增加。
這些證據(jù)和預(yù)測(cè)表明,未來(lái)一年可能是通用人工智能前夜的爆發(fā)奇點(diǎn),我們有理由期待通用人工智能的快速發(fā)展和廣泛應(yīng)用。
七、垂直領(lǐng)域大模型的發(fā)展將進(jìn)入平穩(wěn)期
垂直領(lǐng)域大模型是針對(duì)特定領(lǐng)域或任務(wù)進(jìn)行深度學(xué)習(xí)訓(xùn)練的超大規(guī)模模型。相較于通用大模型,垂直大模型具有更強(qiáng)的領(lǐng)域?qū)I(yè)性和任務(wù)針對(duì)性,能夠更好地解決特定領(lǐng)域的問(wèn)題和提供更加精準(zhǔn)的服務(wù)。
隨著各行業(yè)中垂直類大模型應(yīng)用的持續(xù)爆發(fā),大模型對(duì)各行業(yè)的影響已經(jīng)進(jìn)入了頂峰時(shí)刻,如醫(yī)療、教育、交通、法律、媒體等很多能夠被大模型最容易改變的行業(yè)都已經(jīng)與大模型深度結(jié)合,相關(guān)的企業(yè)也都在緊鑼密鼓的部署大模型的產(chǎn)業(yè)鏈。從時(shí)間節(jié)點(diǎn)上來(lái)說(shuō),在未來(lái)一年中,垂直類大模型的應(yīng)用已經(jīng)過(guò)了爆發(fā)期,將會(huì)進(jìn)入平穩(wěn)的發(fā)展期,持續(xù)釋放行業(yè)需求和紅利。
垂直大模型正加快覆蓋各行各業(yè)。例如,攜程集團(tuán)發(fā)布了國(guó)內(nèi)首個(gè)旅游行業(yè)垂直大模型“攜程問(wèn)道”;華為發(fā)布了金融、電力、藥物分子三個(gè)垂直領(lǐng)域大模型;京東表示發(fā)布的千億級(jí)大模型,進(jìn)一步聚焦行業(yè)應(yīng)用。
未來(lái)垂直領(lǐng)域大模型的研發(fā)將會(huì)持續(xù)投入加大,國(guó)內(nèi)多家企業(yè)加大“垂直大模型”研發(fā)投入,并在旅游、商業(yè)、金融、醫(yī)療、辦公協(xié)同等領(lǐng)域加快應(yīng)用。
業(yè)內(nèi)人士認(rèn)為,目前,國(guó)內(nèi)出現(xiàn)了做通用大模型和做垂直大模型兩條路徑。算力、大規(guī)模數(shù)據(jù)、高成本人才成為大部分企業(yè)入局通用大模型的“攔路虎”。深度定制、廣闊的場(chǎng)景應(yīng)用,則催生了國(guó)內(nèi)垂直領(lǐng)域大模型的開(kāi)發(fā)。
騰訊發(fā)布的大模型時(shí)代AI趨勢(shì)報(bào)告顯示,未來(lái)的數(shù)字化商業(yè)將分為大模型基礎(chǔ)設(shè)施型企業(yè)、垂直行業(yè)領(lǐng)域的小模型應(yīng)用企業(yè),以及更加貼合個(gè)人用戶的模型應(yīng)用和服務(wù)。這一生態(tài)的建立和發(fā)展,將更廣泛地賦能各行業(yè)應(yīng)用,加快社會(huì)各領(lǐng)域數(shù)字化轉(zhuǎn)型、智能化發(fā)展,帶來(lái)全社會(huì)的生產(chǎn)效率提升。垂直領(lǐng)域大模型的發(fā)展已經(jīng)進(jìn)入平穩(wěn)期,其應(yīng)用和影響將會(huì)越來(lái)越廣泛。
八、國(guó)內(nèi)人工智能技術(shù)突破瓶頸開(kāi)始快速發(fā)展
人工智能的發(fā)展源于上個(gè)世紀(jì)50年代在美國(guó)達(dá)特茅斯會(huì)議上的共識(shí),距今已經(jīng)有70多年了,也就是說(shuō)人工智能其實(shí)不是一門(mén)新的學(xué)科和技術(shù),這幾十年來(lái),全球研究人工智能的技術(shù)人員主要都集中在美國(guó)、加拿大、英國(guó)等國(guó)家,相關(guān)的技術(shù)成果也都出自于上述國(guó)家的技術(shù)團(tuán)隊(duì)。而我國(guó)在過(guò)去幾十年間,真正研究人工智能技術(shù)的團(tuán)體和個(gè)人則要少得多,這主要是因?yàn)槿斯ぶ悄茉谶^(guò)去幾十年間都是以基礎(chǔ)研究為主,很少出現(xiàn)應(yīng)用型的人工智能產(chǎn)品。
國(guó)內(nèi)真正大規(guī)模開(kāi)始研究人工智能技術(shù)的時(shí)間節(jié)點(diǎn)在2016年前后,2016年3月,DeepMind團(tuán)隊(duì)研發(fā)的AlphaGO與圍棋世界冠軍、職業(yè)九段棋手李世石進(jìn)行圍棋人機(jī)大戰(zhàn),以4比1的總比分獲勝。此后人工智能技術(shù)的熱度不斷地被刷新。
但是這些熱點(diǎn)事件都是在國(guó)外,國(guó)內(nèi)幾乎沒(méi)有報(bào)出過(guò)有關(guān)人工智能技術(shù)發(fā)展的轟動(dòng)性事件,更多的是追隨國(guó)外技術(shù)的腳步發(fā)展,這也很正常,主要是國(guó)內(nèi)無(wú)論從技術(shù)人員儲(chǔ)備,還是從技術(shù)沉淀上來(lái)說(shuō)都比不上國(guó)外。
不過(guò)隨著近幾年的追趕,國(guó)內(nèi)技術(shù)團(tuán)隊(duì)在一些領(lǐng)域也逐漸綻放光芒,技術(shù)成果也可圈可點(diǎn),從技術(shù)上來(lái)說(shuō),有了一定的突圍,產(chǎn)業(yè)規(guī)模也連年攀升。最新公布的統(tǒng)計(jì)數(shù)據(jù)顯示,中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模達(dá)到5000億元,企業(yè)數(shù)量超過(guò)4400家,已建設(shè)近萬(wàn)個(gè)數(shù)字化車間和智能工廠。
另外,近幾年國(guó)內(nèi)人工智能的論文數(shù)量激增,泥沙俱下,導(dǎo)致部分論文質(zhì)量不高,但這并不能說(shuō)明人工智能發(fā)展停滯不前,而是表明目前有更多的研究人員投入到了這個(gè)火熱的研究方向。在2023年,人工智能技術(shù)領(lǐng)域出現(xiàn)了一些重要的突破,這些突破已經(jīng)開(kāi)始或有潛力改變多個(gè)行業(yè)和領(lǐng)域。
在未來(lái)一年內(nèi),國(guó)內(nèi)的人工智能技術(shù)將突破瓶頸開(kāi)始快速發(fā)展。這將為中國(guó)的科技創(chuàng)新和經(jīng)濟(jì)發(fā)展提供強(qiáng)大的動(dòng)力。
九、英偉達(dá)在人工智能芯片領(lǐng)域依然遙遙領(lǐng)先
2023年,我國(guó)智能芯片、開(kāi)發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn):華為、寒武紀(jì)、景嘉微、壁仞科技、摩爾線程、燧原科技等芯片公司推出了不同設(shè)計(jì)架構(gòu)、不同應(yīng)用場(chǎng)景的AI推理和訓(xùn)練任務(wù)的芯片加速卡。
而美國(guó)在人工智能芯片、算法、機(jī)器學(xué)習(xí)等核心技術(shù)的原創(chuàng)方面,至今仍大幅領(lǐng)先。英偉達(dá)的GPU和谷歌的TPU在芯片領(lǐng)域具有行業(yè)領(lǐng)先地位。美國(guó)的AI產(chǎn)業(yè)整體也領(lǐng)先與世界各國(guó),技術(shù)布局更廣、更精。國(guó)內(nèi)除了百度的飛槳外,其他主流深度學(xué)習(xí)開(kāi)源框架均來(lái)自于美國(guó)。
英偉達(dá)是全球GPU龍頭企業(yè),其產(chǎn)品線涵蓋了A100、H100、L40、L40S、GH200等產(chǎn)品。英偉達(dá)的數(shù)據(jù)中心解決方案整體提供了NVIDIA加速計(jì)算統(tǒng)一平臺(tái),從AI、數(shù)據(jù)分析,到高性能計(jì)算 (HPC),再到渲染,數(shù)據(jù)中心都是攻克某些重要挑戰(zhàn)的關(guān)鍵。
根據(jù)Informa PLC旗下的英國(guó)研究咨詢公司Omdia的調(diào)查顯示,現(xiàn)階段英偉達(dá)占大型數(shù)據(jù)中心AI專用計(jì)算市場(chǎng)總收入的80%左右。英偉達(dá)2024財(cái)年呈現(xiàn)快速增長(zhǎng)態(tài)勢(shì)。FY24Q2營(yíng)收135億美元,同比增長(zhǎng)101%,環(huán)比增長(zhǎng)88%;FY24Q3收入181億美元,同比增長(zhǎng)206%。
英偉達(dá)與聯(lián)發(fā)科合作的首款芯片將用于智能座艙,預(yù)計(jì)2025年問(wèn)世,并在2026年至2027年投入量產(chǎn)。英偉達(dá)推出了首款面向AI基礎(chǔ)設(shè)施和高性能計(jì)算的數(shù)據(jù)中心專屬CPU——NVIDIA Grace,由兩個(gè)CPU芯片通過(guò)最新一代NVLink-C2C技術(shù)互聯(lián)組成。
這些證據(jù)表明,英偉達(dá)在人工智能芯片方面的技術(shù)優(yōu)勢(shì)、市場(chǎng)份額、發(fā)展勢(shì)頭、合作伙伴和創(chuàng)新能力,將使其在未來(lái)幾年內(nèi)依然領(lǐng)先全球。
不過(guò)中國(guó)在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等領(lǐng)域已與美國(guó)對(duì)齊。例如,百度預(yù)訓(xùn)練模型ERNIE超越微軟、谷歌拿下Glue冠軍,商湯一舉拿下Image Net 2016年三項(xiàng)冠軍;云從科技在Librispeech上刷新世界紀(jì)錄。此外中國(guó)在人工智能芯片的專利總量最多且增速最快,國(guó)內(nèi)機(jī)構(gòu)在AI芯片領(lǐng)域的專利布局力度提升明顯。
十、決策式人工智能將成為下一個(gè)風(fēng)口
決策式人工智能,也稱為決策智能,是一種依托多種軟件技術(shù)的決策優(yōu)化實(shí)用技術(shù),通過(guò)最大化發(fā)揮和利用數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和人工智能的潛能,幫助人類以更少的成本完成更多、更高效的決策。自生成式人工智能爆發(fā)之后,決策式人工智能將會(huì)成為下一個(gè)值得關(guān)注的風(fēng)口。
未來(lái),決策AI將朝著三大方向發(fā)展。第一,智能體的數(shù)量越來(lái)越多,從 1v1 的圍棋到 MOBA、足球等更大規(guī)模的多智能體場(chǎng)景。第二,人機(jī)交互方式更多元,從競(jìng)技對(duì)抗向博弈、協(xié)作演進(jìn)。第三,決策環(huán)境日益復(fù)雜,從最早的 2D 場(chǎng)景到 2.5D 游戲,再到更接近真實(shí)場(chǎng)景的 3D 開(kāi)放世界。
Gartner預(yù)測(cè),到2024年30%的企業(yè)機(jī)構(gòu)將使用新的“社會(huì)之聲”指標(biāo),來(lái)解決其面臨的社會(huì)問(wèn)題,以及評(píng)估數(shù)字道德對(duì)其業(yè)務(wù)績(jī)效的影響。此外,截至2020年,決策類人工智能市場(chǎng)規(guī)模達(dá)268億元,近4年年均復(fù)合增長(zhǎng)率實(shí)現(xiàn)83.5%,預(yù)計(jì)2020-2025年將保持47.1%的年均復(fù)合增長(zhǎng)率,并在2025年突破1847億元。
決策智能不僅能提升運(yùn)營(yíng)質(zhì)量和決策水平,更可以創(chuàng)造更多業(yè)務(wù)價(jià)值,還能夠產(chǎn)生新的業(yè)務(wù)模式和利用數(shù)據(jù)直接變現(xiàn)。
這些證據(jù)表明,決策式人工智能將成為下一個(gè)風(fēng)口,其發(fā)展前景廣闊,應(yīng)用價(jià)值巨大。值得注意的是,決策式人工智能不僅是輔助人類做決策,在更多的領(lǐng)域可以完全替代人類做決策??梢韵胂螅瑹o(wú)論是實(shí)現(xiàn)具身人工智能,還是實(shí)現(xiàn)通用人工智能,都離不開(kāi)決策式人工智能的幫助。
2023年是AIGC元年,也是AI大模型元年,在這一年人工智能的落地應(yīng)用出現(xiàn)了井噴式的增長(zhǎng),不但降低了生產(chǎn)成本,提高了生產(chǎn)效率,也為各行各位帶來(lái)了眾多的機(jī)會(huì)。2024年人工智能的發(fā)展將會(huì)上升一個(gè)新的臺(tái)階,為人類的文明發(fā)展提供更多的幫助!