實力強的大模型都有哪些超能力?
前幾日,人工智能研究公司OpenAI CEO山姆·奧特曼(Sam Altman)在談及人工智能這項技術(shù)的潛力以及人們對它的擔憂時,曾表示“AI發(fā)展速度快得嚇人,就像停不下來的龍卷風?!笨梢?,人工智能正在以它超前的速度改變世界。
在經(jīng)歷了年初人工智能之大模型風口的狂熱之后,截止2023年10月,我國擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所達到了254家,這其中既有通用大模型(AGI),也有垂直大模型。換句話說,就是每隔幾天,國內(nèi)就會官宣一個新的大模型。
但越來越多的從業(yè)者會發(fā)現(xiàn),大模型的智能化與商業(yè)化落地其實并沒有那么快速。
隨著大模型技術(shù)的演變和業(yè)務(wù)的落地推進,會像大浪淘沙般將一些參與主體過濾出去,最終,只有手握硬核技術(shù)實力和資源的企業(yè)才能活下去。
那么,現(xiàn)階段國內(nèi)如此多的大模型,都有哪些類型?哪家實力最強呢?
通用大模型與垂直大模型,哪個有前景
據(jù)稱,國內(nèi)大模型已近80個,這其中包括通用大模型和垂直大模型(也叫專用大模型)。它們二者相比,孰高孰低呢?其實二者如果從應(yīng)用角度出發(fā)考慮的話,都具有各自的特點。
通用大模型(AGI)是指適用于多個領(lǐng)域或行業(yè)的大模型,例如自然語言處理領(lǐng)域的預(yù)訓練模型、圖像識別領(lǐng)域的預(yù)訓練模型等等。
這種大模型具有更廣泛的的應(yīng)用范圍,可以在多個領(lǐng)域內(nèi)發(fā)揮作用。我們常常聽到的人工智能公司OpenAI開發(fā)的ChatGPT、阿里的通義千問、百度的文心一言等都是通用大模型的代表。
而垂直大模型則是針對某個特定的領(lǐng)域或行業(yè)研發(fā)的大模型,例如醫(yī)療領(lǐng)域的大模型、金融領(lǐng)域的大模型、物流領(lǐng)域的大模型等。
就比如物流場景涉及單證(物流活動中進行物流承運而出具的合法效力文件,比如物流承運合同單證等)多、格式不統(tǒng)一等問題,物流大模型可以對其進行快速、準確的標準化識別,提供結(jié)構(gòu)化數(shù)據(jù)并做好糾錯、補全等操作,保障后續(xù)運單分單、履約配送等環(huán)節(jié)的質(zhì)量和效率。
這種大模型在特定領(lǐng)域內(nèi)具有更高的專業(yè)性和針對性,能夠更好地解決該領(lǐng)域內(nèi)的特定問題,因此垂直大模型也叫專用大模型。
可以說每個跟每個之間非常難以比較,所以也很難說哪個最有前途。
實力強的大模型擁有哪些超能力
雖然無法使用一個定律來比較出通用大模型與垂直大模型的優(yōu)劣,但實力強的大模型擁有的“超能力”總是具有共性的,也具有更廣闊的發(fā)展?jié)摿Α?/p>
1.超大算力
相較于一般AI應(yīng)用,大模型應(yīng)用的訓練及推理需要更強的算力支持,可以說算力決定了一個通用大模型的底線。
國內(nèi)提供云服務(wù)的阿里云、騰訊云自身就擁有超大算力,這是他們研發(fā)的大模型所具有的最大競爭力。
2.數(shù)據(jù)量大
訓練大模型需要更大的數(shù)據(jù)量,更好的數(shù)據(jù)質(zhì)量,更多樣性的數(shù)據(jù)源。因此在大家算力都夠、大模型架構(gòu)差不多的情況下,誰若再加上數(shù)據(jù)量多、數(shù)據(jù)質(zhì)量高的優(yōu)勢,便會相應(yīng)地提升大模型的質(zhì)量,大模型落地應(yīng)用的效果也就會越好。
3.是開源大模型
還有一個考慮的因素是是否是開源大模型。開源由于源代碼公開,可以根據(jù)用戶的需求隨時修改和定制開發(fā),且一般是免費的(免費使用降低了大模型的使用門檻,例如國外的ChatGPT和國內(nèi)的文心一言的爆火恰就是因為它使用便捷,人人只需注冊即可體驗),可以讓更多的開發(fā)人員和用戶參與,提高大模型的質(zhì)量和穩(wěn)定性。開源的大模型代表有阿里的通義千問。
而閉源大模型則由開發(fā)公司維護,雖然可以控制大模型的質(zhì)量和穩(wěn)定性,但如果不能不斷地提升自己的模型能力,不能保持長期不可動搖的領(lǐng)先性能,有可能會被開源取代。所以屬于閉源的大模型ChatGPT、文心一言等需要保持強勁的性能。
4.是否擁有API接口
開放服務(wù)能力是評價大模型能力的重要要素之一,大模型開放了API接口可以幫助其提升開放性,改善對外服務(wù)能力。
API接口開放對于專業(yè)人員來說必不可少??蒲腥藛T可以利用其做大量的測試。個人創(chuàng)業(yè)者也可以利用接口將其運用到實際的業(yè)務(wù)中。
相信在不久的將來,隨著大模型面臨的技術(shù)和成本問題被解決,相關(guān)的企業(yè)級應(yīng)用或消費型應(yīng)用落地的節(jié)奏將會加快。這樣也會凸顯出一批批強大的大模型廠商和應(yīng)用型產(chǎn)品,而這些廠商和產(chǎn)品很大可能出自于今天這些已嶄露頭角的大模型產(chǎn)品。