英偉達(dá)出手即王炸!重磅開源Nemotron大模型:擊敗GPT-4o、僅次于o1! 原創(chuàng)
編譯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
英偉達(dá)悶聲干大事!什么炒作也沒有,直接開源媲美GPT-4o、僅次于o1的模型!
圖片
英偉達(dá)(Nvidia)在周二悄然發(fā)布了一款新型人工智能模型,性能超越了行業(yè)領(lǐng)導(dǎo)者OpenAI和Anthropic的產(chǎn)品,這標(biāo)志著公司人工智能戰(zhàn)略的重大轉(zhuǎn)變,并可能重新塑造該領(lǐng)域的競(jìng)爭(zhēng)格局。
這款名為L(zhǎng)lama-3.1-Nemotron-70B-Instruct的模型悄無聲息地出現(xiàn)在熱門的人工智能平臺(tái)Hugging Face上,憑借其在多個(gè)基準(zhǔn)測(cè)試中出色的表現(xiàn),迅速引起了關(guān)注。
項(xiàng)目地址:https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF
英偉達(dá)報(bào)告稱,新的產(chǎn)品在關(guān)鍵評(píng)估中取得了優(yōu)異成績(jī),包括在 Arena Hard 基準(zhǔn)測(cè)試中得分85.0,在 AlpacaEval 2 LC 中得分 57.6,以及在 GPT-4-Turbo MT-Bench 中得分 8.98 。
這些得分超過了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等備受推崇的模型,使英偉達(dá)躋身人工智能語(yǔ)言理解與生成的前沿。
1.英偉達(dá)的人工智能戰(zhàn)略:從GPU巨頭到LLM先鋒
這一發(fā)布代表了英偉達(dá)的一個(gè)關(guān)鍵時(shí)刻。該公司主要以圖形處理單元(GPU)的巨頭身份聞名,這些GPU為人工智能系統(tǒng)提供動(dòng)力,但現(xiàn)在它展示了開發(fā)復(fù)雜人工智能軟件的能力。這一舉措標(biāo)志著英偉達(dá)戰(zhàn)略擴(kuò)張的開始,可能會(huì)改變?nèi)斯ぶ悄苄袠I(yè)的格局,挑戰(zhàn)傳統(tǒng)的軟件公司在大語(yǔ)言模型開發(fā)中的主導(dǎo)地位。
英偉達(dá)開發(fā)Llama-3.1-Nemotron-70B-Instruct的方式是,利用先進(jìn)的訓(xùn)練技術(shù),包括“從人類反饋中學(xué)習(xí)的強(qiáng)化學(xué)習(xí)”(RLHF),對(duì)Meta的開源Llama 3.1模型進(jìn)行了優(yōu)化。這種方法使人工智能能夠從人類的偏好中學(xué)習(xí),可能會(huì)帶來更加自然和符合語(yǔ)境的回應(yīng)。
憑借其卓越的性能,這款模型有潛力為企業(yè)提供一個(gè)更有能力且更具成本效益的替代方案,挑戰(zhàn)市場(chǎng)上一些最先進(jìn)的模型。
該模型能夠在無需額外提示或特殊標(biāo)記的情況下處理復(fù)雜查詢,這是它的一個(gè)突出特點(diǎn)。在一次演示中,它正確地回答了“草莓里有多少個(gè)r?”這個(gè)問題,給出了詳細(xì)且準(zhǔn)確的回應(yīng),展示了對(duì)語(yǔ)言的深刻理解和提供清晰解釋的能力。
這些結(jié)果的特別重要之處在于強(qiáng)調(diào)了“對(duì)齊”(alignment)這一概念,這是人工智能研究中的一個(gè)術(shù)語(yǔ),指的是模型輸出與用戶需求和偏好的匹配程度。對(duì)企業(yè)來說,這意味著減少錯(cuò)誤、提供更有幫助的回應(yīng),最終提高客戶滿意度。
2.英偉達(dá)的新模型如何重塑商業(yè)和研究
對(duì)于企業(yè)和組織而言,英偉達(dá)的這一模型提供了一個(gè)非常有吸引力的新選項(xiàng)。該公司通過其build.nvidia.com平臺(tái)提供免費(fèi)的托管推理服務(wù),并配有與OpenAI兼容的API接口。
這種可訪問性使得先進(jìn)的人工智能技術(shù)更加普及,允許更多公司實(shí)驗(yàn)并實(shí)現(xiàn)先進(jìn)的語(yǔ)言模型。
這一發(fā)布還突顯了人工智能領(lǐng)域逐漸向不僅強(qiáng)大而且可定制的模型轉(zhuǎn)變。如今,企業(yè)需要能夠根據(jù)其特定需求量身定制的人工智能,無論是處理客戶服務(wù)查詢,還是生成復(fù)雜報(bào)告。英偉達(dá)的模型提供了這種靈活性,并且具有頂級(jí)的性能,使其成為各行業(yè)企業(yè)的有力競(jìng)爭(zhēng)選項(xiàng)。
然而,隨著這些強(qiáng)大的技術(shù)的推出,也伴隨著責(zé)任。如同任何人工智能系統(tǒng)一樣,Llama-3.1-Nemotron-70B-Instruct也無法避免風(fēng)險(xiǎn)。英偉達(dá)已提醒用戶,該模型并未針對(duì)數(shù)學(xué)或法律推理等專業(yè)領(lǐng)域進(jìn)行調(diào)優(yōu),這些領(lǐng)域?qū)?zhǔn)確性要求至關(guān)重要。企業(yè)需要確保合理使用該模型,并采取必要的保障措施以防止錯(cuò)誤或?yàn)E用。
3.人工智能軍備競(jìng)賽加劇:英偉達(dá)的大膽舉措挑戰(zhàn)科技巨頭
英偉達(dá)最新的模型發(fā)布顯示了人工智能領(lǐng)域變化的速度。盡管Llama-3.1-Nemotron-70B-Instruct的長(zhǎng)期影響尚不確定,但這一發(fā)布無疑標(biāo)志著在構(gòu)建最先進(jìn)人工智能系統(tǒng)的競(jìng)爭(zhēng)中一個(gè)明顯的轉(zhuǎn)折點(diǎn)。
通過從硬件向高性能人工智能軟件的轉(zhuǎn)型,英偉達(dá)迫使其他廠商重新考慮他們的戰(zhàn)略,并加快自己的研發(fā)步伐。這一切發(fā)生在公司推出NVLM 1.0系列多模態(tài)模型之后,其中包括72億參數(shù)的NVLM-D-72B。
這些最新的發(fā)布,特別是開源的NVLM項(xiàng)目,表明英偉達(dá)的人工智能雄心不僅僅是與競(jìng)爭(zhēng)對(duì)手抗衡——它們挑戰(zhàn)了像GPT-4o這樣專有系統(tǒng)在從圖像解析到解決復(fù)雜問題等領(lǐng)域的主導(dǎo)地位。
這些發(fā)布的快速接連突顯了英偉達(dá)在人工智能軟件開發(fā)領(lǐng)域的雄心。通過提供與行業(yè)領(lǐng)導(dǎo)者競(jìng)爭(zhēng)的多模態(tài)和文本專用模型,英偉達(dá)正在將自己定位為一個(gè)全面的人工智能解決方案提供商,利用其硬件專長(zhǎng)開發(fā)出強(qiáng)大且易于獲取的軟件工具。
英偉達(dá)的戰(zhàn)略似乎很明確:它正在將自己定位為一個(gè)全方位的人工智能服務(wù)提供商,結(jié)合硬件專長(zhǎng)與高性能的軟件。這一舉措可能會(huì)重塑整個(gè)行業(yè),迫使競(jìng)爭(zhēng)對(duì)手加速創(chuàng)新,并可能激發(fā)更多開源合作。
隨著開發(fā)者對(duì)Llama-3.1-Nemotron-70B-Instruct的測(cè)試,我們很可能會(huì)看到該模型在醫(yī)療、金融、教育等領(lǐng)域的新應(yīng)用出現(xiàn)。它的成功將最終取決于是否能夠?qū)⒘钊擞∠笊羁痰幕鶞?zhǔn)得分轉(zhuǎn)化為實(shí)際的解決方案。
未來幾個(gè)月,人工智能社區(qū)將密切關(guān)注Llama-3.1-Nemotron-70B-Instruct在現(xiàn)實(shí)應(yīng)用中的表現(xiàn),超越基準(zhǔn)測(cè)試。其能否將高得分轉(zhuǎn)化為實(shí)際的、具有價(jià)值的解決方案,將最終決定其對(duì)行業(yè)和社會(huì)的長(zhǎng)期影響。
英偉達(dá)深入開發(fā)人工智能模型,已經(jīng)加劇了競(jìng)爭(zhēng)。如果這是人工智能新紀(jì)元的開始,那么它是一個(gè)完全整合的解決方案可能會(huì)為未來的突破定下節(jié)奏。
本文轉(zhuǎn)載自51CTO技術(shù)棧,作者:言征
