OpenAI宣布封禁?阿里Qwen2直接登頂開源榜首
自22年Chatgpt橫空出世來,這項(xiàng)技術(shù)改變了世界,也改變了很多人的命運(yùn)。
圖形界面讓計(jì)算機(jī)開始走進(jìn)千家萬戶,智能手機(jī)更進(jìn)一步讓互聯(lián)網(wǎng)人人可用,而現(xiàn)在大模型將成為新一代人機(jī)交互接口,這勢必將掀起一場革命。
這場革命中國正在奮起直追,其中代表性事件就是阿里最新開源的Qwen2登頂。
就在上周,全球著名開源平臺huggingface(開源模型網(wǎng)站,類似AI屆的GitHub)的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clem在海外社交平臺宣布,阿里最新開源的Qwen2-72B指令微調(diào)版本,性能超過美國最強(qiáng)的開源模型Llama3-70B,成為開源模型排行榜第一名。
圖片
Clem表示,為了提供全新的開源大模型排行榜,使用了300塊H100對目前全球100多個主流開源大模型,例如,Qwen2、Llama-3、mixtral等,結(jié)果顯示,阿里開源的Qwen-2 72B力壓科技、社交巨頭Meta的Llama-3、法國著名大模型平臺Mistralai的Mixtral成為新的王者,中國在全球開源大模型領(lǐng)域處于領(lǐng)導(dǎo)地位。
而恰逢OpenAI宣布終止對中國提供API服務(wù)之際,阿里云百煉平臺第一時間宣布,將為OpenAI API用戶提供最具性價比的中國大模型替代方案,并為中國開發(fā)者提供2200萬免費(fèi)tokens和專屬遷移服務(wù)。
讓我們來看看阿里通義千問與國外各大模型的巔峰對決。
6月7日,Qwen2發(fā)布后,僅2小時,Qwen2-72B登頂HuggingFace 開源大模型榜單Open LLM Leaderboard第一名,全球排名最高。
6月14日,Qwen2拿下美國最新測評榜單開源大模型全球第一。
Qwen2-72B在圖靈獎得主、Meta首席AI科學(xué)家楊立昆(Yann LeCun)聯(lián)合Abacus.AI、紐約大學(xué)等機(jī)構(gòu)推出全新的大模型測評基準(zhǔn)LiveBench AI中,在開源大模型中排名世界第一,也是十榜單中唯一的開源大模型、唯一的中國大模型。
圖片
6月20日,Qwen2在斯坦福大學(xué)的大模型測評榜單HELM MMLU中,成為開源模型第一。
MMLU(Massive Multitask Language Understanding,大規(guī)模多任務(wù)語言理解)是業(yè)界最有影響力的大模型測評基準(zhǔn)之一,涵蓋了基礎(chǔ)數(shù)學(xué)、計(jì)算機(jī)科學(xué)、法律、歷史等57項(xiàng)任務(wù),用以測試大模型的世界知識和問題解決能力。
圖片
阿里Qwen2的登頂證明了中國在大模型領(lǐng)域有能力達(dá)到領(lǐng)先水平。
開源可以讓企業(yè)以更低的成本使用,充分對各業(yè)務(wù)場景賦能。除了開源大模型,阿里云百煉平臺匯聚了眾多開發(fā)者,并配備了完善的工具鏈,而且還能充分保障客戶的數(shù)據(jù)安全,這一點(diǎn)得到了零一萬物創(chuàng)始人兼CEO,前Google、微軟、蘋果全球副總裁李開復(fù)的肯定。
也有很多海外開發(fā)者在使用阿里開源大模型Qwen2后認(rèn)為是自Llama 3以來最具影響力的開源LLM:
圖片
Qwen2的編碼和推理能力比同等規(guī)模的 llama-3-8b 更好,無需專門訓(xùn)練即可編寫俄羅斯方塊游戲。
圖片
Qwen 2-72b在幾乎所有測試中都比llama3 70b效果更好,盡管尺寸相對較小,但卻非常聰明和富有創(chuàng)意,可以在本地運(yùn)行。
最后,OpenAI用不了?沒關(guān)系,我們有自己的國產(chǎn)大模型。