編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
開源了!
3月11日,馬斯克曾發(fā)表了一篇“字少事大”的推文,并且設(shè)為了置頂。就一句話:xAI要在本周開源自家聊天機器人 Grok了。
消息一出,關(guān)注著Musk VS. OpenAI的吃瓜群眾立馬表示了熱烈的歡迎。經(jīng)過漫長的等待,Grok終于在當(dāng)?shù)貢r間周日發(fā)布了開源!
Grok-1,參數(shù)量達(dá)到了3140億的混合專家(MoE)模型,體量大于OpenAI GPT-3.5的1750億,成為參數(shù)量最大的開源大語言模型。
圖片
保持了馬斯克一貫的幽默、諷刺作風(fēng),Grok用約會軟件上“weights in my bio”(我的體重寫在簡介里了)作梗,來表示公開了模型的權(quán)重。
而OpenAI則趕來指責(zé)道“你們偷了我的笑話!”
馬斯克則回應(yīng)道,“還是來聊聊OpenAI里Open的事情吧!”
這樣的“一唱一和”也許正是馬斯克開源Grok想要達(dá)到的效果——繼續(xù)對OpenAI進(jìn)行挖苦,以為自己的訴訟博得更多的輿論支持。
看來,這場AI大戲還將繼續(xù)。且看Grok是否能成為一枚優(yōu)秀的棋子,為馬斯克拿下一城吧。
1、Grok究竟“open”到什么程度?
一句話總結(jié),雖然不是完全開源,但已做得相當(dāng)不錯。
早前,馬斯克宣布開源時,并未透露“開源”的具體含義。
眾所周知,許多開源大模型其實處于“偽開源”的狀態(tài),雖然它會提供一些開源的表面特征,如模型權(quán)重和基礎(chǔ)代碼,但并不開源完整的訓(xùn)練代碼、數(shù)據(jù)集和訓(xùn)練過程等關(guān)鍵信息。此前,阿里的EMO項目就曾因為在GitHub上并沒有公開任何代碼,而引起爭議,被社區(qū)成員戲稱其為“空殼開源”。
Grok的開放程度自然而然地成為關(guān)注焦點。有網(wǎng)友追問馬斯克是否能獲得訓(xùn)練數(shù)據(jù)。
圖片
更有網(wǎng)友列出了一個完全開源的模型應(yīng)該公開信息的list,真的是很貼心了(手動狗頭)。
圖片
根據(jù)Grok所公開的消息,Grok是未經(jīng)微調(diào)的基礎(chǔ)模型,由8 個專家(2 個活躍狀態(tài))組成。Grok的活躍參數(shù)達(dá)860億,僅這部分就超過了Meta開源的Llama2模型的總參數(shù)量,這反映了Grok在特定輸入下具備相當(dāng)高的計算效率和模型復(fù)雜度。
同時,Grok開源所遵守的Apache 2.0 許可證,將允許用戶自由地使用、修改和分發(fā)軟件,無論是個人使用還是商業(yè)用途。并且,在企業(yè)使用過程中,可以保留對修改后軟件的版權(quán),這在一定程度上減少了“在別人的地基上造房子”的風(fēng)險。
然而,在Grok的開源信息中,還是缺少了訓(xùn)練代碼以及可重現(xiàn)的數(shù)據(jù)集,開放程度遜色于Bloom 和 OLMo等模型。
2、Grok,為挑戰(zhàn) OpenAI而生
Grok的開源讓矛頭又指向了OpenAI。
在Grok開源的同一天,奧特曼發(fā)了一條推文表示“今年是人類歷史上最有趣的一年,除了未來的所有年份”。
圖片
而網(wǎng)友則在評論區(qū)配上梗圖,辛辣地諷刺道“我們還有未來,對吧?”,以表達(dá)對AGI安全問題的擔(dān)憂。
而這也是馬斯克這場AI訴訟的核心。
在Grok誕生之前,馬斯克就與OpenAI多次開杠,甚至攻擊OpenAI“訓(xùn)練AI說謊”。隨即馬斯克宣布自己將推出一個名為“TruthGPT”的人工智能平臺,作為ChatGPT的挑戰(zhàn)者。
在馬斯克的設(shè)想中,TruthGPT將是一個“最大限度尋求真理的人工智能”,旨在理解宇宙的本質(zhì)。他認(rèn)為這樣的AI不太可能消滅人類,因為人類是宇宙中有趣的一部分。
最終,“TruthGPT”被定名為Grok,并于去年11月正式上線。新名稱Grok取自羅伯特?安森?海因萊因的科幻小說《異鄉(xiāng)異客》,意思是完全理解某事或某人。寄托了馬斯克希望 AI 能超越機械的信息處理,真正理解人類的情感和需求的愿望。
因此,Grok會將“人格魅力”作為對話機器人的賣點也就不奇怪了。Grok反對其他大模型所遵守的“政治正確”,力圖回答其他AI會拒絕回答的尖銳問題?,F(xiàn)在的Grok仍然保留了“常規(guī)”和“幽默”兩種模式,供用戶進(jìn)行選擇。
馬斯克曾多次發(fā)推文親自推銷Grok的訂閱服務(wù)。目前X會員用戶可以訪問Grok,費用為16美元/月,略低于競爭對手GPT-4的20美元/月。
Grok背靠全球社交巨頭X平臺,好處多多,不僅有了一個巨大的用戶池作為其接口,也使得模型可以通過 X 獲取實時信息。如果問Grok "今天人工智能領(lǐng)域發(fā)生了什么?",Grok 會從社交媒體中的頭條新聞中組織出答案,而 ChatGPT 受限于其訓(xùn)練數(shù)據(jù)的時間范圍只能含糊其辭。
3、開源與閉源周旋久,孰贏?
OpenAI和馬斯克的訴訟引發(fā)了許多技術(shù)專家和投資者對人工智能開源or閉源的爭論。Grok的開源再次把這些爭議炒熱。
開源模型對大模型發(fā)展的重要性不言而喻。此前曾有人判斷,隨著時間的推移,開源大模型中終會跑出王者,將OpenAI甩到身后。因為無數(shù)程序員的調(diào)用和調(diào)優(yōu)所做出的貢獻(xiàn),要遠(yuǎn)超一小撮硅谷精英所能做的工作。就像今天的Android之于蘋果一樣。
華盛頓郵報也推測,馬斯克開源Grok的舉動,可能是希望借由開源讓該模型的使用量上升,同時獲得來自開發(fā)者群體的反饋。
同時,開源也有益于提高AI技術(shù)的透明度和可信賴性,能夠在一定程度上解決馬斯克反復(fù)提及的AI安全與道德問題。
現(xiàn)在,xAI已經(jīng)加入到Meta和Mistral的開源行列中去。而馬斯克領(lǐng)導(dǎo)的另一家公司特斯拉(Tesla)也公布過許多專利開源,他曾在 2014 年表示:"特斯拉不會對任何真誠希望使用我們技術(shù)的人提起專利訴訟?!?/p>
當(dāng)然,支持閉源的聲音將一直存在并有其道理。OpenAI投資者Vinod Khosla曾公開表示,馬斯克的法律訴訟是 "對實現(xiàn) AGI 目標(biāo)及其益處的巨大干擾"。如果OpenAI不采用閉源+盈利的路線,他們就無法維持當(dāng)前頂級的人才號召力,也無法以最大的推力前進(jìn),帶著AI一路狂飆到新天地。
科技界兩大巨頭之間的訴訟已經(jīng)觸及了人工智能安全性和可及性的核心問題,這些爭論不休的問題將蔓延到范圍更廣的初創(chuàng)企業(yè)。
雖然官司的走向尚不明朗,但是對于AI問題的持續(xù)關(guān)注與爭論必然是有其意義的。
謝謝馬斯克。