自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

比ChatGPT早發(fā)兩周,被噴下線的Galactica成了LeCun最大的意難平

人工智能 新聞
圖靈獎得主、Meta 首席科學家 Yann LeCun 為 Galactica 的下架感到非常遺憾,并發(fā)布推文:「再也不能用它來找樂子了。你們都開心了嗎?」顯然,LeCun 認為大家對 Galactica 的指責有些過分。

今天我們提到大型語言模型(LLM),第一個想到的就是 OpenAI 的 ChatGPT。一年來,ChatGPT 因其強大的性能,廣泛的應用前景而爆火出圈。但談到大型語言模型,ChatGPT 并不是第一個。

一年前,也就是 OpenAI 發(fā)布 ChatGPT 的前兩周,Meta 發(fā)布了一個名為 Galactica 的試用版模型。作為一個大型語言模型,Galactica 是在大量的論文、參考資料、知識庫和許多其他來源的科學語料庫上進行訓練的,包括超過 4800 萬篇論文、教科書和講義、數(shù)百萬種化合物和蛋白質(zhì)知識、科學網(wǎng)站、百科全書等。

彼時,Meta 聲稱 Galactica 能夠總結(jié)學術(shù)文獻、解決數(shù)學問題、生成 Wiki 文章、編寫科學代碼,甚至可以執(zhí)行涉及化學公式和蛋白質(zhì)序列的多模態(tài)任務。

然而,上線不到三天,Galactica 就迅速下架了,原因是 Galactica 生成的文本不嚴謹,不負責任地胡編亂造。

圖片

當時,「幻覺」這個詞還沒有成為機器學習領(lǐng)域的主流詞匯,但 Galactica 可以說是因為嚴重的幻覺問題而被下架。

圖靈獎得主、Meta 首席科學家 Yann LeCun 為 Galactica 的下架感到非常遺憾,并發(fā)布推文:「再也不能用它來找樂子了。你們都開心了嗎?」顯然,LeCun 認為大家對 Galactica 的指責有些過分。

圖片

有趣的是,就在同一周,關(guān)于 GPT-4 即將發(fā)布的傳言不脛而走。11 月 30 日,當許多 AI 研究人員正在 NeurIPS 上討論 OpenAI 可能要推出 GPT-4 時,ChatGPT 突然就發(fā)布了。

當然, ChatGPT 很快也被發(fā)現(xiàn)有幻覺問題,這與 Galactica 和其他生成式 AI 一樣。ChatGPT 會「滔滔不絕」,自信滿滿,但它的回答又是似是而非的。但值得注意的是,OpenAI 在發(fā)布 ChatGPT 的博客中明確指出了它這一弱點,并解釋稱:「解決這一問題極具挑戰(zhàn)性?!?/span>

接下來的事情大家都看到了,ChatGPT 迅速成為 LLM 「頂流」。在過去的一年里,它已經(jīng)成為有史以來增長最快的服務之一。推出兩個月后,月活用戶就突破了 1 億,現(xiàn)在每周用戶也有約 1 億。

現(xiàn)在,Galactica 的故事又一次被提起。外媒 VentureBeat 資深撰稿人 Sharon Goldman 發(fā)布了一篇新文章,講述了 Galactica 給 Meta 帶來的經(jīng)驗教訓。

圖片

文章鏈接:https://venturebeat.com/ai/what-meta-learned-from-galactica-the-doomed-model-launched-two-weeks-before-chatgpt/

關(guān)于 Galactica,Meta 公司 AI 研究副總裁 Joelle Pineau 在采訪時向 VentureBeat 講道:「我們學到了很多好的經(jīng)驗。這是一個很好的模型,我仍然收到很多人想要這個模型的請求?!?/span>

「人們對產(chǎn)品會有一種期望,就像是你想要用它來撰寫論文。但這并不是我們的初衷?!筆ineau 強調(diào)說:「Galactica 從來就不是一個產(chǎn)品,而是一個研究項目。我們是抱著這樣的目的發(fā)布的,我們做了一個低調(diào)的發(fā)布,把它放在 GitHub 上,研究人員在推特上發(fā)布了它,但是期望與研究之間的差距太大了?!?/span>

當時的人們顯然對模型幻覺十分驚訝,而幻覺這件事在一年后將變得稀松平常。其實,Galactica 的幻覺水平實際上低于其他模型,因為它是根據(jù)科學文獻進行微調(diào)的。

此外,在 VentureBeat 的文章中,作者 Sharon Goldman 也提到:令人慶幸的是,Galactica 的教訓給 Llama 的發(fā)布上了一課。

Meta 公司撤下了 Galactica 演示版,以確保人們不會被誤導使用它。Pineau 表示:「如果讓我今天來做這件事,我們會對發(fā)布進行管理?!巩敃r,Meta 很可能錯誤地估計了人們對 Galactica 的期待,但 「我們已經(jīng)將從中吸取的教訓融入到下一代模型中了?!?/span>

Meta 的下一代大型語言模型就是 LLaMA,它于 2023 年 2 月在 AI 研究領(lǐng)域掀起了一場風暴,隨后在 7 月推出了商用的 LLaMA 2,8 月又推出了 Code LLaMA。隨著 LLaMA 成為第一個主要的免費開源 LLM,開源 AI 開始嶄露頭角,并引發(fā)了一場熱火朝天的討論。

LLaMA 于 2 月 24 日發(fā)布時,Meta 非常謹慎。Yann LeCun 在分享 LLaMA 論文時表示:「Meta 致力于開放研究,將在 GPL v3 許可證下向研究社區(qū)發(fā)布所有模型?!?/span>

當被問及為什么研究人員必須填寫表格才能訪問 LLaMA 時,LeCun 回答道:「因為上次我們向所有人提供 LLM( 旨在幫助科學家撰寫科學論文的 Galactica)時,人們對我們嗤之以鼻,并告訴我們這將破壞社會結(jié)構(gòu)。」

圖片

看起來,LeCun 對 Galactica 的下架一直抱有「怨氣」。

如今,LeCun 也是馬上就在推特上轉(zhuǎn)發(fā)了 Sharon Goldman 這篇文章,說道:「輿論稱我們現(xiàn)在所說的 LLM 幻覺會摧毀科學出版系統(tǒng)。結(jié)果,一個對科學家來說非常有用的工具被毀了?!棺詈笏€表示:「以人工智能道德為幌子的誤導性觀點可能會適得其反。」這不得不讓人聯(lián)想到最近 LeCun 與另一位圖靈獎得主 Geoffrey Hinton 關(guān)于「AI 監(jiān)管」的辯論。

圖片

Galactica 的第一作者 Ross Taylor 也在推特上發(fā)文表示:Galactica 在發(fā)布時因人手稀缺而沒有對基礎(chǔ)模型進行充分的檢查,這導致了一些問題。他們原本希望通過公開演示來收集科學查詢的數(shù)據(jù),但這反而引起了誤解和批評。但他們的研究仍然是有價值的,并且從這次經(jīng)歷中學到的教訓已經(jīng)用到了后續(xù)的 LLaMA 2 項目中。

圖片

LeCun 更是用開源應「盡早發(fā)布,經(jīng)常發(fā)布(release early, release often)」為 Galactica 再鳴不平。

無論如何,掀起大模型浪潮的是 OpenAI 的 ChatGPT,在開源領(lǐng)域?qū)崿F(xiàn)突破的是 LLaMA,Galactica 的故事已成過去。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-11-15 13:19:14

2023-02-06 14:37:44

LeCun模型

2011-04-08 09:12:48

iOS蘋果

2009-05-27 16:14:17

LinuxUbuntu體驗

2022-03-09 14:37:52

互聯(lián)網(wǎng)大廠中層面試

2021-02-06 16:00:42

安卓微信移動應用

2010-12-14 10:12:33

新版Android M

2012-03-12 15:14:17

iPad

2024-01-29 01:26:22

AI進程GAAM

2013-12-30 16:24:17

Windows 8.1Windows 8.1

2009-04-20 08:48:25

Windows 7微軟操作系統(tǒng)

2020-02-25 14:29:08

CIO遠程辦公釘釘

2023-04-18 16:38:24

AI應用

2013-08-08 14:14:16

Windows 8.1

2023-07-11 14:13:04

技術(shù)會談

2013-01-10 09:53:40

智能手表PebbleCES 2013

2023-02-08 15:32:16

云服務中斷微軟

2009-08-31 09:27:43

互聯(lián)網(wǎng)

2023-07-05 14:13:16

ChatGPT聯(lián)網(wǎng)模式
點贊
收藏

51CTO技術(shù)棧公眾號