Meta版ChatGPT來了:Llama 2加持,接入必應搜索,小扎現(xiàn)場演示
今天凌晨,一年一度的 Meta Connect 大會上發(fā)布了一系列以 AI 為重點的公告。
不只有最新的 MR 耳機、與 Ray-Ban 合作打造的智能眼鏡,最重要的是,Meta 將在自身的所有通訊類 App、Meta Quest 3 和未來的 Ray-Ban Meta 智能眼鏡中內(nèi)置生成式 AI 技術驅動的新功能,從多輪對話的 AI 助手到圖像編輯等一應俱全。
所有這些發(fā)布涉及的 AI 技術均基于 Llama 2—— 迄今為止最強大的開源大模型。不過 Meta 也提前透露了,更強大的 Llama 3 將于 2024 年推出。
Meta 還在 Connect 大會上宣布了全新的圖像生成器 Emu,它將用于為 AI 貼紙和圖像編輯等功能提供支持。
Meta 版聊天機器人「Meta AI」問世
大模型出現(xiàn)后,科技公司都在推出一系列新的人工智能機器人,引領開源一方的 Meta 也不例外,其正在其消息應用程序中推出一系列新的人工智能機器人,包括 WhatsApp、Messenger 和 Instagram。從本周三起,全新上線的大模型能力可供美國的部分測試版用戶使用。
扎克伯格展示 Meta 版 ChatGPT
這個名為 Meta AI 的人工智能助手,看起來與 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 2 等聊天機器人非常相似。
扎克伯格表示,用戶現(xiàn)在已經(jīng)可以通過群聊接受大模型的幫助,與朋友計劃旅行、收獲知識問題回答,并通過微軟的 Bing 搜索互聯(lián)網(wǎng)以提供實時網(wǎng)絡結果。
與此前 Facebook 的虛擬助手 M 不同,定制的 Meta AI 助手面向更廣大的用戶群體,而且是完全自動化的,其模型可以參考之前的對話,經(jīng)過調(diào)整可以給出「非常簡潔」的答案。
這意味著最新的 AI 助手需要擁有強大的上下文學習能力。關于如何實現(xiàn),Meta 也在一篇新論文中介紹了背后的技術:
論文地址:https://ai.meta.com/research/publications/effective-long-context-scaling-of-foundation-models/
在上面這篇論文中,Meta 通過持續(xù)預訓練 LLAMA 2 checkpoints 來構建模型,并使用了額外的 4000 億個 token 作為長訓練序列。在該系列模型中,較小規(guī)模的 7B/13B 變體使用了 32768 個 token 序列進行訓練,而 34B/70B 變體則使用了 16,384 個 token 序列。
與現(xiàn)有研究進行的有限評估不同,Meta 使用語言建模、合成任務以及涵蓋長短語境任務的各種實際基準對我們的模型進行了廣泛評估。在語言建模方面,Meta 的模型在上下文長度方面表現(xiàn)出明顯的冪律縮放行為。這種縮放行為不僅表明該模型能夠持續(xù)從更多語境中獲益,還表明語境長度是縮放 LLM 的另一個重要軸心。在研究基準上將新模型與 LLAMA 2 進行比較時,我們不僅能觀察到在長語境任務上的顯著改進,而且還觀察到在標準短語境任務上的適度改進,尤其是在編碼、數(shù)學和知識基準上。
研究人員探索了一種簡單而經(jīng)濟有效的方法,在沒有任何人工標注數(shù)據(jù)的情況下,對持續(xù)預訓練的長模型進行指導性微調(diào)。最終的結果是,在一系列長語境基準測試中,聊天模型的整體性能超過了 gpt-3.5-turbo-16k,這些基準測試包括問題解答、摘要和多文檔聚合任務。
目前,Meta AI 可以在任何聊天中調(diào)用。與 ChatGPT 接入 DALLE?3 能力類似,Meta AI 可以利用自家的圖像生成模型 Emu 來生成帶水印的圖像。
除了 Meta AI 之外,Meta 今天還推出了一系列「AI 角色」—— 大模型可以模仿某些名人的個性,包括 Kendall Jenner、德維恩?韋德、MrBeast、帕麗斯希爾頓、Charli D'Amelio 和 Snoop Dogg,其他機器人,包括貝爾?格里爾斯(Bear Grylls)、Chloe Kim 和 Josh Richards 正在路上。與 Meta AI 一樣,聊天機器人也存在于 Meta 的消息應用程序中,它們有個人資料圖像和時間線,就像真人一樣。當你與他們聊天時,化身會根據(jù)對話巧妙地產(chǎn)生動畫。
Meta 表示,為了保證安全性,其在發(fā)布模型之前花費了 6000 個小時尋找有問題的用例并招募員工在內(nèi)部與模型進行交互。它還聲稱已經(jīng)開發(fā)了新技術來捕獲違反其政策的內(nèi)容并對其采取行動,阻止 Meta AI 以外的聊天機器人搜索網(wǎng)絡。
圖像生成領域又一選手:Emu
在大會上,扎克伯格還介紹了全新的圖像生成模型「Emu」。
Emu(鴯鹋)的命名方式延續(xù)了 Meta 的動物主題。這是 Meta 對 DALL-E 和 MidJourney 等爆火應用程序的正式回應,同時推出的還有「生成式 AI 表情」和「圖像編輯」兩個重點新功能。
由 Emu 提供支持的新功能將允許用戶在幾秒鐘內(nèi)創(chuàng)建獨一無二的 AI 表情,不久后就將登陸 WhatsApp、Messenger、Instagram 甚至 Facebook Stories 等 Meta 旗下的應用程序。
扎克伯格表示:「人們每天都會發(fā)送數(shù)以億計的表情來表達聊天內(nèi)容。每一次聊天都是不同的,人們想表達的情緒也有微妙的不同,但現(xiàn)在我們只有固定數(shù)量的表情。有了 Emu,你就可以隨意輸入想要的東西了。」
具體來說,想使用這一功能,用戶可以在文本框中輸入想看到的圖片:
Meta 表示,生成多個即時分享選項平均需要三秒鐘。
此外,Meta 還即將在 Instagram 應用程序中推出「圖像編輯」功能。用戶可以改造自己的圖片,或與朋友共同創(chuàng)建 AI 生成的圖片,同樣由 Emu 的技術提供支持。
以「風格重塑」(Restyle)選項為例,通過輸入「水彩」或更詳細的提示詞,用戶可以改造圖片的視覺風格:
現(xiàn)場,扎克伯格演示了對自己的狗狗「Beast」照片的編輯,將其變成了折紙和十字繡的風格:
再比如,利用「背景」(Backdrop)選項,用戶可以通過提示詞來改變圖像的場景或背景:
在最新公布的論文中,Meta 也介紹了 Emu 背后的技術細節(jié):
論文地址:https://ai.meta.com/research/publications/emu-enhancing-image-generation-models-using-photogenic-needles-in-a-haystack/
具體來說,Meta 在 11 億的圖像 - 文本對上預訓練了一個潛在擴散模型 (LDM),并在從大量圖像語料庫中手工挑選出的幾千張高質量圖像上對模型進行了質量調(diào)整。鑒于圖像選擇的標準具有主觀性和文化依賴性。Meta 在此過程遵循了一些常見的攝影原則,包括但不限于構圖、照明、色彩、有效分辨率、焦點和故事性。
通過對潛在擴散架構進行一些優(yōu)化,Meta 建立了一個強大的預訓練模型,并通過質量調(diào)整大大提高了生成圖像的視覺吸引力,也就是 Emu。在視覺吸引力方面,Emu 的表現(xiàn)明顯優(yōu)于當前的開源 SOTA 模型 SDXL v1.0 ,如下圖所示。
此外,Meta 還驗證了質量調(diào)整是一種通用方法,對像素擴散和遮罩生成 Transformer 模型同樣有效。
Meta AI 接入微軟必應網(wǎng)絡搜索
我們知道,自 AI 大模型火爆以來,OpenAI 與微軟的合作可稱得上是迅速、緊密且全面,從搜索引擎到辦公軟件,不一而足。
此次,Meta 也尋求自身與微軟的進一步合作,在 Meta AI 聊天體驗中接入了微軟必應網(wǎng)絡搜索。此前 7 月,Meta 和微軟就曾宣布在 Windows 和 Azure 上支持 Llama 2 系列大語言模型。
微軟 CEO 納德拉分享微軟與 Meta 合作的消息
微軟副總裁兼消費者首席營銷官 Yusuf Mehdi 介紹了雙方的合作。他表示,微軟與 Meta 合作,將必應集成到 Meta AI 的聊天體驗中,通過訪問實時搜索信息來提供更即時、最新的答案。我們來看扎克伯格在現(xiàn)場的演示。
除了 Meta AI 聊天機器人,必應還將集成到 Meta 的其他產(chǎn)品,比如在 WhatsApp、Messenger 和 Instagram 中發(fā)送消息。
圖源:推特 @AmadeusSVX
雙方的合作將加速 AI 時代的創(chuàng)新,未來將持續(xù)拓展合作關系,為人們常用的產(chǎn)品提供更強大、有用的 AI 體驗。
對于 Meta 與微軟的合作,有網(wǎng)友做了一些有趣的梗圖,比如「殺死 OpenAI」。
圖源:推特 @B0wr1ng
你覺得小扎這波穩(wěn)了嗎?