自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

新聞
2021年一開始,OpenAI在GPT-3方向上的又一重要突破,讓吳恩達等大佬激動了。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

2021年一開始,OpenAI在GPT-3方向上的又一重要突破,讓吳恩達等大佬激動了。

之前給GPT-3一段話,就能寫出一段小說。

現(xiàn)在它成功跨界——可以按照文字描述、生成對應(yīng)圖片!

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

簡直就是“甲方克星、乙方福音”,提需求愛描述的甲方老板,現(xiàn)在直接嗶嗶就能立竿見影得到效果圖。

比如你輸入“OpenAI公司門面”,它就能給出設(shè)計圖:

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

這個新的AI,叫做DALL·E(Dali + Wall-E)。

除了生成現(xiàn)實中的圖片外,DALL·E還能按要求設(shè)計出“一顆白菜穿著芭蕾舞裙在遛狗”,妥妥的漫畫風(fēng)。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

從“五邊形鬧鐘”到“牛油果形狀的座椅”,只要你的想象力夠豐富,DALL·E全都能畫出來。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好
GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

技術(shù)上更厲害的是,OpenAI透露這個AI是基于GPT-3而構(gòu)建,僅使用了120億個參數(shù)樣本,相當(dāng)于GPT-3參數(shù)量的十四分之一。

于是效果一出,吳恩達、Keras之父等紛紛轉(zhuǎn)發(fā)、點贊。堪稱2021年第一個令人興奮的AI技術(shù)突破。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

看吳恩達老師pick的這個demo效果,以后是想直接描述生成自己想要的工裝?

“圖像版”GPT-3,還自帶排名

生成這些優(yōu)秀作品的,是一個名為DALL·E的結(jié)構(gòu)。

DALL·E的名字,來源于大藝術(shù)家達利(Dalí)和皮克斯動畫《機器人總動員》中的主角“瓦力”(WALL·E)。

[[374132]]

本質(zhì)上,它就是一個被重新訓(xùn)練過的“120億參數(shù)版”GPT-3,能根據(jù)一段文字描述,生成對應(yīng)的圖像。

為了讓DALL·E能“識字畫圖”,研究者們用包含各種“文本-圖像”組合的數(shù)據(jù)集,來訓(xùn)練DALL·E。

這其中,DALL·E以單數(shù)據(jù)流的形式,一次性接收1280個字符(token),其中256個字符分配給文字,其余的1024個則分配給圖像。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

DALL·E將對這些輸入信息進行建模,利用自注意力層的注意力遮罩,確保每一個輸入的圖像字符,都與所有輸入的文字字符關(guān)聯(lián)。

然后DALL·E將根據(jù)文本,通過最大似然估計,逐個字符生成圖像。它不僅能從文字中,生成一整幅草圖,還能重新生成圖像中的任何一塊矩形區(qū)域。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

這就完了?

當(dāng)然沒有,我們最終看到的作品,其實只是DALL·E創(chuàng)作的一部分,即“優(yōu)秀作品選”。

也就是說,還需要一個網(wǎng)絡(luò)CLIP,來對它生成的這些作品進行排名、打分。

越是CLIP看得懂、匹配度最高的作品,分數(shù)就會越高,排名也會越靠前。

[[374135]]

這種結(jié)構(gòu),有點像是利用生成對抗文本,以合成圖像的GAN。不過,相比于利用GAN擴大圖像分辨率、匹配圖像-文本特征等方法,CLIP則選擇了直接對輸出進行排名。

據(jù)研究人員表示,CLIP網(wǎng)絡(luò)的最大意義在于,它緩解了深度學(xué)習(xí)在視覺任務(wù)中,最大的兩個問題。

首先,它降低了深度學(xué)習(xí)需要的數(shù)據(jù)標(biāo)注量。相比于手動在ImageNet上,用文字描述1400萬張圖像,CLIP直接從網(wǎng)上已有的“文字描述圖像”數(shù)據(jù)中進行學(xué)習(xí)。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

此外,CLIP還能“身兼多職”,在各種數(shù)據(jù)集上的表現(xiàn)都很好(包括沒見過的數(shù)據(jù)集)。但此前的大部分視覺神經(jīng)網(wǎng)絡(luò),只能在訓(xùn)練的數(shù)據(jù)集上有不錯的表現(xiàn)。

例如,CLIP與ResNet101相比,在各項數(shù)據(jù)集上都有不錯的檢測精度,然而ResNet101在除了ImageNet以外的檢測精度上,表現(xiàn)都不太好。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

具體來說,CLIP用到了零樣本學(xué)習(xí)(zero-shot learning)、自然語言理解和多模態(tài)學(xué)習(xí)等技術(shù),來完成圖像的理解。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

例如,描述一只斑馬,可以用“馬的輪廓+虎的皮毛+熊貓的黑白”。這樣,網(wǎng)絡(luò)就能從沒見過的數(shù)據(jù)中,找出“斑馬”的圖像。

最后,CLIP將文本和圖像理解結(jié)合起來,預(yù)測哪些圖像,與數(shù)據(jù)集中的哪些文本能完成最好的配對。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

此次生成的Demo圖像,正是從512個樣本中,用CLIP選出的前32個樣本。研究人員強調(diào),整個過程他們?nèi)虥]有參與。

有哪些初步效果?

此次上線的Demo,大致分成這幾類效果。

控制變量,修改物體的屬性(數(shù)量、顏色)。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

甚至,還可以加上個年代屬性。輸入文字:電話。

[[374136]]

那這個電話放在未來呢?竟然會是這個亞子。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

同時控制多個對象。比如,戴紅色帽子,黃色手套,藍色襯衫和綠色褲子的企鵝。

說實話,要換成是我,我一個也畫不出來。(手動裂開)

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

推斷細節(jié)。正如上文舉的例子,“沐浴在朝陽中的田間水豚”。

單從文字上看,還有很多細節(jié)需要考究:水豚位置,陰影有無,繪畫風(fēng)格。但這些,似乎都沒有難到DALL·E

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

大佬們紛紛給出好評

對于OpenAI這個新鮮出爐的DALL·E,大佬們也紛紛發(fā)表了自己的看法。

Keras創(chuàng)始人@François Chollet表示,這看起來非??幔绕涫?ldquo;圖像生成”部分。

從原理上來看,應(yīng)該就是GPT-3在文本合成圖像方向上的擴展版。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

OpenAI的CTO Greg Brockman在轉(zhuǎn)發(fā)DALL·E后,更是立刻獲得了1.4k的贊。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

英偉達的機器學(xué)習(xí)專家Ming-Yu Liu,也送上了自己的祝福。

他表示,這樣的模型在文本轉(zhuǎn)圖像的能力上,簡直超乎想象。

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

當(dāng)然,也有對這種方法的限制感到困惑的學(xué)者。

來自哈佛的助理教授Tomer Ullman,在對DALL·E的能力表示驚嘆時,也提出了對于模型泛化能力限制的疑惑。

他認為,如果能生成“綠方塊上的紅方塊”,模型理應(yīng)也能生成“藍方塊上的綠方塊上的紅方塊”?

GPT-3今年首次升級,吳恩達、Keras之父等大佬紛紛叫好

希望這樣的模型,能在提升泛化等能力后,真正被用來減輕設(shè)計師們的負擔(dān)。

當(dāng)然,如果再開一開腦洞的話,應(yīng)用前景可能不止于減輕負擔(dān)。

如果效果足夠好,還要什么乙方設(shè)計師?

以及像動畫、影視等領(lǐng)域,是不是未來劇本一放,AI就能給你出成果了?

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-11-09 08:55:10

Python 開發(fā)AI

2022-12-29 13:32:05

AI發(fā)展

2023-04-07 09:53:02

量子AI

2021-07-19 10:56:36

GPE-3OpenAI微軟

2023-03-30 13:47:11

AI

2020-04-06 21:24:08

Windows 10Windows系統(tǒng)更新

2023-03-01 16:15:16

2024-04-01 00:50:00

吳恩達智能體

2023-02-14 08:00:00

人工智能GPT-3語言模型

2021-04-23 10:55:52

人工智能深度學(xué)習(xí)

2017-12-15 12:44:02

2021-03-23 15:21:00

人工智能機器學(xué)習(xí)技術(shù)

2023-06-08 15:33:31

人工智能GPT-3

2022-02-08 15:55:44

人工智能新冠吳恩達

2024-04-26 12:37:57

AI訓(xùn)練

2022-06-06 12:53:17

吳恩達AI機器學(xué)習(xí)

2017-03-22 20:18:04

百度人工智能吳恩達

2024-01-23 17:10:46

2022-06-01 16:47:53

AI模型開源

2024-03-22 13:34:00

模型數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號