1750億參數(shù),Meta發(fā)布聊天機(jī)器人!像人一樣聊天,還不怕被玩壞
?最近,Meta又搞了波大動(dòng)作。
他們發(fā)布了最新開(kāi)發(fā)的聊天機(jī)器人——BlenderBot3,并公開(kāi)收集用戶的使用數(shù)據(jù)作為反饋。
據(jù)說(shuō),跟BlenderBot3聊什么都行,屬于SOTA級(jí)別的聊天機(jī)器人。
真有這么智能嗎?
上圖是一位網(wǎng)友和BlenderBot閑聊的聊天記錄??梢钥吹剑娴氖情e聊。
用戶說(shuō)自己要去練瑜伽了,問(wèn)BlenderBot要干啥去。機(jī)器人說(shuō)自己正在寫(xiě)第九本書(shū)。
神奇的BlenderBot 3
這款最新的聊天機(jī)器人由Meta的人工智能研究室創(chuàng)造,也是Meta第一個(gè)175B參數(shù)的機(jī)器人。模型的所有部分,代碼、數(shù)據(jù)集什么的,全部公開(kāi)所有人可用。
Meta表示,在BlenderBot3上,用戶可以暢聊任何在互聯(lián)網(wǎng)上有的主題。
BlenderBot3應(yīng)用了Meta最新開(kāi)發(fā)的兩種機(jī)器學(xué)習(xí)技術(shù)——SeeKeR和Director,并以此建立了讓機(jī)器人從互動(dòng)和反饋中學(xué)習(xí)的對(duì)話模型。
參與開(kāi)發(fā)BlenderBot3的研究工程師Kurt Shuste表示,「Meta致力于公開(kāi)發(fā)布我們?cè)谘菔具@款聊天機(jī)器人時(shí)收集到的所有數(shù)據(jù),希望我們能夠改進(jìn)對(duì)話式人工智能?!苟鴱膬?nèi)容上看,BlenderBot3并不是全新的。它的底層模型依然是大語(yǔ)言模型,以及LLMS,這是一個(gè)非常強(qiáng)大(雖然有一些缺陷)的文本生成軟件。
就像所有的文本生成軟件一樣,BlenderBot3最初也是在龐大的文本數(shù)據(jù)集上進(jìn)行的訓(xùn)練,在這些數(shù)據(jù)集上,BlenderBot可以挖掘各類統(tǒng)計(jì)模式,然后生成語(yǔ)言。
就像咱們說(shuō)爛了的GPT-3一樣。
除了上面說(shuō)的這些以外,BlenderBot3還有一些亮點(diǎn)。
不同于以往的聊天機(jī)器人,在和BlenderBot聊天的時(shí)候,用戶可以點(diǎn)擊機(jī)器人給出的回答,查看這句話在互聯(lián)網(wǎng)上的出處。換句話說(shuō),BlenderBot3是可以引用來(lái)源的。
然而這里面有一個(gè)很關(guān)鍵的問(wèn)題。那就是,任何聊天機(jī)器人一旦公測(cè),就意味著任何人都可以和它進(jìn)行互動(dòng)。測(cè)試的人群基數(shù)一旦上漲,就肯定會(huì)有一波人想把它「玩壞」。
這也是Meta團(tuán)隊(duì)接下來(lái)研究的重點(diǎn)。
聊天機(jī)器人被玩壞的經(jīng)歷可一點(diǎn)都不稀奇。
2016年,微軟在推特上發(fā)布了一個(gè)叫做Tay的聊天機(jī)器人,關(guān)注過(guò)Tay的人一定都還有印象。
在開(kāi)始公測(cè)以后,Tay就開(kāi)始從和用戶的互動(dòng)中進(jìn)行學(xué)習(xí)。不出意外,沒(méi)過(guò)多久Tay就在一小部分搗亂的人的影響下,開(kāi)始輸出一系列和種族主義、反猶太主義、厭女相關(guān)的言論。
微軟見(jiàn)勢(shì)不妙,不到24小時(shí)就把Tay下線了。
Meta表示,自從Tay遭遇滑鐵盧以后,AI世界又得到了極大的發(fā)展。BlenderBot有各種安全保證措施,應(yīng)該可以阻止Meta重蹈微軟的覆轍。
而最初的實(shí)驗(yàn)表明,隨著越來(lái)越多的人能參與到和模型的互動(dòng)中來(lái),機(jī)器人就能更多的從對(duì)話經(jīng)驗(yàn)中學(xué)到東西。隨著時(shí)間的推移,BlenderBot3反倒會(huì)越來(lái)越安全。
看起來(lái),在這方面Meta做的還不錯(cuò)。
Facebook人工智能研究中心(FAIR)的研究工程經(jīng)理Mary Williamson表示,「Tay和BlenderBot3最關(guān)鍵的區(qū)別在于,Tay被設(shè)計(jì)為從用戶互動(dòng)中進(jìn)行實(shí)時(shí)學(xué)習(xí),而B(niǎo)lenderBot則是一個(gè)靜態(tài)模型?!?/p>
這意味著,BlenderBot能夠記住用戶在對(duì)話中所說(shuō)的話(如果用戶退出程序并在以后返回,它甚至?xí)ㄟ^(guò)瀏覽器cookies保留這些信息),但這些數(shù)據(jù)只會(huì)被用來(lái)進(jìn)一步改進(jìn)系統(tǒng)。
Williamson表示,「如今絕大多數(shù)聊天機(jī)器人都是以任務(wù)為導(dǎo)向的。就拿最簡(jiǎn)單的客服機(jī)器人來(lái)說(shuō),看著智能,其實(shí)只是一個(gè)又一個(gè)編好程的對(duì)話樹(shù),慢慢縮小用戶的需求,最后還是人工對(duì)接。」
真正的突破,是讓機(jī)器人能像人一樣自由自在的對(duì)話。這正是Meta想做的事。除了將BlenderBot 3放在網(wǎng)上,Meta還發(fā)布了底層代碼、訓(xùn)練數(shù)據(jù)集和較小的模型變體。研究人員可以通過(guò)這里的表格申請(qǐng)?jiān)L問(wèn)。