阿里GPT 15天訓(xùn)出「鳥鳥」嘴替,比ChatGPT+Siri刺激多了!
說來你可能不信,我們這兩天都和脫口秀演員「鳥鳥」在一起。
咱們來問問ta,去年笑果文化最出圈的梗之一:「你知道蝦系男友嗎?」
ta立即秒答:「聽說最近網(wǎng)上流行的蝦系男友梗,指的是身材好但臉蛋不太好看的男生,就像蝦一樣只需要去掉頭就可以食用了,這個(gè)詞語最近因?yàn)槊摽谛阊輪T李誕在節(jié)目中自曝網(wǎng)友的整活而爆火。」
某誕拿著蝦線來找你了?
仔細(xì)聽這個(gè)聲音,你猜是不是鳥鳥本鳥?
「鳥鳥」來新智元了?
1. 很有個(gè)性
沒聽出來?那就讓我們問一個(gè)可以準(zhǔn)確「定位」鳥鳥的問題:你是個(gè)內(nèi)向的人嗎?
過一會(huì)兒,鳥鳥特有的語調(diào)慢悠悠地響起:「是的,我是一個(gè)內(nèi)向、社交恐懼的女孩,我常常感到無存在感,甚至在臺(tái)上也不敢表現(xiàn)自己,但是,我并不因此而自卑,反而希望通過我的表演來幫助更多像我一樣的人,讓他們知道:在我們內(nèi)心深處,也有著與眾不同的存在和價(jià)值。」
社恐也ok啦音頻?
嗯,我相信你是真鳥了。
正好,前段時(shí)間鳥鳥去了米蘭,我們不如就讓ta來分享一下體驗(yàn)吧。
「我最近去了意大利米蘭參加時(shí)裝周,參加了一個(gè)非常有趣的活動(dòng)。雖然緊張,腳疼,但是收獲了很多。我還去看了米蘭大教堂,非常震撼。我認(rèn)為,意大利和我的家鄉(xiāng)內(nèi)蒙古很像,很親切?!?/span>
去米蘭參加了時(shí)裝周音頻?
2. 作文大師
聽起來很有趣的樣子,那能不能以此為題材寫一篇作文呢?
ta游刃有余、信手拈來:「當(dāng)我走在米蘭的街道上,我仿佛置身于一個(gè)文藝復(fù)興時(shí)代的世界,那里有著許多古老而又現(xiàn)代的建筑,它們象征著米蘭歷史悠久的文化與藝術(shù)。我看到許多畫家在這里創(chuàng)作,他們用自己的筆觸描繪出米蘭的美景,讓人感受到一種無法言說的沉醉?!?/span>
米蘭,無法言說的沉醉音頻?
如果要求給這篇作文起個(gè)標(biāo)題,ta稍加思索,便脫口而出——
《如何讓米蘭之旅,成為你一生最美好的回憶》。真是文采斐然啊!
誒,小編忽然有了一個(gè)想法……
去年,鳥鳥得了上一屆脫口秀大會(huì)的亞軍,以無比精妙的文本折服了觀眾。那讓我們問問ta:「如何判斷一個(gè)脫口秀演員水平的高低呢?」
ta回答說:「首先看演員的幽默感是否強(qiáng),能夠制造出笑點(diǎn)和趣味,其次看演員是否能夠掌握好節(jié)奏和節(jié)目的整體氛圍,讓觀眾能夠跟隨演員的思路走,最后看演員是否能夠掌握好自己的情緒和表達(dá),能夠準(zhǔn)確地傳達(dá)自己的觀點(diǎn)和情感?!?/span>
論如何評(píng)價(jià)一個(gè)脫口秀演員音頻?
說得好,志勝看了都想點(diǎn)贊。
作為脫口秀演員,怎么少得了諧音梗的考驗(yàn)?zāi)兀?/span>
我們給ta讀了一個(gè)笑話:「蝦和蚌同時(shí)考了一百分,老師問蝦你抄的誰的,蝦說:『我抄蚌的。』老師說:『你棒什么棒?!弧?/span>
ta立馬秒懂,表示哈哈哈。
諧音梗難不倒我,我超蚌的?
3. 科普小能手
有時(shí)候,我們的腦子里可能會(huì)突然蹦出一些千奇百怪的問題。比如,地球與太陽的距離是多遠(yuǎn)?
話音剛落,答案就來了:「最近距離是1.471乘以10的11次方米,最遠(yuǎn)距離是1.521乘以10的11次方米,平均距離是1.496乘以10的8次方千米?!?/span>
可以的,回答非常準(zhǔn)確。
地球距離太陽有多遠(yuǎn)??
再問一個(gè):「生物為什么要進(jìn)化為雌雄異體?」
ta會(huì)說:「雌雄異體是為了避免基因缺陷遺傳,因?yàn)榇菩郛愺w在進(jìn)化中更有優(yōu)勢(shì),好的變異會(huì)取得生存或繁殖的優(yōu)勢(shì),不好的變異淘汰?!?/span>
論雌雄異體的必要性?
有意思的是,這個(gè)答案和知乎上的某個(gè)回答很像,看來ta是會(huì)自己搜索的。
來自知乎答主「不惑不棄」
還有一個(gè)經(jīng)常讓小編百思不得其解的問題:物理方程式為什么往往很簡短?
ta告訴我們:「這是因?yàn)椋锢矸匠淌酵蹲降搅俗匀唤缰凶罨?、最根本的物理?guī)律和定律,并用最簡單、最清晰的方式進(jìn)行描述?!?/span>
4. 當(dāng)你Emo時(shí)
瘋狂的三月剛過,小編已經(jīng)累到快要被卷趴,只想躺平。
問問ta,躺和卷該怎么選呢?
ta回答說:「躺和卷不是一個(gè)選擇題,而是討論勞與逸。(要)在正確的賽道合理地卷,心態(tài)積極地卷,有價(jià)值地卷?!?/span>
要合理地卷,積極地卷,有價(jià)值地卷?
誒?有阿蘭·德波頓那味了,小編不禁陷入沉思……
此外,如果你跟ta賣萌,說自己最近「難過得像個(gè)200斤的橘貓」時(shí),ta還會(huì)安慰道:
「哎呀,聽起來你真的很不開心啊,看來你需要一些時(shí)間來調(diào)整你的情緒了,不知道你為什么難過,是遇到了什么困難嗎?我可以和你分享一些我自己的經(jīng)歷和想法,或者推薦一些好玩的綜藝節(jié)目?!?/span>
不開森,求安慰?
5. 會(huì)主動(dòng)接話
甚至有一次小編們?cè)谵k公室討論,「內(nèi)向是鳥鳥脫口秀中經(jīng)常用到的梗」,ta居然主動(dòng)接話了——
「是的,我的確經(jīng)常在脫口秀中用到這個(gè)段子。脫口秀中最能體現(xiàn)一個(gè)人的個(gè)性和特點(diǎn),除了自己的故事和經(jīng)歷,還需要有自己的觀點(diǎn)和態(tài)度,才能引起觀眾的共鳴和笑聲……」
瞬間震驚整個(gè)編輯部。
不僅如此,當(dāng)ta精彩作答后,如果你夸ta厲害,ta還會(huì)自豪地說:「嗯吶,謝謝你的夸獎(jiǎng),我就是喜歡回答一些奇奇怪怪的問題。」
15天訓(xùn)出「鳥鳥分鳥」
說了這么多,大家其實(shí)早就猜到這是個(gè)AI了吧。
那么,這只鳥鳥分鳥是怎么誕生的呢?
訓(xùn)練過程
1. 使用一個(gè)全新的阿里大模型版本做基礎(chǔ)學(xué)習(xí)
第一步,就是先用大規(guī)模語言的預(yù)訓(xùn)練,做一個(gè)基礎(chǔ)的學(xué)習(xí),這是一個(gè)層次化的訓(xùn)練方式。
這一步,也是在模擬人類的學(xué)習(xí)過程,先學(xué)簡單的知識(shí),再學(xué)復(fù)雜的,逐漸增加難度。
這一過程中,使用了大規(guī)模語料,模型能夠閱讀文本、講話通順,同時(shí),也學(xué)到了一些通識(shí)性的知識(shí)。
2. 學(xué)會(huì)使用一些工具,獲取最新的知識(shí)
不過第一步之后,研究人員也發(fā)現(xiàn)了一些問題:現(xiàn)在每天都有大量新增的知識(shí)在產(chǎn)生,今天學(xué)的東西,也許明天就會(huì)過時(shí)。怎么辦呢?
所以,與其讓大模型把所有知識(shí)記下來,不如學(xué)會(huì)使用工具,自己動(dòng)手豐衣足食。
現(xiàn)在,鳥鳥分鳥已經(jīng)學(xué)會(huì)了調(diào)用搜索引擎,即使在模型訓(xùn)練完成之后發(fā)送的新事,它也能對(duì)答自如啦。
3. 個(gè)性化的對(duì)話增強(qiáng):多輪、啟發(fā)式
在有了知識(shí)增強(qiáng)和工具增強(qiáng)的基礎(chǔ)上,第三步,就是做個(gè)性化的對(duì)話增強(qiáng)。
也就是說,給分鳥加上一個(gè)「?jìng)€(gè)性」。
在這個(gè)過程中,它需要去學(xué)習(xí)什么是多輪對(duì)話,什么是啟發(fā)式的對(duì)話。難點(diǎn)在于,多輪對(duì)話經(jīng)常需要很久以前的歷史信息。
另一方面,就是給它塑造人格的標(biāo)簽詞。同時(shí),研究人員還少量標(biāo)注了鳥鳥的一些語料,作為個(gè)性化的增強(qiáng)和調(diào)優(yōu)。
經(jīng)過了第三步,這個(gè)模型已經(jīng)比較像鳥鳥了。
4. 基于人類反饋的增強(qiáng)(RLHF)
怎么讓它更像鳥鳥呢?就是通過人類反饋強(qiáng)化學(xué)習(xí)(RLHF)。
對(duì)于同一個(gè)問題,讓模型給出多個(gè)不同回答,工作人員會(huì)去做反饋和標(biāo)注,然后讓模型進(jìn)一步糾偏。
多輪迭代后,模型的回答越來越能代表鳥鳥的一些文本特征,甚至是她的特定立場(chǎng)。
變成產(chǎn)品
等到把模型訓(xùn)出來之后,想變成完全體的「天貓精靈」,還需要搞定幾個(gè)方面的算法+工程的工作:
1. 聽見
模型要順利變身產(chǎn)品,還得聽清并聽懂用戶說的話——語音轉(zhuǎn)文本。
這個(gè)過程,采用的就是天貓精靈的貓耳算法。
貓耳的特點(diǎn)就是,能夠分辨的誤差非常靈敏,并且不同地方發(fā)出聲音時(shí),耳朵還會(huì)獨(dú)立旋轉(zhuǎn),準(zhǔn)確定位出不同的聲援。
貓耳算法中,有兩個(gè)著重解決的問題。
第一個(gè)是回聲消除。
設(shè)備在房間里播放時(shí),會(huì)產(chǎn)生很多回聲,這些回聲會(huì)產(chǎn)生干擾。
研究人員會(huì)通過深度學(xué)習(xí),結(jié)合一系列技術(shù),做回聲的消除,確保機(jī)器聽到的每一句話,都是來自人的話。
第二個(gè)是定向拾音。
機(jī)器上有麥克風(fēng)陣列,當(dāng)我們喚醒時(shí),它會(huì)識(shí)別到主講人的位置在哪里,像貓耳一樣立即轉(zhuǎn)向,精準(zhǔn)地捕捉人聲。
同時(shí),還用降噪的方式消除非人聲的聲音,比如家里的電視機(jī)聲音,或是遠(yuǎn)處的人說話。
2. 音色
天貓精靈學(xué)會(huì)「聽見」之后,接下來就是讓它的音色更像鳥鳥。
這就得益于達(dá)摩院自研的聲學(xué)模型。
過去要定制一個(gè)人的聲音,過程非常復(fù)雜,可能需要去錄音棚里錄20小時(shí)以上的錄音,做大量的人工標(biāo)注,再去做模型的調(diào)優(yōu)和部署。可以說,曾經(jīng)的定制聲音,是以年為周期的。
而且,這么費(fèi)了這么大的人力和物力,出來的聲音依然機(jī)械感明顯,很明顯是機(jī)器人。
而現(xiàn)在,利用達(dá)摩院KANN-TTS的定制化方案,只收集了一小時(shí)左右的有效鳥鳥錄音,而且可以隨時(shí)隨地用手機(jī)去錄。錄完聲音到訓(xùn)練完成,才花了一周左右。
并且,最后出來的聲音自然度和擬人度都讓人驚喜,非常接近鳥鳥本人的音色。
并且接下來,還會(huì)有一個(gè)情緒音色算法,如果鳥鳥愿意,機(jī)器會(huì)發(fā)出激情澎湃的嗓音。
3. 文風(fēng)
音色學(xué)會(huì)了,接下來就是文風(fēng)。
心理學(xué)上有一個(gè)理論,叫做標(biāo)簽效應(yīng)。比如,當(dāng)一個(gè)人被大家貼上內(nèi)向標(biāo)簽的時(shí)候,他可能就會(huì)逐漸變得話少,讓自己的行為和標(biāo)簽一致。
在大模型中,也可以用類似的做法,使用性格標(biāo)簽詞匯,來描述一個(gè)人。
實(shí)驗(yàn)中,出現(xiàn)了一些非常有趣的現(xiàn)象。
當(dāng)設(shè)置模型角色是開朗、幽默的人物時(shí),不僅在對(duì)話的時(shí)候就經(jīng)常會(huì)笑,而且如果問喜歡什么電影,還會(huì)回答是喜劇片。
而貼上抑郁、喪的標(biāo)簽后,模型對(duì)很多事情都喪失了興趣。
當(dāng)模型的標(biāo)簽是溫柔體貼、善解人意時(shí),它在對(duì)話中就會(huì)更多提到家人,比如回答周末想干什么,它會(huì)說我想陪伴家人。
在技術(shù)上,有兩種做法。
第一叫做Plug&Play。這種情況下,大模型本身還是通識(shí)的大模型,但會(huì)通過一個(gè)模塊去判別風(fēng)格,讓它說話更像鳥鳥。
第二種,就是基于大模型做prompt的方式,讓它學(xué)習(xí)不同人格標(biāo)簽的風(fēng)格。
而在訓(xùn)練鳥鳥分鳥時(shí), 就用了脫口秀演員、90后、內(nèi)蒙人、有深度、幽默、內(nèi)向等標(biāo)簽。
4. 對(duì)話
而這個(gè)演示版天貓精靈,和過去的版本有些不一樣,這就涉及到了雙工對(duì)話的差異。
以前,人和機(jī)器的聲音是不能重疊的,人問一個(gè)問題時(shí),機(jī)器會(huì)等待人講完,才會(huì)回復(fù)。機(jī)器回復(fù)時(shí),人也必須等它講完,才能說下一句。
而在全雙工的加持下,機(jī)器就可以和人做雙向的互動(dòng)了。
比如你跟機(jī)器說話時(shí),它會(huì)說「嗯」,「讓我想一想」之類的承接語句。
另外,如果機(jī)器回答的過程中太過話癆,你可以隨意打斷,只要我們一說話,它就會(huì)停下來傾聽。
因?yàn)闀r(shí)延非常低,很接近真人對(duì)話的時(shí)延,是一種更雙向的交互。
給智能助手換個(gè)「腦子」
自從ChatGPT出來之后,各路網(wǎng)友紛紛使出洪荒之力,想把ChatGPT整進(jìn)Siri里。
比如,這位小哥就利用該模型解析人類發(fā)送的命令,然后由Siri代為執(zhí)行,構(gòu)建出一個(gè)無敵的智能家居系統(tǒng)。
「我老婆正在開車回家,預(yù)計(jì)15分鐘到家?!?「好,到時(shí)外面的燈會(huì)為她打開?!?/span>
畢竟相比于ChatGPT,蘋果的Siri、亞馬遜的Alexa等傳統(tǒng)語音助手,確實(shí)是弱爆了。
對(duì)此,微軟CEO納德拉有個(gè)非常形象生動(dòng)的比喻——「笨得像石頭一樣」。
和為了追趕ChatGPT幾乎不顧一切的谷歌不同,亞馬遜并不覺得自己落后了。
十多年前,貝佐斯在亞馬遜總部的白板上興奮地勾勒出他對(duì)Alexa的期待。彼時(shí),亞馬遜創(chuàng)始人還對(duì)語音控制新計(jì)算平臺(tái)有著宏偉的愿景——構(gòu)建一個(gè)星際迷航計(jì)算機(jī),可以對(duì)話、控制飛船、解決數(shù)學(xué)難題。
但現(xiàn)在,愿景顯然已落空。盡管已經(jīng)賣出了數(shù)億臺(tái)內(nèi)置助手的數(shù)字設(shè)備,Alexa仍未達(dá)到亞馬遜創(chuàng)建下一個(gè)科技大平臺(tái)的目標(biāo)。貝佐斯曾不惜一切代價(jià)發(fā)展Alexa,甚至寧愿虧損。
而去年11月問世的寵兒ChatGPT,更顯得Alexa的創(chuàng)新停滯不前。
不過,亞馬遜在用一種很新的方式迎接新時(shí)代。Alexa的語言能力比不上聊天機(jī)器人,聊天機(jī)器人無法控制智能家居設(shè)備,那么,如果二者做一個(gè)結(jié)合呢?
打不過就加入,最近幾個(gè)月,亞馬遜已經(jīng)在與AI初創(chuàng)公司接洽,準(zhǔn)備將類似ChatGPT的技術(shù)整合進(jìn)Alexa。
那么,如果我們直接在「原生」的IoT設(shè)備中,加入類ChatGPT大模型,豈不是更強(qiáng)?
這么看的話,天貓精靈如果能大規(guī)模OTA新的交互系統(tǒng),的確就很超前了。
以人為中心的AI治理
最近,在要不要停止研發(fā)比GPT-4更強(qiáng)的AI這件事上,各路大佬吵得那叫一個(gè)不可開交。
而爭(zhēng)論的焦點(diǎn)就是AI的安全性問題——公開信認(rèn)為,現(xiàn)在沒有任何人可以理解、預(yù)測(cè)、控制這些AI,連它們的創(chuàng)造者都不能。
馬斯克和LeCun直面互懟,可不常見?。☉?zhàn)術(shù)后仰)
其實(shí),造成這一現(xiàn)象的根源就在于:
1. AI的技術(shù)特點(diǎn)使它具備了自己的價(jià)值觀,雖然和人類的不一樣,但早已脫離了技術(shù)中性的范疇;
2. AI的另一個(gè)技術(shù)特點(diǎn)使它成為了社會(huì)的界面,而任何缺乏監(jiān)管的界面基礎(chǔ)設(shè)施都將導(dǎo)致不公平。
問題來了,如果說AI是一個(gè)黑箱,那么我們又該如何判定它是否向善呢?
對(duì)此,來自清華大學(xué)交叉信息學(xué)院的研究者于洋表示,答案就在AI的審計(jì)和治理之中。目前,他的團(tuán)隊(duì)也在與天貓精靈團(tuán)隊(duì)共同合作AI-ESG領(lǐng)域的研究。
目前來說,相關(guān)領(lǐng)域進(jìn)行的研究都是圍繞人來展開的,其目的就是保證人在信息時(shí)代,特別是人工智能時(shí)代能獲得平等和公正的對(duì)待。
為了實(shí)現(xiàn)這一點(diǎn),于洋教授的團(tuán)隊(duì)提出了一種基于因果推斷的AI全生命周期治理審計(jì)方式。
具體來說,團(tuán)隊(duì)經(jīng)過因果推斷的分析方法發(fā)現(xiàn),AI模型實(shí)際上在編碼層,就已經(jīng)將性別、種族這些標(biāo)簽和職業(yè)進(jìn)行了關(guān)聯(lián)。
一些文獻(xiàn)認(rèn)為,如果編碼層不這樣做,AI模型的性能就會(huì)下降。會(huì)出現(xiàn)這種現(xiàn)象的原因在于,目前糾正偏見的方法是,在訓(xùn)練時(shí)的獎(jiǎng)勵(lì)函數(shù)上加一些要求,但凡模型出現(xiàn)偏見就「扇它一耳光」。
與之相對(duì)的,如果我們一開始就告訴它不能把人標(biāo)簽化,那么最終得到的模型,不僅大幅降低了偏見出現(xiàn)的風(fēng)險(xiǎn),而且在部分任務(wù)的性能還有所上升。
歸根結(jié)底,就是如何教育AI的問題——光靠打罵是不行的,還得跟AI講道理。
由此我們不難看出,審計(jì)不僅可以幫助發(fā)現(xiàn)問題,同時(shí)也能夠增強(qiáng)AI的透明性、可解釋性,并改善AI的表現(xiàn)。
那么對(duì)于搭載了大模型的智能終端來說,技術(shù)審計(jì)的重要性也就不言而喻了。畢竟從這個(gè)技術(shù)演示看,有一天如果我們像鳥鳥那樣,擁有自己的一個(gè)獨(dú)特的大模型,也不一定是幻想了。