Facebook創(chuàng)造了兩個(gè)會(huì)交流的神經(jīng)網(wǎng)絡(luò)來(lái)描述顏色
你想過(guò)你是如何描述一個(gè)顏色的嗎?最新研究表明人類使用離散符號(hào)來(lái)記錄一個(gè)區(qū)域的顏色,在細(xì)化顏色過(guò)程中又增添其他信息。這背后有什么道理嗎?Facebook用兩個(gè)神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)現(xiàn)象告訴你。
盡管人類世界擁有數(shù)千種語(yǔ)言,但是使用詞語(yǔ)來(lái)表示不同顏色的方式是非常一致的。
例如,許多語(yǔ)言有兩個(gè)截然不同的單詞表示紅色和橙色,但沒(méi)有一種語(yǔ)言有許多截然不同的常用單詞表示橙色的各種調(diào)性(橘子的橙色和橘子的橙色)。
比如這么多口紅色號(hào),如果每一個(gè)都分配一個(gè)獨(dú)特的顏色名稱,那可能記憶起來(lái)會(huì)十分吃力。
語(yǔ)言學(xué)研究人員利用數(shù)學(xué)工具表明,顏色名稱的這種一致性是因?yàn)槿祟悆?yōu)化語(yǔ)言是為了平衡精確交流的需要和最小化記憶需要。
如果使用額外的顏色詞會(huì)增加復(fù)雜性,但不會(huì)顯著改善人們之間的溝通能力。
Facebook 最近的AI研究表明,當(dāng)兩個(gè)人工神經(jīng)網(wǎng)絡(luò)被要求創(chuàng)造一種方式來(lái)互相交流他們看到的顏色時(shí),AI也會(huì)像人一樣平衡復(fù)雜性和準(zhǔn)確性。
除此之外,F(xiàn)acebook研究團(tuán)隊(duì)還發(fā)現(xiàn)為了準(zhǔn)確描述連續(xù)的顏色空間,只有使用離散的「顏色語(yǔ)言」才可以。
這就引出了一個(gè)關(guān)于如何交流的有趣的推測(cè)。是不是「離散」的符號(hào)語(yǔ)言更適合交流,而不是動(dòng)物類的「連續(xù)」叫聲?
模型實(shí)現(xiàn)過(guò)程
首先建立兩個(gè)神經(jīng)網(wǎng)絡(luò),一個(gè)負(fù)責(zé)說(shuō)(speaker)和一個(gè)負(fù)責(zé)聽(listener),并建立一個(gè)「溝通游戲」:在游戲的每一輪中,speaker從一個(gè)連續(xù)的顏色空間中看到一個(gè)顏色,然后輸出一個(gè)符號(hào)(可以被認(rèn)為是一個(gè)「單詞」)。listener可能看到相同或不同的顏色,作為噪聲輸入。

listener接收到由speaker輸出的單詞,然后嘗試輸出正確的顏色片段。最初,說(shuō)話人隨機(jī)生成單詞,等到訓(xùn)練結(jié)束時(shí),每個(gè)單詞都代表了顏色空間的一個(gè)連續(xù)部分。
研究團(tuán)隊(duì)多次重復(fù)這個(gè)實(shí)驗(yàn),同時(shí)通過(guò)使目標(biāo)顏色和噪聲顏色的相似度發(fā)生變化,以此來(lái)改變?nèi)蝿?wù)的難度。這些變化產(chǎn)生了許多不同的顏色命名「詞匯表」。
在訓(xùn)練結(jié)束時(shí),研究人員分析了這些詞匯,發(fā)現(xiàn)AI生成的的顏色詞與人類語(yǔ)言的性質(zhì)相似。此外,這兩種類型的語(yǔ)言都接近于正式定義復(fù)雜性和準(zhǔn)確性之間可能的最佳平衡集合的邊界(圖中的黑線)。

在后續(xù)實(shí)驗(yàn)中,研究人員發(fā)現(xiàn),至關(guān)重要的是,當(dāng)允許神經(jīng)網(wǎng)絡(luò)使用連續(xù)的符號(hào)而不是離散的符號(hào)進(jìn)行交流時(shí),復(fù)雜性和準(zhǔn)確性之間的最佳平衡就不復(fù)存在了。
兩個(gè)神經(jīng)網(wǎng)絡(luò)雖然仍然可以通信,但是他們的交流效率變得很低。
語(yǔ)言也許是人類最獨(dú)特的特征,我們?cè)谌粘V薪?jīng)常使用,但卻不了解它。
Facebook的研究表明,先進(jìn)的人工智能模型,不僅對(duì)實(shí)際應(yīng)用有用,而且還可以作為實(shí)驗(yàn)工具,回答有關(guān)人類語(yǔ)言(以及一般認(rèn)知)的科學(xué)問(wèn)題。