算法聞到榴蓮臭!Science:AI嗅覺超人類,谷歌繪出50萬氣味圖譜
你想知道,下面這個(gè)分子是什么味道嗎?(文末揭曉)
圖片
8月31日,科學(xué)家在Science上發(fā)文稱,AI模型可以讓機(jī)器擁有比人類具有更好的「嗅覺」。
圖片
論文地址:https://www.science.org/doi/10.1126/science.ade4401
在這篇論文中,研究人員提出了一種由數(shù)據(jù)驅(qū)動(dòng)的人類嗅覺高維圖譜(POM)。這個(gè)圖譜逼真地再現(xiàn)了由單一分子誘發(fā)的氣味感知類別的結(jié)構(gòu)和關(guān)系。
圖片
50萬種氣味顏色都與AI預(yù)測的氣味標(biāo)簽相匹配
研究證明,機(jī)器學(xué)習(xí)模型在理解和描述氣味上,已經(jīng)達(dá)到了人類的水平。
并且,在氣味描述的前瞻性預(yù)測上,AI的準(zhǔn)確度已經(jīng)超過了人類個(gè)體!
這意味著,機(jī)器感知的邊界將進(jìn)一步擴(kuò)大——從視覺、聽覺,再到嗅覺.....
未來的機(jī)器將擁有更多的感知,真正感受和理解自身所處的世界,而不再只是從各種描述中,體驗(yàn)一個(gè)懸空的符號世界。
圖片
而既然AI模型能將分子結(jié)構(gòu)映射到氣味上,它就可以幫我們創(chuàng)造特定的食物口味,或者找到更好的驅(qū)蚊化合物。
空氣中的化學(xué)物質(zhì),如何與大腦的氣味感相連?
人類有大約400個(gè)功能性嗅覺受體。
這些是位于嗅覺神經(jīng)末端的蛋白質(zhì),它們與空氣中的分子連接,將電信號傳輸?shù)叫崆颍╫lfactory bulb)。
嗅覺受體的數(shù)量遠(yuǎn)遠(yuǎn)超過我們用于視覺的4個(gè),甚至是超過味覺的約40個(gè)。
圖片
在嗅覺研究中,究竟是什么物理特性讓空氣傳播的分子在大腦中產(chǎn)生氣味,一直是個(gè)迷。
神經(jīng)科學(xué)的主要目標(biāo)是了解感官是如何將光轉(zhuǎn)化為視覺、將聲音轉(zhuǎn)化為聽覺、將食物轉(zhuǎn)化為味覺以及將質(zhì)地轉(zhuǎn)化為觸覺的。
對于視覺和聽覺,學(xué)界已有了完善的圖譜將物理屬性(如頻率和波長)和感知屬性(如音高和顏色)相關(guān)聯(lián)。
但嗅覺還沒有這樣的圖譜。
如果計(jì)算機(jī)能夠識(shí)別分子的形狀,以及我們最終如何感知?dú)馕吨g的關(guān)系,科學(xué)家就可以利用這一知識(shí)來加深對人類大腦和鼻子如何協(xié)同工作的理解。
為了解決這個(gè)問題,莫奈爾化學(xué)感官中心(Monell Chemical Senses Center)和初創(chuàng)公司Osmo(從谷歌分離出來)共同領(lǐng)導(dǎo)的一個(gè)研究小組,正在研究空氣中的化學(xué)物質(zhì)是如何與大腦中的氣味感知相聯(lián)系。
算法根據(jù)分子結(jié)構(gòu)預(yù)測氣味
分子結(jié)構(gòu)如何才能映射到氣味感知中?
更具體地說,計(jì)算機(jī)是否可以根據(jù)分子結(jié)構(gòu)預(yù)測氣味,以及是否優(yōu)于人類嗅覺的能力。
為了解決這個(gè)問題,Alex Wiltschko博士和團(tuán)隊(duì)創(chuàng)建了一個(gè)機(jī)器學(xué)習(xí)模型——即消息傳遞神經(jīng)網(wǎng)絡(luò)(MPNN)。
這是一種特定的圖神經(jīng)網(wǎng)絡(luò),以學(xué)習(xí)如何將分子氣味的形象化描述與氣味的分子結(jié)構(gòu)相匹配。
圖片
為了繪制分子結(jié)構(gòu)如何與分子氣味相對應(yīng)圖譜,研究人員使用了5000種已知化合物的數(shù)據(jù)集來訓(xùn)練模型。
這些化合物與它們相應(yīng)嗅覺標(biāo)簽配對,比如,果味、花香、芝士味、薄荷味等等。
研究人員結(jié)合了Good Scents and Leffingwell & Associates (GS-LF) 香精香料數(shù)據(jù)庫(圖B),建立了一個(gè)包含約 5000 個(gè)分子的參考數(shù)據(jù)集,每個(gè)分子都有多個(gè)氣味標(biāo)簽(如奶油味、青草味)。
在這個(gè)數(shù)據(jù)集中,數(shù)據(jù)輸入是分子的形狀,輸出是對哪些氣味詞最能描述其氣味的預(yù)測。
GS-LF香精香料數(shù)據(jù)庫數(shù)據(jù)庫
為了訓(xùn)練模型,研究人員使用Adam優(yōu)化了模型參數(shù):將加權(quán)交叉熵?fù)p失超過150個(gè)epoch,學(xué)習(xí)率從5×10衰減 (?4) 到1×10 (?5) ,批大小為128。
此外,GS-LF數(shù)據(jù)集被拆分為80/20訓(xùn)練/測試集,其中80%的訓(xùn)練集進(jìn)一步細(xì)分為五個(gè)交叉驗(yàn)證集。
有了這些交叉驗(yàn)證集,就可以使用Vizier(一種貝葉斯優(yōu)化算法),通過調(diào)整1000次試驗(yàn),來優(yōu)化超參數(shù)。
當(dāng)正確調(diào)整超參數(shù)時(shí),其性能在許多模型體系結(jié)構(gòu)中都是穩(wěn)健的。
經(jīng)驗(yàn)感知空間(圖D)直觀地表示了感知距離(例如,聞起來有茉莉花香味的兩個(gè)分子之間的距離應(yīng)該比聞起來有牛肉味的分子之間的距離近)和層次(例如,茉莉花和薰衣草是花香氣味家族的子類型)。
氣味感知距離和層次
但研究表明,這種結(jié)構(gòu)在基于摩根指紋的氣味空間圖(Morgan fingerprint-based maps)中丟失了(圖E),但POM保留了相對感知距離和層次結(jié)構(gòu)(圖F)。
圖片
對此,Wiltschko表示,「計(jì)算機(jī)已經(jīng)能夠?qū)⒁曈X和聽覺數(shù)字化,但無法將嗅覺數(shù)字化——我們感受世界最深層次的感官,這項(xiàng)研究提出并驗(yàn)證了一種新的數(shù)據(jù)驅(qū)動(dòng)的人類嗅覺圖譜,將化學(xué)結(jié)構(gòu)與氣味感知相匹配?!?/span>
大蒜和臭氧,是什么味道?
為了確定這個(gè)模型的有效性(能否擴(kuò)展到新的氣味上),莫內(nèi)爾大學(xué)的研究人員進(jìn)行了一個(gè)盲驗(yàn)證過程。
在這個(gè)過程中,一組訓(xùn)練有素的研究參與者會(huì)描述新分子,然后他們的答案會(huì)與模型的描述進(jìn)行比較。
15名小組成員每人會(huì)被要求聞400種氣味,并且接受了訓(xùn)練,用55個(gè)單詞(從薄荷到霉味)來描述每種分子。
共同一作Emily Mayhew博士表示:我們對這個(gè)模型非常有信心。
Mayhew在莫奈爾讀博期間,參與了這項(xiàng)研究。她現(xiàn)在是密歇根州立大學(xué)的助理教授。另一位共同一作是Brian K. Lee博士,來自谷歌團(tuán)隊(duì)。
為了教會(huì)被試們識(shí)別氣味、選擇最合適的詞來描述自己的感覺,莫奈爾團(tuán)隊(duì)專門設(shè)計(jì)了一個(gè)氣味參考工具包。
這是因?yàn)椋谶^去的研究中,很多被試會(huì)犯一些常見錯(cuò)誤,比如將霉味和麝香混為一談。
被試會(huì)被要求從55個(gè)選項(xiàng)中,選擇最適用的描述術(shù)語,并且對400種氣味中的每一種,用1到5分來打分,來評定這個(gè)術(shù)語在多大程度上適合于這個(gè)氣味。
一位專家組成員,就將以前未定性的氣味劑2,3-二氫苯并呋喃-5-甲醛的氣味,評為粉末狀,有點(diǎn)腥臭。
在人類嗅覺和AI模型最終pk中,質(zhì)量控制也非常重要。
這就輪到英國Reading大學(xué)的風(fēng)味化學(xué)教授Jane Parker出場了。
她的團(tuán)隊(duì)驗(yàn)證了用于測試模型預(yù)測的樣品的純度。
首先,他們用氣相色譜法,分離出樣品中的每種化合物,包括任何雜質(zhì)。
接下來,團(tuán)隊(duì)成員會(huì)分別聞嗅每種分離出的化合物,以確定是否有雜質(zhì)壓倒了目標(biāo)分子的已知?dú)馕丁?/span>
Parker說:「在測試的50個(gè)樣品中,我們確實(shí)發(fā)現(xiàn)了一些含有明顯雜質(zhì)的樣品?!?/span>
比如,在某個(gè)案例中,雜質(zhì)來自合成目標(biāo)分子時(shí)使用的試劑的痕跡,并賦予樣品一種獨(dú)特的黃油氣味,超過了感興趣的氣味?!冈谶@種情況下,我們能夠解釋為什么小組對氣味的描述與人工智能的預(yù)測不同。」
這種雜質(zhì)來自于合成目標(biāo)分子時(shí)使用的一種試劑,它使樣品散發(fā)出一種獨(dú)特的奶油味,這種奶油味就蓋過了相關(guān)氣味物質(zhì)的氣味。
「在這種情況下,我們就明白為什么專家組成員對氣味的描述與AI的預(yù)測不同?!?/span>
AI嗅覺,趕超人類
研究人員將模型與個(gè)人小組成員的表現(xiàn)進(jìn)行比較時(shí),除了雜質(zhì),該模型對小組氣味評級平均值的預(yù)測比研究中的任何一個(gè)小組成員都要好。
具體來說,在53%的測試分子中,該模型的表現(xiàn)都優(yōu)于小組成員的平均值。
圖片
GNN模型的總體表現(xiàn)達(dá)到了人類水平,但它在不同感知和化學(xué)類別中的表現(xiàn)如何呢?
研究人員按氣味標(biāo)簽對其性能進(jìn)行分類時(shí),除麝香外,該模型在所有標(biāo)簽上的表現(xiàn)都在人類評分者的分布范圍之內(nèi),并且在30/55個(gè)標(biāo)簽上的表現(xiàn)超過了小組成員的中位數(shù)(55%)。
按標(biāo)簽劃分的結(jié)果表明,GNN模型優(yōu)于之前在相同數(shù)據(jù)上訓(xùn)練的最先進(jìn)模型。
模型性能在結(jié)構(gòu)類和感知類中都很穩(wěn)健
對特定標(biāo)簽的預(yù)測性能,取決于該標(biāo)簽的結(jié)構(gòu)-氣味映射的復(fù)雜程度。
因此不難理解,模型在大蒜和腥味等具有明確結(jié)構(gòu)決定因素(大蒜為含硫;腥味為胺)的標(biāo)簽上表現(xiàn)最佳,而在麝香標(biāo)簽上表現(xiàn)最差,因?yàn)轺晗銟?biāo)簽至少包括五種不同的結(jié)構(gòu)類別(大環(huán)、多環(huán)、硝基、甾體類型和直鏈)。
相比之下,小組成員對特定標(biāo)簽的表現(xiàn)取決于他們對該標(biāo)簽在氣味背景下的熟悉程度。
因此,小組成員中對堅(jiān)果、大蒜和芝士等描述常見食物氣味的標(biāo)簽的一致性很強(qiáng),而對麝香和干草等標(biāo)簽的一致性較弱。
模型的性能還取決于特定標(biāo)簽的訓(xùn)練示例數(shù)量。有了足夠的示例,模型甚至可以學(xué)習(xí)到復(fù)雜的結(jié)構(gòu)與感知之間的關(guān)系。
一般來說,對于訓(xùn)練示例較多的標(biāo)簽(如果味、甜味、花香),模型性能較高(圖B),但對于訓(xùn)練示例較少的標(biāo)簽,模型性能要么較高(如腥味、樟腦味、涼意),要么較低(如臭氧、尖銳、發(fā)酵)。
同樣,模型性能也受到面板測試-重復(fù)相關(guān)性的限制。
圖片
按化學(xué)類別(如酯類、酚類、胺類)進(jìn)行分類時(shí),專家小組和模型的表現(xiàn)相對一致(圖C),其中含硫分子的專家小組和模型表現(xiàn)最強(qiáng)。
此外,模型在不同嗅覺任務(wù)中的表現(xiàn)依然出色。甚至能在沒有經(jīng)過訓(xùn)練的嗅覺任務(wù)上也取得成功。
圖片
并且,該模型能夠識(shí)別出幾十對結(jié)構(gòu)不同但氣味卻非常相似的分子,還能描述潛在氣味分子的各種氣味特性,如氣味強(qiáng)度。
而通過模型可以直接計(jì)算出分子在POM中的坐標(biāo)(圖A),研究人員根據(jù)這些坐標(biāo)編制出了大約50萬種潛在的氣味!
圖片
這個(gè)數(shù)量遠(yuǎn)遠(yuǎn)超出了目前氣味目錄所涵蓋的空間(約5000種可購買的、有特征的氣味物質(zhì))。
這些分子需要訓(xùn)練有素的人類小組成員花費(fèi)約70人/年的連續(xù)嗅覺時(shí)間才能收集到。
最后,解答下開篇中提到分子味道,其實(shí)是榴蓮的臭味分子。
參考資料:https://www.science.org/doi/10.1126/science.ade4401