AI有鼻子了,還能遠程傳輸氣味,圖像生成香水
眾所周知,圖像、音樂能用 AI 生成,但出乎意料的是,氣味也行。
最近,一個名叫 Osmo 的初創(chuàng)公司宣布,他們成功地將氣味數(shù)字化了。第一個成功的案例是「新鮮的夏季李子」,而且復現(xiàn)出的味道「聞起來」很不錯。整個過程依靠 AI 技術來完成,不需要人工干預。有了這項技術,你就可以像下載音樂一樣下載香水了。
這個發(fā)帖的 Alex Wiltschko 是 Osmo 的 CEO 和聯(lián)合創(chuàng)始人?!笇馕稊?shù)字化」進而「生成氣味」最初只是他在谷歌工作期間的一個研究項目。但在 2022 年,他在 Lux Capital 和谷歌風投的支持下,將其作為一家獨立的初創(chuàng)公司推出。
「我一直熱衷于了解氣味。它是一種非常強大的情緒感官,但我們對它卻知之甚少」Wiltschko 在接受 CNBC 采訪時說。
在復刻出李子的香味后,Wiltschko 非常激動,「帶著這個香味去了很多地方」。
至于這項研究的用途,Osmo 的官方說法是「改善人類的健康和幸?!梗驗樾嵊X數(shù)字化對幫助醫(yī)療人員檢測、治療疾病至關重要。比如,醫(yī)生可以用氣味來觸發(fā)患者記憶或減輕焦慮。
此外,它還有可能在 VR 游戲、電影中發(fā)揮作用,增加 VR 設備的沉浸感。
或者,你還可以用這項技術來留住親人的氣味,但「按月付費」就有點諷刺了。
當然,這些都是長期愿景。在近期,Wiltschko 希望 Osmo 能制造出更安全、更可持續(xù)的香味分子,用于香水、洗發(fā)水、驅蟲劑和洗衣粉等日常用品中的香料。
用數(shù)千個香氣分子訓練 AI 模型
Osmo 的官網(wǎng)上簡單列出了他們的研發(fā)歷史:
0. 在 Osmo 建立之前,Alex Wiltschko 在谷歌研究院領導著這個團隊,他們使用先進的機器學習技術構建了 Osmo 氣味映射圖的基礎。
1. 取得了一項重大突破,可使用圖神經(jīng)網(wǎng)絡根據(jù)分子結構預測其氣味。
2. 創(chuàng)造了以前從未聞過的新分子并以超越人類的準確度進行了預測。
3. 設計出了蚊子覺得難聞的氣味分子(例如驅蟲劑),并且在人體試驗中比避蚊胺(DEET)更有效。
而要更具體地了解 Osmo 的研發(fā)歷程,我們還要從 Wiltschko 的早期經(jīng)歷說起。
Wiltschko 2009 年在密歇根大學獲得了神經(jīng)科學學士學位,并在哈佛大學學習嗅覺神經(jīng)科學,于 2016 年獲得博士學位。
第二年,他成為谷歌研究院的一名研究科學家,在那里,他花了五年時間領導一個團隊,利用機器學習幫助計算機根據(jù)分子結構預測不同分子的氣味,并使用機器學習軟件開發(fā)了 「主要氣味映射圖(principal odor map/POM)」。
這項研究發(fā)表在 2023 年 9 月的《科學》雜志上。據(jù)介紹,POM 坐標可以用于預測氣味強度和感知相似性,即使這些感知特征并非模型訓練的顯式組成部分。這些結果已被用于構建多種嗅覺預測模型 —— 即使沒有微調,其表現(xiàn)也優(yōu)于以前的特征集。
來自 Science
為了構建這個氣味地圖,他的團隊在一個包含 5000 個芳香分子的數(shù)據(jù)集上訓練他們的 AI 模型,這些芳香分子涵蓋了各種氣味類別,如花香、果香或薄荷味。
Wiltschko 發(fā)現(xiàn),由于分子結構復雜,計算機在分析分子時可能會比較棘手 —— 只要移動一個分子鍵,分子的氣味就可能從玫瑰變成臭雞蛋。
但得益于人工智能技術的進步,該模型能夠捕捉到分子不同結構中的模式,并利用這些知識準確預測其他分子的氣味。
值得一提的是,用來訓練模型的數(shù)據(jù)集確實來之不易。
Wiltschko 說,大型語言模型可以通過「整個互聯(lián)網(wǎng)」的數(shù)據(jù)進行訓練,但當他們開始構建人工智能模型時,還沒有類似的氣味信息數(shù)字圖書館。
所以,他們花了大約一年的時間與香水行業(yè)的公司合作。起初,他們以為這些公司會有很棒的數(shù)據(jù)集,但事實并非如此。
這促使 Wiltschko 和他的團隊創(chuàng)建了「一種新的數(shù)據(jù)」。
為此,他們收集了數(shù)千種分子以及調香大師對其氣味的描述。然后,他們將這些數(shù)據(jù)輸入圖神經(jīng)網(wǎng)絡(GNN),該網(wǎng)絡屬于機器學習的范疇,使用強大的算法來檢測和分析數(shù)據(jù)點之間的關系。
Wiltschko 說,他的團隊可以使用 GNN 來幫助 AI 模型理解原子、連接它們的鍵以及分子結構如何決定其氣味。
氣味數(shù)字化大有用途
氣味數(shù)字化可以開拓出前所未有的應用場景,最基礎的就是氣味的遠程傳輸。Wiltschko 表示,Osmo 希望最終能夠利用自己的技術,將一個地方的氣味數(shù)字化,然后在另一個地方再造一個完全相同的副本,從而實現(xiàn)氣味的遠程傳送。
事實上,該公司最新更新的博客表示,他們已經(jīng)成功了。
具體來說,選擇一種要傳輸?shù)臍馕?,并將其放入一臺 GCMS(氣相色譜 - 質譜)機。如果該氣味的來源是液體,就直接注入;如果是固體樣品(比如李子),就使用頂空分析,也就是將氣味困在物體周圍的空氣中,并通過管子吸收。
GCMS 會識別原始數(shù)據(jù)(可以視為分子),并將其上傳到云。在那里,它會成為主要氣味映射圖上的坐標 —— 這是一種新穎、先進的人工智能驅動工具,可以預測特定分子組合的氣味。
然后,這個配方會被發(fā)送到一臺配方機器人,它會基于該配方來混合不同的氣味,從而復現(xiàn)樣品的氣味。
在另一項成果展示中,Osmo 表示他們使用 AI 發(fā)現(xiàn)了前所未「嗅」的配方,并且他們一口氣向歐美市場發(fā)布了三種前有未有的香水氣味分子。他們將之分別命名為 Glossine、Fractaline、Quasarine。他們還為這三種香水氣味編寫了美妙的描述。舉個例子,對于 Glossine,他們寫到:「一種充滿活力的花香,讓人聯(lián)想到茉莉花,后調和中調散發(fā)出耀眼的亮澤。這種迷人的分子可為之前的任何香水增添耀眼的拉斯維加斯式光彩?!?/span>
此外,Osmo 也在研究多模態(tài) AI,具體來說,他們研究的是基于圖像生成對應的氣味,當然圖像又可以進一步基于文本而生成。下面演示了一個案例:
可以看到,用戶只需輸入文本提示詞,AI 就會幫助你生成圖像(用戶也可直接上傳圖像),然后再進一步為你生成分子配方。當然,如果你還想親身聞到這些氣味,還需要相應的設備。
事實上,他們已經(jīng)在線發(fā)布了這款工具 Inspire,目前支持文本和圖像輸入,但他們也表示未來還會支持音樂、PDF、幻燈片和視頻輸入。感興趣的讀者可以注冊嘗試一下:https://inspire.osmo.ai/landing
這項技術背后彰顯著無限的可能性。舉個最明顯的例子,也許未來我們還能觀看帶有氣味的電影,實現(xiàn)視覺、聽覺和嗅覺的全方位體驗 —— 這或許能給那些風景如花的電影變得更加好看以及好聞。
這個節(jié)目看起來一定很香
最后,Wiltschko 表示 Osmo 還有一項長期目標,即利用這項技術幫助更早地識別疾病。也許未來,我們在體檢時會有一個 AI 通過它的機器鼻子來判斷我們的健康狀況。