馬斯克點贊SpaceX天才實習(xí)生:課余用AI破解上古卷軸,獲Nature頭版關(guān)注
Nature官網(wǎng)頭版,最新刊發(fā)的是最新考古成果,轟動全球的成果——
時隔2000年,上古卷軸(赫庫蘭尼姆卷軸)的神秘面紗,終于被揭開!
而且,這項研究還是AI完成的,背后的背后則是一名年僅21歲的天才少年,馬斯克點贊的SpaceX實習(xí)生。
不同于一般的密碼破解,分析這份卷軸之難,無異于解讀一本“無字天書”——
因為在公元79年,這組卷軸在一次火山爆發(fā)中被燒成了碳,1752年才被挖掘出土。只要稍有不慎,脆弱的卷軸就會分分鐘變成殘片,想要通過物理方式展開,難如登天。
直到今時今日,三名大學(xué)生,終于借助AI的力量,成功破譯了其中的段落,打開了全新的考古研究范式。
他們通過給卷軸拍攝CT影像并借助機(jī)器學(xué)習(xí)技術(shù)分割識別,把卷軸中的2000余個字符,揭示開來。
這一消息也迅速引發(fā)了全球轟動,目前為止,瀏覽量已經(jīng)超過了1500萬次,轉(zhuǎn)評贊接近6萬。
馬斯克也給三人團(tuán)隊點了贊,表示這實在是泰褲辣。
DeepMind的創(chuàng)始人Demis也大為贊嘆,還表示自己已經(jīng)迫不及待地想要讀一讀這段神秘的文字了。
那么,這份神秘的卷軸是如何一步步被破譯的呢?
不用打開,也能破譯內(nèi)容
交出這份成果的,是三名學(xué)生組成的隊伍,他們分別是:
- Youssef Nader,來自埃及,在德國柏林的一家院校攻讀博士
- Luke Farritor,SpaceX 實習(xí)生,在內(nèi)布拉斯加大學(xué)林肯分校計算機(jī)專業(yè)讀本科
- Julian Schilliger,瑞士蘇黎世聯(lián)邦理工學(xué)院機(jī)器人專業(yè)碩士
想要在沒有損傷的前提下破譯這團(tuán)被燒成碳的卷軸,打開看幾乎是不可能的。
1865年,有人嘗試用物理方式把卷軸打開,結(jié)果以失敗告終,一部分卷軸直接成為了碎片。
此后近兩百年,便再也沒有人敢嘗試物理展開了。
直到2019年,肯塔基大學(xué)EduceLab的Brent Seales教授通過粒子加速器給卷軸拍攝了分辨率高達(dá)4μm的三維CT影像。
Seales教授的博士生Stephen Parsons長期致力于使用機(jī)器學(xué)習(xí)模型檢測CT圖像中的墨水,他利用已經(jīng)展開的部分帶有可見墨水的卷軸碎片,建立了一個ground-truth數(shù)據(jù)集。
網(wǎng)友們對此事展開了熱烈討論,并通過一場播客中傳到了Luke的耳朵。
這引起了他極大興趣,開始利用空余時間訓(xùn)練機(jī)器學(xué)習(xí)模型,以便對墨跡進(jìn)行分析。
最終,Luke的模型成功分析出了卷軸中肉眼不可見的符號,并發(fā)現(xiàn)了一個完整的單詞。
這個詞是希臘語的“ΠΟΡΦΥΡΑ?”(小寫:πορφυ?ρ?α??,拉丁轉(zhuǎn)寫:porphyras),意思與“紫色”相關(guān)。
這一發(fā)現(xiàn),讓他成為歷史上第一個從赫庫蘭尼姆古卷內(nèi)部讀出整個單詞的人。
Youssef是第二個破譯出這個單詞的人,他采用了不同的方法,但得到了內(nèi)容相同且更為清晰的結(jié)果。
也正是看到Y(jié)oussef提交的結(jié)果之后,專家們對Luke的發(fā)現(xiàn),更加確認(rèn)了。
Julian則參與研發(fā)了EduceLab的3D模型分割工具Volume Cartographer。
Volume Cartographer將三維CT圖像沿卷軸展開,并映射到了二維平面,為Luke和Youssef的破譯工作奠定了基礎(chǔ)。
此后,Julian又提出了新的分割方法ThaumatoAnakalyptor,通過重新分割的方式對已破解區(qū)域進(jìn)行了驗證,并探索了更多未知片段。
此后,為了更快破譯出更多內(nèi)容,三人組成了超級團(tuán)隊,最終成功解讀出了2000多個字符。
他們使用了三種不同模型架構(gòu)進(jìn)行了分析,之間的結(jié)果可以相互印證,墨水檢測程序代碼還直接在GitHub上做了開源。
他們分析出的這兩千多個字符,位于其中一卷的結(jié)尾,篇幅大約是該卷的5%,內(nèi)容被認(rèn)為與伊壁鳩魯哲學(xué)有關(guān)。伊壁鳩魯(Epicurus)是古希臘哲學(xué)家,主要關(guān)注個人的幸福和心靈的平靜,但講理性、在自然科學(xué)領(lǐng)域提出了原子論,對后世的倫理學(xué)和心理學(xué)發(fā)展都產(chǎn)生了重要影響。
而在這個卷軸的兩個連續(xù)片段中,作者提及了商品(例如食物)的可獲得性(availability)是否以及如何影響它們能帶來的快樂(pleasure)。
所以這次考古發(fā)現(xiàn),實際上或許能進(jìn)一步幫助了解古人對于世界的認(rèn)知和探究。
一場挑戰(zhàn)賽,三名學(xué)生,500萬獎金
而讓這三名學(xué)生走到一起的,是一場名為“維蘇威火山”的挑戰(zhàn)賽。
在Stephen建立了數(shù)據(jù)集之后,硅谷企業(yè)家、GitHub前CEONat Friedman對此產(chǎn)生了濃厚興趣,并出資贊助了這場比賽。
主辦方于去年3月公布了評選標(biāo)準(zhǔn),參賽者需要破譯至少4個段落,每個段落140個字符,其中至少85%的字符可恢復(fù)。
當(dāng)時,專家組普遍認(rèn)為一年之內(nèi)有人挑戰(zhàn)成功的概率還不到三成,但結(jié)果卻出乎意料——
據(jù)介紹,比賽的消息發(fā)布后他們收到了許多作品,直到ddl之前幾分鐘還有團(tuán)隊交出成果。
經(jīng)過為期一個月的審查,這份包含了2000個字符的文本,被認(rèn)定破譯成功。
這三位獲獎?wù)邔⒐戏?0萬美元的獎金,折合人民幣500多萬。
此外,還有三個團(tuán)隊因提交的結(jié)果具有顯著可讀性,獲得了二等獎,這三個團(tuán)隊將各獲得5萬美元的獎勵。
其中就包括谷歌華人工程師Shao-Qian Mah所帶領(lǐng)的團(tuán)隊。
下一步,比賽主辦方希望在一年的時間內(nèi)破譯四組卷軸的90%,后續(xù)比賽信息也將在3月份公布。
當(dāng)然,這樣的挑戰(zhàn)賽獎金只是一方面,更重要的是展現(xiàn)了如何用AI解決各行各業(yè)挑戰(zhàn)的可能性和可行性,包括考古這樣的學(xué)科。
或許你也有所耳聞,更早之前,AI對于甲骨文的研究也開始了。你要還知道其他的項目?也歡迎分享分享~~
參考鏈接:
[1]https://scrollprize.org/grandprize。
[2]https://twitter.com/natfriedman/status/1754519304471814555。