谷歌知識圖譜十年發(fā)展史
譯文2018年,Gartner首次宣布知識圖譜是一項(xiàng)新興技術(shù);1996年的資源描述框架(一種為標(biāo)準(zhǔn)的主-動-賓語義掃清道路的圖譜數(shù)據(jù)模型)問世整整26年后,知識圖譜才到達(dá)成熟度曲線的頂峰。
10年前,谷歌(現(xiàn)在是控股公司Alphabet的子公司)提及了“知識圖譜”(knowledge graph)這個(gè)術(shù)語,并籠統(tǒng)地描述了其知識圖譜是如何工作的。
而20年前,Tim Berners-Lee、James Hendler和Ora Lassila發(fā)表了他們的第一篇文章來描述他們設(shè)想的語義Web。許多知識圖譜是使用W3C隨后在至少10年前實(shí)施的語義標(biāo)準(zhǔn)來構(gòu)建的。
想想此后發(fā)生的事情蠻有意思。在過去這十年,Alphabet逐漸發(fā)展成為全球市值(已發(fā)行股票的總價(jià)值)超過1萬億美元的六大公司之一。
下面是2022年初Alphabet在市值方面與最接近的IT公司相比的排名:
這些市值領(lǐng)先者在知識圖譜方面有何作為?
我做了一些案頭研究,分析圖中所示的這些公司中哪些在過去十年致力于開發(fā)知識圖譜:
?蘋果在2010年收購了從斯坦福研究院(SRI)的項(xiàng)目派生而來的Siri。Tom Gruber是SRI團(tuán)隊(duì)的聯(lián)合創(chuàng)始人。作為人在回路AI領(lǐng)域的先驅(qū),Gruber于1993年在SRI發(fā)表了關(guān)于知識共享本體(ontology)設(shè)計(jì)的成果。后來在2019年,蘋果的工作記錄描述了其知識圖譜工程團(tuán)隊(duì)的工作,描述如下:
Aaron Bradley通過Twitter提供,2019年1月19日
?微軟亞洲研究院在2010年開發(fā)出了Trinity分布式圖譜存儲,并在2013年的一篇論文中發(fā)表了其內(nèi)存中RDF圖譜功能。多年來,Satori一直是微軟版的知識/事實(shí)圖譜,類似谷歌知識圖譜。微軟學(xué)術(shù)知識圖譜(MAKG)出現(xiàn)在2019年前后。該公司在2022年的一份數(shù)據(jù)和分析科學(xué)家空缺職位要求中提到,推動“商業(yè)知識圖譜模型和算法的創(chuàng)新”是該職位的一項(xiàng)要求。
?多年來,亞馬遜似乎對招聘本體專業(yè)人員猶豫不決,但在2010年代后期著手開發(fā)產(chǎn)品知識圖譜。Alexa對話式助手基于知識圖譜,Alexa的含義表示語言(MRL)基于圖譜,一篇關(guān)于該主題的論文在2016年發(fā)表。來自捷克技術(shù)大學(xué)的Alquist團(tuán)隊(duì)因?qū)υ捠街R圖譜獲得了第四屆年度Alexa大獎(jiǎng),該知識圖譜是2020年Alquist 3.0智能助手的基礎(chǔ)。
?Meta(Facebook)在2013年3月宣布了Facebook Graph,到2013年6月將其提供給 Facebook的所有美國英語用戶。該圖譜含有當(dāng)時(shí)十億不同F(xiàn)acebook用戶的信息。Graph在2022年繼續(xù)提供給用戶使用。
?Alphabet(谷歌)在2012年宣布了其知識圖譜,員工隊(duì)伍中繼續(xù)擁有語義標(biāo)準(zhǔn)方面有經(jīng)驗(yàn)的本體專業(yè)人員和數(shù)據(jù)架構(gòu)師。
?特斯拉——我還沒有發(fā)現(xiàn)表明特斯拉在使用知識圖譜的任何證據(jù)。
谷歌早期的知識圖譜
這里展示了一張谷歌用來描述其知識圖譜的插圖。這是一張有向圖,上面有命名實(shí)體(達(dá)芬奇、蒙娜麗莎和盧浮宮)以及顯示實(shí)體之間關(guān)系的命名關(guān)系。
該圖表明了可以開發(fā)的上下文片段,并將Tinker Toy風(fēng)格連接到另一個(gè)兼容的語義圖,這是一種深度集成的過程,比鏈接關(guān)系表簡單得多、可擴(kuò)展性強(qiáng)得多。為了減少獲取信息的點(diǎn)擊次數(shù),谷歌隨后使用選擇的一些達(dá)芬奇片段來填充知識面板,內(nèi)容直接顯示在結(jié)果頁面上。到2016年,谷歌上每月有1000億次搜索結(jié)果,其中三分之一都附有知識面板。
谷歌搜索結(jié)果頁面通常很快就能響應(yīng)返回結(jié)果,而且搜索引擎及算法會確保你對這些檢索結(jié)果是否感興趣。
2020年代的知識圖譜
快進(jìn)到2020年。Gartner隨后在其《人工智能成熟度曲線》中將知識圖譜繪在靠近期望膨脹期頂峰的位置。
2018年,Gartner首次宣布知識圖譜是一項(xiàng)新興技術(shù);1996年的資源描述框架(一種為標(biāo)準(zhǔn)的主-動-賓語義掃清道路的圖譜數(shù)據(jù)模型)問世整整26年后,知識圖譜才到達(dá)成熟度曲線的頂峰。
當(dāng)然,值得注意的是,神經(jīng)網(wǎng)絡(luò)背后的理論可以追溯到1873年,而針對AI中的神經(jīng)網(wǎng)絡(luò)的具體研究重點(diǎn)是從1943年開始的。但直到1990年代,計(jì)算、網(wǎng)絡(luò)和存儲才取得長足發(fā)展,神經(jīng)網(wǎng)絡(luò)才站穩(wěn)腳跟。許多AI專家表示,今天的神經(jīng)網(wǎng)絡(luò)算法與“AI”剛剛起步時(shí)開發(fā)的算法有短暫的相似之處。
緩慢發(fā)展的技術(shù)可能最有影響力
其他許多企業(yè)在各自實(shí)施的知識圖譜方面取得了重大進(jìn)展。在2月28日至3月1日,Semantic Arts舉辦了首次企業(yè)數(shù)據(jù)轉(zhuǎn)換和知識圖譜采用線上活動。部分演講嘉賓包括如下:
?Montefiore 醫(yī)院的Parsa Mirhaji
?西門子的Thomas Hubauer
?阿斯利康的Ben Gardner和Colin Wood
?宜家的Katarinna Kari
?斯沃琪集團(tuán)的Peter Hutzli
現(xiàn)在說知識圖譜已經(jīng)成為主流還為時(shí)過早,但很明顯,越來越多的《財(cái)富》全球1000強(qiáng)公司正在針對許多不同的用途采用該技術(shù)。
原文標(biāo)題:Ten years of Google Knowledge Graph
作者:Alan Morrison
文章來源:https://www.datasciencecentral.com/ten-years-of-google-knowledge-graph/