別只看LLM!為什么知識圖譜才是通往AGI的關(guān)鍵一步
智能時代,我們已經(jīng)習(xí)慣讓AI為我們提供各種服務(wù)。
當(dāng)你問DeepSeek:"北京的天氣怎么樣"時,它能精準(zhǔn)回答;當(dāng)你讓ChatGPT"用簡單語言解釋相對論",它能流暢作答...
這些AI能力的背后,除了神經(jīng)網(wǎng)絡(luò)的感知能力,還有一個關(guān)鍵支撐技術(shù)——知識圖譜。
知識圖譜:機器的認(rèn)知地圖
知識圖譜本質(zhì)上是用關(guān)聯(lián)圖的方式表示現(xiàn)實世界中的事物和關(guān)系
。
例如你翻開一本百科全書,里面的知識點彼此孤立。知識圖譜則將這些知識點通過關(guān)系連接起來,形成網(wǎng)狀結(jié)構(gòu)
。
在知識圖譜中,節(jié)點代表實體
(如中國、北京、人口),邊代表關(guān)系
(如"首都是"、"擁有")。
這種結(jié)構(gòu)讓AI不僅知道獨立的事實,還能理解事物間的聯(lián)系。當(dāng)你問"中國的首都是哪里"時,AI能通過知識圖譜直接找到答案;當(dāng)你進一步詢問"北京的人口多少"時,AI可以順著關(guān)系網(wǎng)絡(luò)
找到相關(guān)信息
。
知識圖譜由三元組構(gòu)成:實體-關(guān)系-實體。這種結(jié)構(gòu)與人類認(rèn)知方式相近,讓機器能更自然地理解世界。與傳統(tǒng)數(shù)據(jù)庫的表格存儲不同,知識圖譜將信息組織成網(wǎng)絡(luò),便于推理和發(fā)現(xiàn)隱含關(guān)系。
當(dāng)我們說"AI擁有知識
"時,實際上是指AI能夠訪問和利用知識圖譜中儲存的結(jié)構(gòu)化信息。這些信息經(jīng)過精心組織,使AI能夠進行類似人類的思考過程。
構(gòu)建AI的知識架構(gòu)
構(gòu)建知識圖譜如同為AI打造一張認(rèn)知地圖。這個過程涉及多個環(huán)節(jié):數(shù)據(jù)收集、數(shù)據(jù)清洗、結(jié)構(gòu)設(shè)計、圖譜構(gòu)建、圖計算和應(yīng)用部署
。
數(shù)據(jù)是知識圖譜的基礎(chǔ)
。在金融風(fēng)控領(lǐng)域,我們需要收集客戶手機號、銀行卡、設(shè)備信息、單位數(shù)據(jù)、位置信息等多維度數(shù)據(jù)。這些數(shù)據(jù)點將成為圖譜中的節(jié)點或?qū)傩?。?shù)據(jù)質(zhì)量直接影響圖譜效果,所以數(shù)據(jù)清洗至關(guān)重要。
結(jié)構(gòu)設(shè)計決定了知識圖譜的組織方式。常見的有兩種結(jié)構(gòu):
隱性申請節(jié)點結(jié)構(gòu)
強調(diào)客戶間關(guān)系的簡潔呈現(xiàn),計算效率高,客戶關(guān)聯(lián)只需兩度計算。適合簡單業(yè)務(wù)模式,如單次授信用款場景。
顯性申請節(jié)點結(jié)構(gòu)
將申請行為作為獨立節(jié)點,能清晰表現(xiàn)客戶多次申請行為,適合復(fù)雜業(yè)務(wù)場景如循環(huán)額度、多次用款。這種結(jié)構(gòu)計算客戶關(guān)聯(lián)需要四度計算,資源消耗較大。
圖譜構(gòu)建完成后,我們可以通過社區(qū)發(fā)現(xiàn)算法識別緊密連接的客戶團簇,通過中心度算法
發(fā)現(xiàn)關(guān)鍵節(jié)點,用最短路徑算法分析客戶間最緊密的關(guān)聯(lián)途徑。這些圖計算能力是傳統(tǒng)數(shù)據(jù)庫難以實現(xiàn)的。
知識圖譜:AI賦能的關(guān)鍵戰(zhàn)場
知識圖譜在多個領(lǐng)域展現(xiàn)出強大價值,從金融風(fēng)控到醫(yī)療健康,從智能搜索到AI集成,正成為數(shù)字化轉(zhuǎn)型的核心引擎
。
金融風(fēng)控領(lǐng)域
,知識圖譜通過構(gòu)建客戶關(guān)系網(wǎng)絡(luò),能高效識別欺詐團伙。
一個示例場景:18個申請客戶通過設(shè)備、電話等多種關(guān)系形成緊密連接,其中13人出現(xiàn)逾期,逾期率高達(dá)72.2%。傳統(tǒng)數(shù)據(jù)庫需要多次全量掃描才能發(fā)現(xiàn)這樣的關(guān)聯(lián)團簇,而知識圖譜可以秒級完成。知識圖譜還能識別團伙中的核心節(jié)點,發(fā)現(xiàn)可能的中介欺詐行為。
醫(yī)療健康領(lǐng)域
,知識圖譜連接癥狀、疾病、治療和藥物,支持智能診療。
有趣的是,百度靈醫(yī)智惠系統(tǒng)通過知識圖譜實現(xiàn)了智能問診,其診斷準(zhǔn)確率和人類醫(yī)生相當(dāng),處方藥方與老中醫(yī)開具的方案相似度可達(dá)80-90%。這說明AI已經(jīng)可以將結(jié)構(gòu)化醫(yī)學(xué)知識轉(zhuǎn)化為臨床決策支持。
智能搜索方面
,知識圖譜是Google、百度等搜索引擎革命性升級的核心技術(shù)。
當(dāng)你搜索"周杰倫的妻子"時,搜索引擎不再僅僅匹配關(guān)鍵詞,而是理解"周杰倫"是一個人,"妻子"是一種關(guān)系,直接給出"昆凌"這個答案。
最令人興奮的是知識圖譜與大語言模型的結(jié)合
。
當(dāng)前的LLM主要解決了感知問題,而知識圖譜作為符號學(xué)派的代表,可以為AI提供結(jié)構(gòu)化的世界知識和推理能力。多倫多大學(xué)的Geoffrey Hinton教授指出,AI未來發(fā)展方向之一是深度神經(jīng)網(wǎng)絡(luò)與符號人工智能的深入結(jié)合。知識圖譜正在成為邁向通用人工智能(AGI)的重要基石。
從本質(zhì)上看,知識圖譜是AI從"感知智能
"邁向"認(rèn)知智能
"的關(guān)鍵一步。它不僅提供了海量結(jié)構(gòu)化知識,更重要的是提供了一種類似人類思維的關(guān)聯(lián)推理方式。
隨著知識圖譜技術(shù)的發(fā)展,我們將看到AI在理解、推理、聯(lián)想等高級認(rèn)知功能上的顯著進步,最終實現(xiàn)真正意義上的智能AGI
。