自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

讓靜態(tài)知識(shí)動(dòng)起來:從知識(shí)圖譜到事理圖譜

人工智能 知識(shí)圖譜
傳統(tǒng)的知識(shí)圖譜回答的是“是什么”的問題,而以“事”為核心的事理圖譜回答的是“為什么”的問題。目前,絕大多數(shù)知識(shí)圖譜主要以實(shí)體(特別是人名)為基礎(chǔ),面向事件知識(shí)圖譜研究的語料構(gòu)建和研究方法還處于探索階段。

 [[392524]]

在社交網(wǎng)絡(luò)中,有這樣一條著名的“六度分隔理論”:

“最多通過五個(gè)人,你就能夠認(rèn)識(shí)世界上的任何一個(gè)陌生人。”

“六度分隔理論”背后的知識(shí)圖譜就是幫助社交網(wǎng)絡(luò)連接每個(gè)人的“黑科技”。知識(shí)圖譜以實(shí)體概念(例如人)為節(jié)點(diǎn),以關(guān)系為邊,以可視化的圖形展示直觀地呈現(xiàn)人們的社交關(guān)系。目前這一技術(shù)已在搜索、金融等領(lǐng)域得到了很好的應(yīng)用。

[[392525]]

那么,如果將上述知識(shí)圖譜中的“人”改為“事”,又會(huì)有怎樣的變化?

明略科技集團(tuán)首席科學(xué)家和明略科學(xué)院院長吳信東教授的回答是,傳統(tǒng)的知識(shí)圖譜回答的是“是什么”的問題,而以“事”為核心的事理圖譜回答的是“為什么”的問題。目前,絕大多數(shù)知識(shí)圖譜主要以實(shí)體(特別是人名)為基礎(chǔ),面向事件知識(shí)圖譜研究的語料構(gòu)建和研究方法還處于探索階段。

[[392526]]

吳信東

“知識(shí)圖譜的關(guān)注點(diǎn)從‘知識(shí)’到‘事件’,這代表了目前知識(shí)圖譜自動(dòng)構(gòu)建領(lǐng)域的日漸成熟,單一的靜態(tài)事實(shí)類圖譜構(gòu)建模型已經(jīng)不能滿足業(yè)界的需求,產(chǎn)業(yè)界對動(dòng)態(tài)事理圖譜以及其他更深層次的語義理解技術(shù)有著迫切的關(guān)注。”吳信東告訴AI科技評(píng)論。

1

事件關(guān)系抽?。鹤岇o態(tài)知識(shí)動(dòng)起來

知識(shí)圖譜的概念由Google于2012年提出,最早被搜索引擎用基于實(shí)體的搜索來代替基于字符串的搜索,從而提升用戶搜索質(zhì)量與體驗(yàn)。在大數(shù)據(jù)時(shí)代,知識(shí)圖譜以結(jié)構(gòu)化的形式將互聯(lián)網(wǎng)的信息表達(dá)成更接近人類認(rèn)知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。

構(gòu)建知識(shí)圖譜的前提與核心條件是知識(shí)獲取。具體來說,這一過程需要將現(xiàn)實(shí)世界中的各類“信息”轉(zhuǎn)換為“知識(shí)”并表達(dá)成計(jì)算機(jī)可存儲(chǔ)和計(jì)算的結(jié)構(gòu),再進(jìn)一步形成“圖譜”。早期的知識(shí)圖譜構(gòu)建大量依賴于人力分類,如維基百科采取“眾包”的方式,讓網(wǎng)民成為知識(shí)的貢獻(xiàn)者,從而加快了知識(shí)圖譜的累計(jì)速度。

[[392527]]

但在大數(shù)據(jù)時(shí)代,手工勞動(dòng)已經(jīng)不能適應(yīng)知識(shí)圖譜的構(gòu)建需求。不少企業(yè)開始積極探索和嘗試自動(dòng)化構(gòu)建技術(shù),利用機(jī)器從不同來源、不同結(jié)構(gòu)的數(shù)據(jù)中進(jìn)行抽取,形成知識(shí)存入到知識(shí)圖譜。而在產(chǎn)業(yè)實(shí)踐中,通過文本信息等非結(jié)構(gòu)化數(shù)據(jù)中提煉知識(shí)構(gòu)建知識(shí)圖譜,技術(shù)上面臨很多挑戰(zhàn)。

而這也正是數(shù)據(jù)挖掘頂會(huì) ICDM 從 2019 年開始舉辦知識(shí)圖譜大賽的原因。

“知識(shí)圖譜是一個(gè)明略的技術(shù)特長,明略認(rèn)為有這個(gè)義務(wù)為促進(jìn)知識(shí)圖譜的學(xué)術(shù)研究以及產(chǎn)業(yè)實(shí)踐的聯(lián)動(dòng)與交流出一份力。”2019 年的 ICDM 在北京舉辦,作為會(huì)議的發(fā)起人、數(shù)據(jù)挖掘領(lǐng)域領(lǐng)軍人物吳信東教授從會(huì)議之初一路相隨,在本屆會(huì)議上,吳信東教授不僅擔(dān)任大會(huì)主席,并推動(dòng)設(shè)立了首屆知識(shí)圖譜大賽,使之成為知識(shí)圖譜學(xué)術(shù)與產(chǎn)業(yè)交流的重要平臺(tái)。

ICDM 2019 知識(shí)圖譜大賽的主題是自動(dòng)生成知識(shí)圖譜,而 2020 年的競賽主題“事件原因抽取”則更貼近產(chǎn)業(yè)應(yīng)用。任務(wù)是解決場景營銷的一大痛點(diǎn),即如何智能分析與提取與消費(fèi)者行為相關(guān)的內(nèi)容場景及關(guān)系知識(shí),以數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、NLP等技術(shù)建立模型,從文本中智能提取出消費(fèi)者事件的因果關(guān)系。

據(jù) ICDM 2020 知識(shí)圖譜大賽聯(lián)席競賽主席、中科院自動(dòng)化所研究員劉康教授介紹,事件關(guān)系抽取是信息抽取任務(wù)中較難的任務(wù)。相較于實(shí)體關(guān)系抽取,事件關(guān)系抽取需要判斷兩個(gè)事件之間的關(guān)系,而事件在文本中的描述通常比較復(fù)雜,有可能是一句話或者多句話。

[[392528]]

劉康

此外,事件抽取任務(wù)側(cè)重于事件類型的判斷以及事件元素的抽取,屬于單個(gè)事件內(nèi)部的語義識(shí)別;而事件關(guān)系側(cè)重于不同事件之間錯(cuò)綜復(fù)雜關(guān)系語義識(shí)別,更準(zhǔn)確的事件抽取能提升事件關(guān)系的性能。

據(jù)AI科技評(píng)論了解,本屆知識(shí)圖譜大賽比賽數(shù)據(jù)使用真實(shí)、公開的用戶消費(fèi)評(píng)論數(shù)據(jù),存在數(shù)據(jù)質(zhì)量差、多種語言、格式不統(tǒng)一等問題,增大了賽題的挑戰(zhàn)難度。

這也是業(yè)界在知識(shí)圖譜應(yīng)用中需要解決的問題:知識(shí)圖譜的節(jié)點(diǎn)是偏靜態(tài)描述的實(shí)體,而事件偏動(dòng)態(tài)。與實(shí)體相比,事件能夠更加清晰、精確表示發(fā)生的各種事實(shí)信息;而人類的命題記憶是以“事件”為存儲(chǔ)單位的,真實(shí)的消費(fèi)評(píng)論所體現(xiàn)的也正是這樣一種動(dòng)態(tài)信息。讓機(jī)器能夠以一種更為接近于人腦知識(shí)結(jié)構(gòu)體系的方式來處理知識(shí)和進(jìn)行推理,有助于機(jī)器更好地理解復(fù)雜場景下的具體問題,為用戶提供更好的體驗(yàn)。

換言之:讓知識(shí)圖譜中的知識(shí)“動(dòng)起來”,不僅是學(xué)術(shù)界研究更好實(shí)現(xiàn)人工智能的手段,也是產(chǎn)業(yè)界為客戶提供更智能化的服務(wù)、提升服務(wù)質(zhì)量、降低成本的需求。

2020 年的知識(shí)圖譜大賽共吸引了 45 個(gè)國家的 2000 多支隊(duì)伍參與,北京大學(xué)、清華大學(xué)、中國科學(xué)院、香港中文大學(xué)、康奈爾大學(xué)、國立新加坡大學(xué)等著名高校及阿里巴巴、騰訊、華為、百度、京東等企業(yè)均參與其中。

那么,事件關(guān)系提取又能在哪些方面幫助企業(yè)提升業(yè)務(wù)水平?

2

事件關(guān)系提取的作用

劉康教授告訴AI科技評(píng)論,在知識(shí)圖譜領(lǐng)域,學(xué)術(shù)界和企業(yè)界聯(lián)系十分緊密,相關(guān)技術(shù)在企業(yè)中有豐富的應(yīng)用場景,這也使得學(xué)術(shù)界在研究理論的同時(shí)注重技術(shù)、場景的實(shí)際落地,在本次賽題命題中,命題專家同樣很好地考慮到了這一點(diǎn)。

以參賽企業(yè)京東為例,利用知識(shí)圖譜可以自動(dòng)整理行業(yè)和企業(yè)數(shù)據(jù),形成金融數(shù)據(jù)庫,幫助金融機(jī)構(gòu)形成差異化競爭優(yōu)勢。知識(shí)圖譜也服務(wù)于京東金融App支持各個(gè)業(yè)務(wù)線的銷售對話機(jī)器人,為智能問答系統(tǒng)提供了推理問答,邏輯判斷問答,查詢問答等功能。

除了行業(yè)和企業(yè)的應(yīng)用,提取消費(fèi)者事件的原因在內(nèi)容廣告、社交監(jiān)聽等許多業(yè)務(wù)場景中都是關(guān)注的焦點(diǎn)。以內(nèi)容廣告為例,如今的廣告主更喜歡通過產(chǎn)品功能嵌入內(nèi)容,以潛移默化的方式將自己的品牌或產(chǎn)品與任意的消費(fèi)事件聯(lián)系起來。為此,明確地提取消費(fèi)者事件的原因成為構(gòu)建這樣一個(gè)滿足廣告商需求的系統(tǒng)的重要技術(shù)。

盡管知識(shí)圖譜技術(shù)在產(chǎn)業(yè)界正經(jīng)歷著應(yīng)用的高速增長,學(xué)術(shù)領(lǐng)域前沿成果與實(shí)際落地應(yīng)用場景間依然存在著巨大的鴻溝。對于大多數(shù)企業(yè)來說,他們并不具備像京東一樣,利用知識(shí)圖譜中的事件關(guān)系改善自身業(yè)務(wù)的能力。

“基于事理圖譜的應(yīng)用已經(jīng)在多個(gè)行業(yè)中涌現(xiàn),比如營銷、金融、工業(yè)等。”吳信東教授告訴AI科技評(píng)論,明略科技在幫助企業(yè)推進(jìn)基于事理圖譜的應(yīng)用有足夠多的構(gòu)想和實(shí)踐。

“比如在明略的實(shí)踐中,使用事件抽取技術(shù)識(shí)別輿情中的熱點(diǎn)事件,將不同新聞中提到的同一事件進(jìn)行聚合、統(tǒng)計(jì)熱度,以氣泡圖等方式對事件發(fā)展趨勢進(jìn)行可視化,從而指導(dǎo)營銷文案的自動(dòng)撰寫、垂直領(lǐng)域報(bào)告的自動(dòng)生成等。”

在金融行業(yè),明略科技與浦發(fā)銀行合作,共同推動(dòng)金融認(rèn)知工程方法論研究與理論體系創(chuàng)建,在產(chǎn)融生態(tài)合作中不斷完善金融認(rèn)知智能體系,構(gòu)建國內(nèi)領(lǐng)先的認(rèn)知智能平臺(tái)基礎(chǔ)設(shè)施,提升用戶洞察、感知互動(dòng)等能力。在工業(yè)領(lǐng)域,明略也廣泛地在軌道交通等多個(gè)行業(yè)的智能維保與故障歸因場景上有著深入的探索。

除此之外,明略科技也在基于大數(shù)據(jù)和AI技術(shù)構(gòu)建行業(yè)知識(shí)圖譜。知識(shí)圖譜的自動(dòng)構(gòu)建是明略的核心技術(shù)之一,2020 年 7 月在 2020 WAIC 世界人工智能大會(huì)期間,明略科技推出了目前世界上第一個(gè)語音實(shí)時(shí)生成圖譜的企業(yè)級(jí)知識(shí)圖譜開發(fā)工具包 HAO 圖譜,HAO 正在做到:專家在臺(tái)上講話,后臺(tái)圖譜系統(tǒng)可自動(dòng)同步構(gòu)建知識(shí)圖譜。

據(jù)介紹,HAO 圖譜可以獨(dú)立運(yùn)行,也可交付給企業(yè)技術(shù)團(tuán)隊(duì)進(jìn)行二次開發(fā),幫助用戶及中小微企業(yè)提供全方位服務(wù)。目前 HAO 圖譜已在數(shù)字城市、金融、工業(yè)、廣告營銷等多個(gè)場景中落地。

“HAO 治理”模型架構(gòu)圖

對企業(yè)而言,知識(shí)圖譜的構(gòu)建可以幫助企業(yè)連接內(nèi)部結(jié)構(gòu)化數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)、外部非結(jié)構(gòu)化數(shù)據(jù),進(jìn)而可能成為下一代企業(yè)管理數(shù)據(jù)的主流技術(shù)路線;而明略科技也將結(jié)合在知識(shí)圖譜事件抽取領(lǐng)域的新動(dòng)向,幫助企業(yè)實(shí)現(xiàn)知識(shí)圖譜和數(shù)據(jù)管理的升級(jí)。

3

知識(shí)圖譜的未來

雖然知識(shí)圖譜在產(chǎn)業(yè)界已經(jīng)得到了一定的應(yīng)用,但劉康教授認(rèn)為,從學(xué)術(shù)研究的角度,現(xiàn)在知識(shí)圖譜的研究正處于快速發(fā)展初期,并從傳統(tǒng)的以實(shí)體為核心向事件等復(fù)雜結(jié)構(gòu)知識(shí)為核心轉(zhuǎn)變。

“顯著的圖譜有可能出現(xiàn)在和預(yù)訓(xùn)練語言模型的結(jié)合上,目前以 BERT 為代表的預(yù)訓(xùn)練語言模型正在各個(gè) NLP 任務(wù)中發(fā)力,這些主要得益于大數(shù)據(jù)和算力的進(jìn)步,但是此類模型中到底蘊(yùn)含哪些知識(shí)類型,以及如何用知識(shí)圖譜顯示提升預(yù)訓(xùn)練語言模型的表示能力有可能會(huì)取得比較顯著的突破。”談及未來知識(shí)圖譜的發(fā)展趨勢,劉康教授如是說。

從根本上說,從實(shí)體到事件的核心轉(zhuǎn)變并不會(huì)改變基于知識(shí)圖譜的人工智能推理的技術(shù)本質(zhì),其核心挑戰(zhàn)還是在圖譜上搜索最優(yōu)解所面臨的組合爆炸困境。近年來如 BERT、GPT-3 等大規(guī)模預(yù)訓(xùn)練語言模型的出現(xiàn),也為解決事理圖譜的組合爆炸困境提供了新的方法。

[[392529]]

而在 2020 知識(shí)圖譜競賽中,我們也看到了不同隊(duì)伍的技術(shù)處理方案。如京東引入了一種全新的視角來重新審視關(guān)系行為原因提取任務(wù),并提出了一種新的序列標(biāo)記框架,而不是單獨(dú)提取行為類型和行為原因;獲得第二名的日本選手則是使用 GAN 完成了本次任務(wù),通過 GAN 的生成方式增加訓(xùn)練樣本,同時(shí)對 GAN 生成的數(shù)據(jù)標(biāo)注為 Fake,在原有五種時(shí)間類型的基礎(chǔ)上,增加 Fake 標(biāo)簽進(jìn)行預(yù)測。

劉康教授認(rèn)為,未來知識(shí)圖譜領(lǐng)域研究可能是向多模態(tài)、復(fù)雜結(jié)構(gòu)知識(shí)和領(lǐng)域化發(fā)展。其中,如何表示各種類型的知識(shí)?如何抽取常識(shí)知識(shí)?如何結(jié)合多模態(tài)信息進(jìn)行復(fù)雜結(jié)構(gòu)知識(shí)的自動(dòng)獲???都是他認(rèn)為比較有意思的研究問題。

吳信東教授認(rèn)為,知識(shí)圖譜從靜態(tài)知識(shí)描述走向動(dòng)態(tài)問題求解是知識(shí)圖譜走向?qū)嶋H應(yīng)用的重要發(fā)展方向,事理圖譜可以接入問題求解的動(dòng)態(tài)信息,為知識(shí)圖譜的推理插上一個(gè)動(dòng)態(tài)翅膀。

作為人工智能技術(shù)中的知識(shí)容器和孵化器,知識(shí)圖譜會(huì)對未來 AI 領(lǐng)域的發(fā)展起到關(guān)鍵性的作用。無論是基于實(shí)體的傳統(tǒng)知識(shí)圖譜還是事件的新一代知識(shí)圖譜,其構(gòu)建技術(shù)的發(fā)展和對應(yīng)用場景的探索仍然會(huì)不斷的持續(xù)下去,在此過程中,知識(shí)圖譜構(gòu)建技術(shù)會(huì)朝著越來越自動(dòng)化方向前進(jìn),同時(shí)在以明略為代表的 AI 和大數(shù)據(jù)公司推動(dòng)下,知識(shí)圖譜也會(huì)在越來越多的領(lǐng)域找到能夠真正落地的應(yīng)用場景,在各行各業(yè)中解放生產(chǎn)力,助力業(yè)務(wù)轉(zhuǎn)型。

責(zé)任編輯:梁菲 來源: 雷鋒網(wǎng)
相關(guān)推薦

2021-02-01 22:41:05

語義網(wǎng)知識(shí)圖譜

2017-03-06 16:48:56

知識(shí)圖譜構(gòu)建存儲(chǔ)

2021-01-19 10:52:15

知識(shí)圖譜

2025-04-27 00:10:00

AI人工智能知識(shí)圖譜

2021-01-25 10:36:32

知識(shí)圖譜人工智能

2024-06-03 07:28:43

2019-01-18 16:02:33

知識(shí)圖譜圖數(shù)據(jù)庫AI

2017-04-13 11:48:05

NLP知識(shí)圖譜

2019-05-07 10:01:49

Redis軟件開發(fā)

2021-01-18 10:50:29

知識(shí)圖譜人工智能深度學(xué)習(xí)

2017-05-04 13:18:18

深度學(xué)習(xí)知識(shí)圖譜

2022-06-07 09:00:32

PythonAI靜態(tài)圖片

2024-01-29 00:25:59

人工智能結(jié)構(gòu)化編碼

2020-12-18 11:59:21

人工智能知識(shí)圖譜

2024-10-08 10:37:12

語言數(shù)據(jù)自然語言

2021-03-03 13:55:42

人工智能知識(shí)圖譜

2025-04-18 12:49:58

知識(shí)圖譜大模型人工智能

2022-08-11 14:11:14

知識(shí)圖譜人工智能

2022-03-01 15:14:36

圖數(shù)據(jù)庫知識(shí)圖譜

2025-01-09 10:52:23

RAG知識(shí)圖譜人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)