自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

終于有人把知識圖譜講明白了

大數(shù)據(jù)
知識圖譜旨在描述真實世界中存在的各種實體或概念及其關(guān)系,其構(gòu)成了一張巨大的語義網(wǎng)絡圖,節(jié)點表示實體或概念,邊則由屬性或關(guān)系構(gòu)成。

1.知識圖譜的由來

1977年,美國計算機科學家費根鮑姆正式命名知識工程,他曾于1994年獲得圖靈獎,被譽為專家系統(tǒng)之父,知識工程奠基人。知識工程是自上而下的,并嚴重依賴專家干預。知識工程的基本目標就是把專家的知識賦予機器,利用機器解決問題。

在傳統(tǒng)的知識工程里,首先需要有相關(guān)領域的專家,而且專家能夠把自己的知識表達出來;其次,還需要有知識工程師把專家表達的知識變成計算機能夠處理的形式。

互聯(lián)網(wǎng)的應用催生了大數(shù)據(jù)時代下的知識工程。雖然知識工程解決問題的思路極具前瞻性,但傳統(tǒng)知識工程能夠表示的規(guī)模有限,難以適應互聯(lián)網(wǎng)時代大規(guī)模開放應用的需求。

為應對這些問題,學界和業(yè)界的知識工程研究者們試圖尋找新的解決方案。于是學者們將目光轉(zhuǎn)移到數(shù)據(jù)本身上,提出了鏈接數(shù)據(jù)的概念。

鏈接數(shù)據(jù)中的數(shù)據(jù)不僅僅需要發(fā)布于語義網(wǎng)中,更需要建立自身數(shù)據(jù)之間的聯(lián)系,從而形成一張巨大的鏈接數(shù)據(jù)網(wǎng)。首先在這項技術(shù)上取得重大突破的是谷歌的搜索引擎產(chǎn)品,谷歌將其命名為“知識圖譜”。

2.知識圖譜的定義

知識圖譜旨在描述真實世界中存在的各種實體或概念及其關(guān)系,其構(gòu)成了一張巨大的語義網(wǎng)絡圖,節(jié)點表示實體或概念,邊則由屬性或關(guān)系構(gòu)成。現(xiàn)在的知識圖譜已被用來泛指各種大規(guī)模的知識庫。圖1.5便是一個圍繞產(chǎn)品全生命周期的知識圖譜示例,一般來說知識圖譜中包含三種節(jié)點:

圖片

▲圖1.5 產(chǎn)品全生命周期知識圖譜

實體或概念指的是具有可區(qū)別性且獨立存在的某種事物。以圖1.5為例,產(chǎn)品、產(chǎn)品1、研發(fā)設計、生產(chǎn)制造、采購、質(zhì)量等都是一個個實體。世界萬物由若干具體事物組成,實體是知識圖譜中的最基本元素,不同的實體間存在不同的關(guān)系。

屬性及屬性值用來刻畫實體的內(nèi)在特性,從一個實體指向它的屬性值。不同的屬性類型對應不同類型屬性的邊。屬性值主要指對象指定屬性的值。如圖1.5所示的“采購”“生產(chǎn)”“質(zhì)量”是幾種不同的屬性。屬性值則是采購物料的數(shù)量和價格、生產(chǎn)數(shù)量和進度、采購和生產(chǎn)的質(zhì)量指標。

關(guān)系則是用來連接兩個實體,刻畫它們之間的關(guān)聯(lián)。知識圖譜亦可被看作一張巨大的關(guān)系網(wǎng)圖,圖中的節(jié)點表示實體或概念,而圖中的邊則由屬性或關(guān)系構(gòu)成。

3.知識圖譜的技術(shù)架構(gòu)

知識圖譜的技術(shù)架構(gòu)是指其構(gòu)建模式的結(jié)構(gòu),如圖1.6所示。圖1.6中虛線框內(nèi)的部分為知識圖譜的構(gòu)建過程,也包含知識圖譜的更新過程。

圖片

▲圖1.6 知識圖譜的技術(shù)架構(gòu)

知識圖譜構(gòu)建從最原始的數(shù)據(jù)(包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù))出發(fā),采用一系列自動或者半自動的技術(shù)手段,從原始數(shù)據(jù)庫和第三方數(shù)據(jù)庫中進行知識提取,并將其存入知識庫的數(shù)據(jù)層和模式層中,這一過程包含數(shù)據(jù)采集、知識抽取、知識融合、知識加工、知識應用五個過程,每一次更新迭代均包含這四個階段。

知識圖譜主要有自頂向下(top-down)與自底向上(bottom-up)兩種構(gòu)建方式。

自頂向下指的是先為知識圖譜定義好本體與數(shù)據(jù)模式,再將實體加入知識庫中。該構(gòu)建方式需要利用一些現(xiàn)有的結(jié)構(gòu)化知識庫作為其基礎知識庫,例如Freebase項目就是采用這種方式,它的絕大部分數(shù)據(jù)是從維基百科中得到的。自底向上指的是從一些開放鏈接數(shù)據(jù)中提取出實體,選擇其中置信度較高的加入知識庫中,再構(gòu)建頂層的本體模式。

對于大多數(shù)制造業(yè)企業(yè)來說,由于缺乏大量的實證數(shù)據(jù),在應用初期主要使用自頂向下的構(gòu)建方式。

4.知識圖譜與大數(shù)據(jù)的區(qū)別

知識圖譜是運用一套新的技術(shù)和方法論在知識結(jié)構(gòu)化和分析洞察兩個方面提升信息轉(zhuǎn)化為知識并且被利用的效率。大數(shù)據(jù)和知識圖譜的抽象工作都是關(guān)于“結(jié)構(gòu)化”和“關(guān)聯(lián)”的,不過大數(shù)據(jù)是數(shù)據(jù)結(jié)構(gòu)化和數(shù)據(jù)級別的關(guān)聯(lián),知識圖譜是知識結(jié)構(gòu)化和知識級別的關(guān)聯(lián)。

所謂知識結(jié)構(gòu)化在知識圖譜技術(shù)中就是用三元組的數(shù)據(jù)結(jié)構(gòu)對實體和關(guān)系建模。知識圖譜在解決分析洞察這類問題時,在處理“關(guān)系”這件事情上,更直觀也更高效。知識圖譜技術(shù)無非是將人工的過程平移,希望計算機能夠更高效地完成這一工程。

大數(shù)據(jù)很大程度上是在嘗試將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化的數(shù)據(jù),使其能被計算機分析,從這個意義上講,傳統(tǒng)的企業(yè)大數(shù)據(jù)平臺、數(shù)據(jù)治理和知識圖譜無疑都要共享企業(yè)的大數(shù)據(jù)。

本文摘編自《智能制造:AI落地制造業(yè)之道》(ISBN:978-7-111-69931-6),經(jīng)出版方授權(quán)發(fā)布。?

責任編輯:武曉燕 來源: 大數(shù)據(jù)DT
相關(guān)推薦

2021-02-21 21:25:43

知識圖譜

2022-04-18 07:37:30

數(shù)據(jù)信息知識

2022-09-03 18:39:29

數(shù)據(jù)庫圖譜

2021-06-13 12:03:46

SaaS軟件即服務

2022-03-27 20:32:28

Knative容器事件模型

2021-10-09 00:02:04

DevOps敏捷開發(fā)

2021-10-12 18:31:40

流量運營前端

2021-03-25 11:24:25

爬蟲技術(shù)開發(fā)

2021-12-03 18:25:56

數(shù)據(jù)指標本質(zhì)

2022-04-27 18:25:02

數(shù)據(jù)采集維度

2021-10-17 20:38:30

微服務內(nèi)存組件

2020-11-03 07:04:39

云計算公有云私有云

2021-02-14 00:21:37

區(qū)塊鏈數(shù)字貨幣金融

2021-03-03 21:31:24

量化投資利潤

2021-06-29 11:21:41

數(shù)據(jù)安全網(wǎng)絡安全黑客

2022-01-05 18:27:44

數(shù)據(jù)挖掘工具

2022-04-12 18:29:41

元數(shù)據(jù)系統(tǒng)架構(gòu)

2020-11-30 08:34:44

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)

2022-04-22 11:26:55

數(shù)據(jù)管理架構(gòu)

2022-07-31 20:29:28

日志系統(tǒng)
點贊
收藏

51CTO技術(shù)棧公眾號