Web3.0、關(guān)聯(lián)數(shù)據(jù)和語義網(wǎng)
Web 3.0: Web 2.0之后輪到誰?
Web 3.0無法解決信息超載問題。至少現(xiàn)在還不行,因為有很多基礎(chǔ)工作要做。尤其是現(xiàn)在網(wǎng)上到處都是非結(jié)構(gòu)化數(shù)據(jù),需要很長的時間才能將這些數(shù)據(jù)結(jié)構(gòu)化。
去年Boutin將Web 3.0寬泛定義為“一個開放網(wǎng)絡(luò)。Web 3.0可以打破舊藩籬,讓所有人隨時隨地地聯(lián)系在一起,讓整個網(wǎng)絡(luò)更加智能?!?/P>
至少我認(rèn)為,如果說Web 2.0意味著Youtube和維基百科等UGC和社交網(wǎng)絡(luò),那么Web 3.0則意味著開放和結(jié)構(gòu)化數(shù)據(jù),讓網(wǎng)絡(luò)更加“聰明”。
關(guān)聯(lián)數(shù)據(jù)(Linked Data): 結(jié)構(gòu)化數(shù)據(jù),但不一定是語義數(shù)據(jù)
Greg Boutin第二篇文章談到了關(guān)聯(lián)數(shù)據(jù)。他認(rèn)為關(guān)聯(lián)數(shù)據(jù)提供了關(guān)聯(lián)結(jié)構(gòu)化數(shù)據(jù)的新媒介,可以讓機器更好地讀取這些數(shù)據(jù)。但是,關(guān)聯(lián)數(shù)據(jù)本身不會給信息增加任何語義含義,而是更好地攜帶語義數(shù)據(jù),供用戶訪問。所以,關(guān)聯(lián)數(shù)據(jù)雖然本身并不具備語義特征,但它可以在數(shù)據(jù)層面建立關(guān)聯(lián),為真正的語義網(wǎng)鋪平道路。
關(guān)聯(lián)數(shù)據(jù)這個概念來自W3C,該組織有一個關(guān)聯(lián)開放數(shù)據(jù)(LOD)項目。以下圖表列出了參與該項目的數(shù)據(jù)集。其中包括著名的Thomson Reuters的Open Calais項目 , Freebase, 和DBpedia。這些數(shù)據(jù)集是在現(xiàn)有本體論(ontologies)基礎(chǔ)之上建立的,如WordNet,FOAF, 和SKOS,然后在它們之間建立關(guān)聯(lián)。
Greg Boutin在其第三篇文章中寫道,關(guān)聯(lián)數(shù)據(jù)格式不會創(chuàng)建智能數(shù)據(jù),僅僅是支持。他建議人們集中精力開發(fā)把非結(jié)構(gòu)化數(shù)據(jù)進行結(jié)構(gòu)化的技術(shù)。他還建議創(chuàng)業(yè)者應(yīng)該考慮把關(guān)聯(lián)數(shù)據(jù)和其它技術(shù)進行混搭。
語義網(wǎng):Google唱主角
那些以上這些趨勢會如何影響語義網(wǎng)呢?Tim Berners-Lee 認(rèn)為語義網(wǎng)可以用于商業(yè)目的,但現(xiàn)實卻是,目前使用資源描述框架(RDF)的實際應(yīng)用寥寥無幾。
但是 RDFa(允許發(fā)布者把RDF嵌入到HTML)帶來了一線希望。 Google本周宣布將在其“富媒體代碼”中支持RDFa,而雅虎早在去年就大膽地推出了搜索猴子(Search Monkey ),達到了同樣的目的。
Google將在語義網(wǎng)主流化過程中扮演重要角色。Google目前正在從半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中解析語義結(jié)構(gòu)數(shù)據(jù)。有人稱Google算法遠(yuǎn)非統(tǒng)計方法論那么簡單,它早就在研發(fā)語義技術(shù)了。
Google也并非沒有競爭對手。除了雅虎,微軟去年夏天收購 Powerset也是瞄準(zhǔn)了這個市場。
結(jié)論
Web 3.0是一個沒有統(tǒng)一定義的詞語,或者根本不應(yīng)該這么稱呼。但是很顯然,結(jié)構(gòu)化數(shù)據(jù)時代已經(jīng)到來。我們從當(dāng)前的關(guān)聯(lián)數(shù)據(jù)熱潮中就可以看到它的影子,并且得到了Google和雅虎瞪大公司的支持。誰知道呢,或許語義網(wǎng)也就在隔壁不遠(yuǎn)處。
【編輯推薦】