為什么說2012年是語義Web之年?
1996年,萬維網聯盟(W3C)主管Tim Berners-Lee為現代語義Web技術定義了如下遠景:如果人們與超文本之間的交互能夠變得更為直接,進而機器可理解的信息空間能夠準確描述人類思想、交互和工作方式的狀態(tài),那么機器分析就會變?yōu)榉浅姶蟮墓芾砉ぞ?。而且,如何通過典型問題來洞悉我們的生活方式和促進我們之間的協作是困擾大型機構的管理問題,而語義web為此提供了很好的解決方案。
15年之后,語義Web開始應用到多個領域,從藝術館的信息化到乳腺癌的研究,涉及領域極為廣泛。盡管語義Web遠景要在全球實現尚需多年的發(fā)展歷程,但是很多著名的IT部門已經越來越多的采用語義標準,并且當語義Web逐漸成為Web之后,希望通過語義技術產品來為企業(yè)獲取利潤。這一技術趨勢將持續(xù)不斷地刺激各個行業(yè),包括金融、醫(yī)療器械、通信、生命科學和人工智能領域。事實上,我認為2012年將成為語義Web之年。
2011年有三大例證可以說明語義技術在商業(yè)和文化領域的影響力正不斷增長,而且更重要的是當今社會已經發(fā)展為一個數據驅動的世界。
1、通信領域的例證——Siri
雖然您并不知道誰的圣誕禮物單中有iPhone 4S,但是事實卻是蘋果公司在截止12月的***個季度就銷售了3500萬部iPhone手機。而且據測算,2010年蘋果還將銷售1.25億部手機。因而,有很多人就可以與自己談話,我所指的是iPhone手機上的語音助手Siri。它是一個幫助您安排飲食起居和各種活動的虛擬仆從,還能夠為您導航(真希望能比我的GPS好用)。您所需要做的就是通過語音、點擊或者輸入發(fā)出指令,這位小助手就會幫助您從一些相關網站搜索信息,幫助您完成決策過程。它甚至還可以為您預訂餐館或飛機票。這就是為什么Siri和其他一些功能在數據使用量上是上一代iPhone模型的兩倍多。iPhone 4S甚至使用了比iPad更多的數據。
Siri的共同創(chuàng)始人、***技術官和副設計師Tom Gruber是語義Web領域的一位先驅者。他是使用Web來收集和共享信息的領跑者,他因為從技術和計算機科學的角度給出了“本體”的定義而被世人所銘記,他也是***位將本體稱之為知識共享技術的科學家。Gruber建立了DARPA的知識共享庫,并且是一位卓越創(chuàng)新的思想家,躋身于語義Web奠基人和開拓者的行列。
2.企業(yè)領域的例證——Best Buy
2009年12月,Best Buy的總開發(fā)工程師Jay Myers為商業(yè)數據和語義給出了一個戰(zhàn)略性的公式。這個公式涉及到三個圈子,前兩個圈子之和等于第三個圈子:外部接觸的開放互聯數據+內部互聯數據=洞察力。他解釋說:外部數據圈表示您希望所有人都能訪問到的那些人和機器都能夠理解的數據,在Web上與之相關的***的工具是RDFa,這種方式使用經過標注的富語義的HTML來將數據交付給機器,而同時人類用戶仍然能夠訪問那些他們早已習慣的可視化的網頁。在語義標記技術中最棒的前端技術是一款需要一點額外知識的小工具,它能夠幫助數以萬計的HTML開發(fā)人員創(chuàng)建出一個語義非常豐富的數據網絡,他們所需要做的只是通過加入數據標注的方式來使自己的HTML語義更加豐富。這樣就能夠使整個網絡成為一個開放的、可查詢的數據庫或者API,我們可以從中方便地抽取自己需要的知識。
這樣的戰(zhàn)略成功了嗎?根據SearchNewsCentral.com 的 Doc Sheldon 對Jay的采訪(RDFa: The Inside Story From Best Buy):確實如此。Best Buy的這位總開放工程師說:僅僅在兩個月之內,我們就發(fā)現組織搜索的結果開始增長。不久以后,就已經比歷史水平增長了30%。我們也發(fā)現點擊率有所提升。Yahoo做了一項調查發(fā)現訪問過搜索頁面的人回訪的點擊率提升了15%,這已經證實是我們所起到的作用。當然,使我們的站點更加智能、更易于機器理解,最終將使用戶受益。
3 博物館信息學的例證——安娜波利斯歷史基金會
***,看看最近馬里蘭州***安納波利斯的博物館和我的技術公司Orbis科技的合作。我們的工作主要放在如何將語義應用交付給國防部和面對互聯網數據難題的商業(yè)客戶。然而,我們也可以利用自己的技術實力來提升藝術界的展覽水平。在一場舉行了數月之久的展覽中,我們和安納波利斯歷史基金會一起協作,將安娜波利斯1700到1810年之間的各種收藏進行了展示,尤其是一些肖像藝術家、銀器匠和木工。
Orbis主要為這場展覽創(chuàng)建了交互式的知識應用,使得同一藝術家或者圖片的信息能夠相互參照。例如,當點擊名為William Faris的銀器匠或者木工John Shaw,人們可以訪問與這位藝人相關的各種信息。在數百萬的用例中,語義技術被用于創(chuàng)建不同數據之間的關聯,而這些用戶感興趣的數據可能是實例、工匠和對象。
語義技術能做什么?
當然,這些主要的語義技術應用都共享著公共的組件。成功的實現通常有很容易理解的過程工作流來支持固定產品的生產。較為特殊的是,領域/工業(yè)界詞匯通常需要結構化、半結構化和非結構化的數據。這些典型項目和正確的產品相結合后能夠創(chuàng)建出更多成功的語義技術驅動的項目,它們顯示出巨大的價值并且隨后會帶來投資。
換言之,***的狀態(tài)是這樣的:***項目典型已經有了,語義技術能夠解決和大規(guī)模數據集成工作和數據過載問題(也就是數據太多而造成無法獲得使用的信息或者真正的知識)相關的公共基礎問題。核心語義技術標準(即RDF)以一種能夠對人類認知進行建模的格式描述了數據之間的關系,進而產生了促進人類決策過程的信息。
語義Web使我們能夠將自己的大腦更多的投入到需要人類認知的工作和任務上——將那些像線路檢查和數據抓取這樣繁瑣無聊的工作交給機器,而且機器并不會脾氣暴躁,也不需要喝咖啡。
這就是為什么說2012年是語義Web之年。
原文:http://article.yeeyan.org/view/281562/249578
【編輯推薦】