自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何打造數(shù)據(jù)驅(qū)動(dòng)的知識(shí)型經(jīng)濟(jì)?這里有一份技術(shù)列表

新聞 大數(shù)據(jù)
本篇文章解釋了數(shù)據(jù)、信息、知識(shí)、智慧的「數(shù)據(jù)金字塔」,并列出了知識(shí)型經(jīng)濟(jì)所需要的技術(shù)列表。

 [[361122]]

迄今為止,我們的系統(tǒng)產(chǎn)生的還僅僅是數(shù)據(jù),而不是信息,更不是知識(shí)。」上世紀(jì)90年代,管理大師彼得·德魯對(duì)數(shù)據(jù)使用這樣評(píng)論道。

現(xiàn)在看來,這個(gè)評(píng)論放在當(dāng)今依然適用。在數(shù)據(jù)使用過程中,今天需要思考的是,如何將數(shù)據(jù)、信息轉(zhuǎn)化為知識(shí),擴(kuò)大人類的理性,輔助決策?

本篇文章解釋了數(shù)據(jù)、信息、知識(shí)、智慧的「數(shù)據(jù)金字塔」,并列出了知識(shí)型經(jīng)濟(jì)所需要的技術(shù)列表。

過去的一年里,疫情讓社會(huì)生活方方面面都受到了重挫,但也帶來了一些有趣的副作用:倒逼企業(yè)數(shù)字化轉(zhuǎn)型。

正如微軟CEO薩蒂亞·納德拉(Satya Nadella),「新冠疫情在數(shù)月內(nèi)促進(jìn)了企業(yè)的數(shù)字化轉(zhuǎn)型?!?/p>

那些提前布局?jǐn)?shù)字化的公司在疫情期間看到了收益,其他公司也在使用各種數(shù)字化工具,視頻通話、遠(yuǎn)程辦公、云計(jì)算、機(jī)器學(xué)習(xí)等得到了更多的應(yīng)用。

但不管企業(yè)處于哪個(gè)階段,隨著數(shù)字化轉(zhuǎn)型的加速,所有業(yè)務(wù)活動(dòng)中越來越多的部分都在以數(shù)據(jù)的形式留下了足跡。每個(gè)員工、客戶、供應(yīng)商的動(dòng)態(tài),每個(gè)線索、信息位和過程都將以數(shù)字化的方式進(jìn)行或記錄。

反過來,這意味著從理論上講,我們從數(shù)據(jù)中獲得的應(yīng)該不僅僅是對(duì)現(xiàn)狀的洞察,還應(yīng)該從數(shù)據(jù)到信息、從信息到知識(shí)。

在不久的將來,企業(yè)將是由數(shù)據(jù)驅(qū)動(dòng)的,經(jīng)濟(jì)將是基于知識(shí)的。以下是知識(shí)型經(jīng)濟(jì)所需要的技術(shù)列表:

一、數(shù)據(jù)金字塔:從數(shù)據(jù)到知識(shí)

從1946年第一臺(tái)計(jì)算機(jī)誕生,幾十年IT技術(shù)的迅速發(fā)展下,人類從數(shù)據(jù)稀缺進(jìn)入了數(shù)據(jù)爆炸時(shí)代,但我們一直沒有解決的問題是,「如何將數(shù)據(jù)、信息轉(zhuǎn)化為知識(shí),擴(kuò)大人類的理性,輔助決策?」

當(dāng)前,我們對(duì)數(shù)據(jù)的利用還處在非常淺層的階段,管理大師彼得·德魯于上世紀(jì)90年代對(duì)數(shù)據(jù)使用的評(píng)論仍然適用于今天:「迄今為止,我們的系統(tǒng)產(chǎn)生的還僅僅是數(shù)據(jù),而不是信息,更不是知識(shí)?!?/p>

數(shù)據(jù)、信息、知識(shí),加上最高層級(jí)的智慧,四者之間的關(guān)系可以用「數(shù)據(jù)金字塔」來表示。這個(gè)金字塔一直以來都是信息科學(xué)語言的一部分,在基于知識(shí)的新數(shù)字世界中,對(duì)數(shù)據(jù)進(jìn)行編碼,利用商業(yè)、運(yùn)營知識(shí)是取得進(jìn)步和保持競爭力的關(guān)鍵。

數(shù)據(jù)金字塔:數(shù)據(jù)、信息、知識(shí)和智慧之間的關(guān)系表示

那么,我們?nèi)绾螐臄?shù)據(jù)到信息,從信息到知識(shí)呢?首先要解釋三者的區(qū)別。

數(shù)據(jù)就是數(shù)字或字符,是原始或無組織形式的事實(shí)的集合,沒有上下文,也沒有意義。例如,「18122020」只是一個(gè)數(shù)字序列。但是,如果我們將此序列定義為DDMMYYY格式的日期,則可以將其解釋為2020年12月18日。在此附加上下文中,數(shù)字具有含義。

信息是為了特定目的而以一種更容易測(cè)量、可視化和分析的方式處理的數(shù)據(jù)。例如,我們可以通過公開各種看似完全不同的數(shù)據(jù)點(diǎn)和斷開連接的數(shù)據(jù)點(diǎn)之間的關(guān)系的方式來組織數(shù)據(jù)。根據(jù)每天休市時(shí)的數(shù)據(jù)創(chuàng)建特定時(shí)間段內(nèi)數(shù)據(jù)點(diǎn)的圖表來分析道瓊斯指數(shù)的表現(xiàn)。

知識(shí)是經(jīng)過某種方式處理、構(gòu)造、應(yīng)用或付諸實(shí)踐的信息。例如,通過捕獲和表達(dá)與我們的數(shù)據(jù)點(diǎn)相關(guān)的關(guān)系的含義,我們可以自動(dòng)化地洞察,并提取新知識(shí)。語義關(guān)系的知識(shí)圖譜可以幫助解釋某些股票如何影響道瓊斯指數(shù),以及不同的事件如何影響它們的價(jià)格。

向數(shù)據(jù)添加上下文會(huì)將其轉(zhuǎn)變?yōu)樾畔?,處理信息可以將其轉(zhuǎn)變?yōu)橹R(shí),這些轉(zhuǎn)換的關(guān)鍵是「連接」和「元數(shù)據(jù)」。

提到數(shù)據(jù)處理,大部分人想到的是深度學(xué)習(xí)。如今通過深度學(xué)習(xí),我們可以通過找到數(shù)據(jù)背后的規(guī)律,并作出預(yù)測(cè)。

但深度學(xué)習(xí)并不是唯一的數(shù)據(jù)處理方式,本篇文章嘗試從一個(gè)不同的視角來分析,關(guān)注一個(gè)特定的數(shù)據(jù)結(jié)構(gòu):圖。

二、圖分析

圖論的歷史與一個(gè)看似完全毫無聯(lián)系的問題有關(guān),「通過柯尼斯堡(Königsberg)許多橋梁的最佳方式是什么?」1736年,瑞士數(shù)學(xué)家和物理學(xué)家萊昂哈德·歐拉(Leonhard Euler)建立了一個(gè)模型解決了這個(gè)問題,該模型就是圖論的基礎(chǔ)。

歐拉的做法是將「橋」和「連接橋的路徑」建模為圖中的「節(jié)點(diǎn)」和「邊」,然后形式化節(jié)點(diǎn)和邊的關(guān)系,這就構(gòu)成了許多圖形算法的基礎(chǔ)。

在基于知識(shí)的新數(shù)字世界中,對(duì)數(shù)據(jù)進(jìn)行編碼和將數(shù)據(jù)與業(yè)務(wù)知識(shí)結(jié)合是取得進(jìn)步并保持競爭力的關(guān)鍵。

最著名的圖形算法可能是PageRank ——谷歌帝國的基礎(chǔ)。PageRank將網(wǎng)絡(luò)上的文檔建模為圖形,并使用它們之間的鏈接來得出特定查詢的相關(guān)性。

從18世紀(jì)到今天,科學(xué)家們已經(jīng)開發(fā)了許多圖形算法,其主要類別包括路徑查找、中心性、社區(qū)檢測(cè)、相似性是圖算法的主要類別,這些算法在數(shù)據(jù)分析中有很多應(yīng)用。

從eBay到NASA,再到調(diào)查記者和獨(dú)立數(shù)據(jù)科學(xué)家,圖分析都有大量的應(yīng)用,包括欺詐檢測(cè)、網(wǎng)絡(luò)分析、自然語言處理等。2019年,分析公司Gartner就預(yù)測(cè)過,「圖分析將在未來幾年內(nèi)增長,因?yàn)槿藗冃枰趶?fù)雜的數(shù)據(jù)中提出復(fù)雜的問題。」

三、圖數(shù)據(jù)庫

前文提到,將數(shù)據(jù)轉(zhuǎn)換成信息的關(guān)鍵是「連接」和「元數(shù)據(jù)」。圖是利用連接的最佳方法,而圖數(shù)據(jù)庫則可以使表達(dá)和連接查詢變得更容易。

這就是為什么圖數(shù)據(jù)庫非常適合那些需要利用數(shù)據(jù)連接(反欺詐、預(yù)測(cè)性建議)案例的原因。從操作應(yīng)用到分析,從數(shù)據(jù)集成到機(jī)器學(xué)習(xí),圖都有優(yōu)勢(shì)。

但圖和圖數(shù)據(jù)庫之間并不一樣。圖分析可以在任何后端執(zhí)行,它們僅需要讀取圖形形狀的數(shù)據(jù)。而圖形數(shù)據(jù)庫是一種能夠完全支持讀和寫的數(shù)據(jù)庫,利用了圖形數(shù)據(jù)模型、API和查詢語言。

圖數(shù)據(jù)庫其實(shí)已經(jīng)存在很長時(shí)間了,但到2017年才收到廣泛關(guān)注,當(dāng)時(shí)AWS和微軟分別使用Neptune和Cosmos DB將圖數(shù)據(jù)庫暴露給更廣泛的受眾。自那時(shí)以來,圖數(shù)據(jù)庫就成了數(shù)據(jù)管理中最熱門的領(lǐng)域。

「到2022年,圖形處理和圖形DBMS的應(yīng)用將以每年100%的速度增長,以不斷加速數(shù)據(jù)準(zhǔn)備并實(shí)現(xiàn)更復(fù)雜和適應(yīng)性更強(qiáng)的數(shù)據(jù)科學(xué)。圖形數(shù)據(jù)存儲(chǔ)區(qū)可以跨數(shù)據(jù)孤島有效地建模,探索和查詢具有復(fù)雜相互關(guān)系的數(shù)據(jù)?!笹artner在《2019年十大數(shù)據(jù)和分析技術(shù)趨勢(shì)》報(bào)告中表示。

四、知識(shí)圖譜

連接數(shù)據(jù)孤島是知識(shí)管理的前提,而知識(shí)圖譜擅長于此。知識(shí)圖譜是圖的特定子類,也稱為語義圖。它們自帶元數(shù)據(jù)、模式、全局標(biāo)識(shí)符和推理能力,這使得它們成為捕捉和管理知識(shí)的理想選擇。

很多人將知識(shí)圖譜作為一項(xiàng)新技術(shù),但實(shí)際上知識(shí)圖譜已經(jīng)存在了至少20年,其發(fā)明者正式萬維網(wǎng)發(fā)明者蒂姆·伯納斯·李(Tim Berners-Lee)。

2001年蒂姆·伯納斯發(fā)表語義網(wǎng)宣言( Semantic Web manifesto),盡管其中提到的原則和技術(shù)一直有爭議,但它仍然成為知識(shí)圖譜復(fù)興的幕后推手。

Gartner將知識(shí)圖譜納入2020年人工智能技術(shù)成熟度曲線報(bào)告,并將其作為處于高峰的新技術(shù)熱點(diǎn)

谷歌的PageRank也在圖及知識(shí)圖譜的興起中扮演重要角色。盡管PageRank取得了成功,但如果沒有語義和元數(shù)據(jù),網(wǎng)絡(luò)上內(nèi)容的抓取和分類同樣是一個(gè)難解決的問題。因此,谷歌接受了語義技術(shù),并在2012年創(chuàng)造了術(shù)語「知識(shí)圖」。

schema.org的廣泛采用標(biāo)志著圖技術(shù)和知識(shí)圖譜迅速崛起的開始。知識(shí)圖可以解決數(shù)據(jù)治理和數(shù)據(jù)集成等關(guān)鍵挑戰(zhàn)。

最終,知識(shí)圖譜可以作為數(shù)字載體,可以將知識(shí)獲取和組織的理念與數(shù)字時(shí)代的數(shù)據(jù)管理實(shí)踐統(tǒng)一起來。

五、圖、AI和自然語言處理

如果你認(rèn)為知識(shí)圖譜是捕捉和管理知識(shí)的終極目標(biāo),那你就錯(cuò)了。知識(shí)圖譜擅長以自上而下的方式明確地捕捉知識(shí)。這也是Gartner將知識(shí)圖譜列入2020年人工智能成熟度曲線報(bào)告的原因。

在管理顯性、先驗(yàn)知識(shí)方面,知識(shí)圖譜比其他任何技術(shù)都要好,但是對(duì)于隱性、突發(fā)性及不斷發(fā)展的知識(shí)而言,又如何處理?這就是機(jī)器學(xué)習(xí)效果很好的地方,但在這里,圖形也可能會(huì)有所幫助。

圖與機(jī)器學(xué)習(xí)有什么關(guān)系?實(shí)際上很多。這是雙向的。機(jī)器學(xué)習(xí)可以幫助引導(dǎo)和填充知識(shí)圖譜。圖形中包含的信息可以提升機(jī)器學(xué)習(xí)方法的效率。

機(jī)器學(xué)習(xí)及其深度學(xué)習(xí)子領(lǐng)域,與圖形非常匹配。在圖上的機(jī)器學(xué)習(xí)仍然是一項(xiàng)新興的技術(shù),但卻是一項(xiàng)充滿希望的技術(shù)。亞馬遜、阿里巴巴、蘋果、Facebook和Twitter只在一些生產(chǎn)中使用這項(xiàng)技術(shù)。在頂級(jí)人工智能會(huì)議上發(fā)表的研究報(bào)告中,有超過25%與圖有關(guān)。

最后,根據(jù)Facebook人工智能研究員Fabio Petroni的說法,圖可能不是獲取知識(shí)的最佳方式?!肝覀円呀?jīng)發(fā)明了表示知識(shí)的最佳方式——文本。隨著自然語言處理(NLP)的最新進(jìn)展,我們現(xiàn)在有了機(jī)器,可以檢索上下文的片段,在此基礎(chǔ)上進(jìn)行推理,并解決知識(shí)密集型任務(wù),而不需要使用知識(shí)庫,只需要使用文本和理解文本即可。」

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2018-07-30 09:33:21

2020-03-30 11:32:49

IT技術(shù)面試

2018-02-08 08:35:23

區(qū)塊鏈食品安全食品供應(yīng)商

2019-08-16 09:55:22

Pandas編程語言代碼

2018-05-15 08:35:37

AI微軟人工智能

2018-04-19 14:42:48

深度學(xué)習(xí)DL數(shù)據(jù)集

2020-04-22 16:21:57

HTTP3數(shù)據(jù)HTTP2

2018-04-19 10:33:39

DevOps開源工具

2019-04-16 13:13:56

碼農(nóng)程序員開發(fā)

2020-11-16 11:10:21

代碼開發(fā)工具

2022-03-28 13:04:10

機(jī)器學(xué)習(xí)模型計(jì)算機(jī)

2018-01-02 16:42:42

iPhone電池Apple

2018-02-08 08:26:54

紅包春節(jié)支付寶

2024-04-01 11:52:46

2024-08-16 14:02:00

2024-08-05 12:28:11

2020-06-12 07:36:33

Redis

2022-01-25 15:00:07

AI技術(shù)趨勢(shì)

2018-03-25 09:11:31

大數(shù)據(jù)機(jī)器學(xué)習(xí)分析軟件
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)