企業(yè)應(yīng)該考慮的圖形數(shù)據(jù)庫五大優(yōu)勢
近年來,人們對圖形數(shù)據(jù)庫的興趣日益濃厚,分析家預(yù)測,在2021年及以后,企業(yè)對該技術(shù)的使用將繼續(xù)增加。該說法得到MarketsandMarkets公司的研究的支持,其研究預(yù)計圖形數(shù)據(jù)庫市場將實現(xiàn)兩位數(shù)增長,從2019年的10億美元增長到2024年的29億美元。
這種增長源自于,圖形數(shù)據(jù)庫為企業(yè)提供的優(yōu)勢,使企業(yè)可以更好地理解他們正在收集的大量數(shù)據(jù)。圖形數(shù)據(jù)庫有助于確定數(shù)據(jù)中的關(guān)系,而其他技術(shù)很難發(fā)現(xiàn)甚至無法發(fā)現(xiàn)這些關(guān)系。
這是高級圖形數(shù)據(jù)庫的優(yōu)勢之一,現(xiàn)在企業(yè)高管都在轉(zhuǎn)向數(shù)據(jù)來推進企業(yè)目標(biāo),這些優(yōu)勢無疑很有吸引力。
Gartner公司副總裁兼分析師Mark Beyer表示:“任何企業(yè),無論規(guī)?;蝾愋?,都可以從圖形中受益。”
什么是圖形數(shù)據(jù)庫?
關(guān)系數(shù)據(jù)庫傾向于針對速度和結(jié)構(gòu)進行優(yōu)化,這意味著數(shù)據(jù)被列在表中,沒有太多的缺失值,并且對于有效記錄或數(shù)據(jù)條目的構(gòu)成有明確規(guī)則。
圖形數(shù)據(jù)庫使用圖形理論來存儲、映射和搜索關(guān)系。它由節(jié)點和邊緣組成,節(jié)點代表一條數(shù)據(jù)或條目,例如人、地方、事物或類別。邊緣是節(jié)點之間的連接或關(guān)系,用于標(biāo)識節(jié)點之間的交互方式。
IEEE成員兼南加州大學(xué)信息科學(xué)研究所負(fù)責(zé)人Mayank Kejriwal說:“圖形數(shù)據(jù)庫非常擅長處理關(guān)系數(shù)據(jù)。”
圖形數(shù)據(jù)庫使用數(shù)據(jù)攝取引擎將數(shù)據(jù)放入圖形配置中。當(dāng)數(shù)據(jù)進入圖形配置中,用戶就可以瀏覽和分析連接。
Beyer稱:“圖形在于向我展示所有關(guān)聯(lián)。”
UST公司數(shù)據(jù)工程和平臺總經(jīng)理Sripathi Jagannathan說,試想在公共交通中使用它,交通網(wǎng)絡(luò)由不同的公交車站(節(jié)點)和路線(邊緣)組成。為旅客提供的其他站點和路線也是不同的節(jié)點。
Jagannathan說:“在這種用例中,通過使用圖形數(shù)據(jù)庫,可以有效的方式分析數(shù)據(jù)。即使站點、旅客和路線的數(shù)量增加,查詢性能也將保持一致。”
為什么受歡迎?
專家說,圖形數(shù)據(jù)庫和圖形分析的潛力非常巨大,因為它們顯著提升在大量數(shù)據(jù)中尋找關(guān)聯(lián)的能力。
Beyer說:“圖形數(shù)據(jù)庫著重于兩個或多個數(shù)據(jù)對象的所有可能組合,而不是數(shù)據(jù)集中對象的首選關(guān)聯(lián)的子集,因此,在圖形數(shù)據(jù)庫管理中,它是首選方案。”
盡管分析師預(yù)計圖形技術(shù)的銷售將顯著增長,但目前使用率仍然較低。Beyer說,Gartner認(rèn)為部署率在4%到6%之間,并補充說圖形技術(shù)不像市場上的其他數(shù)據(jù)庫和分析工具那樣對業(yè)務(wù)用戶友好。
他說,數(shù)據(jù)科學(xué)家目前仍是圖形數(shù)據(jù)庫的主要用戶,但是該技術(shù)的進步正在改變這種狀況。
Kejriwal說:“很多NoSQL數(shù)據(jù)庫已針對規(guī)模進行優(yōu)化,隨著MapReduce / Hadoop成為主流后,此類數(shù)據(jù)庫的數(shù)量不斷增加,而圖形數(shù)據(jù)庫則允許應(yīng)用程序開發(fā)人員以豐富的方式表示其數(shù)據(jù)。”
他說,最初圖形數(shù)據(jù)庫沒有主要關(guān)系數(shù)據(jù)庫或其他NoSQL數(shù)據(jù)庫快。但近年來這種情況已經(jīng)改變,因為像Amazon這樣的主要提供商開始支持圖形數(shù)據(jù)庫。
Kejriwal說:“圖形數(shù)據(jù)庫可能將具有足 夠可擴展性(對于很多應(yīng)用程序已經(jīng)具有可擴展性),而大多數(shù)NoSQL數(shù)據(jù)庫無法提供圖形數(shù)據(jù)庫可以提供的代表性使用和靈活性。”
隨著數(shù)據(jù)集的結(jié)構(gòu)化程度降低和變得更加多樣化,圖形數(shù)據(jù)庫將繼續(xù)蓬勃發(fā)展,超越其他NoSQL選項。
下面讓我們看看企業(yè)應(yīng)該考慮的圖形數(shù)據(jù)庫的主要優(yōu)勢。
發(fā)現(xiàn)異常值
Beyer說,圖形技術(shù)在發(fā)現(xiàn)異常位置方面特別有用–不僅在數(shù)據(jù)集中,而且在整個數(shù)據(jù)中。從多方面看,異常位置很有意義和重要,但其他技術(shù)找不到它們。
加速發(fā)現(xiàn)
專家稱,在發(fā)現(xiàn)過程中,數(shù)據(jù)科學(xué)家可以使用圖形數(shù)據(jù)庫來加快發(fā)現(xiàn)數(shù)據(jù)集中的關(guān)系和模式。數(shù)據(jù)科學(xué)家還可以使用圖形數(shù)據(jù)庫進行實時分析,即使是在龐大而復(fù)雜的數(shù)據(jù)集中也是如此。
確定想法
Beyer稱:“圖形數(shù)據(jù)庫為你提供對數(shù)據(jù)的見解,而對于其他大多數(shù)數(shù)據(jù)庫,你必須擁有見解和然后詢問數(shù)據(jù)。”
圖形數(shù)據(jù)庫的優(yōu)勢包括幫助用戶發(fā)現(xiàn)他們不知道的客戶服務(wù)問題、供應(yīng)鏈問題或服務(wù)不足的細分市場。
Beyer稱:“它實際上有助于發(fā)現(xiàn)事物;它會說,‘我有發(fā)現(xiàn)’。”
可處理信息偏差
Kejriwal說,圖形表示還可以處理各種不完整的數(shù)據(jù)。
他說:“例如,有些人的個人資料可能非常完整,很多連接,而另一些人可能很少。”
其他數(shù)據(jù)庫可能難以應(yīng)對這種信息偏差。Kejriwal說,圖形數(shù)據(jù)庫提供了一種強大的表示機制,使開發(fā)人員可以直觀地表示各種實體和關(guān)系。
他說:“雖然NoSQL可以解決部分挑戰(zhàn),但它們無法像圖形數(shù)據(jù)庫那樣表示和提供查詢功能。”
更大靈活性
Jagannathan說:“層級、關(guān)系和文檔數(shù)據(jù)庫存在模型剛性的問題,這意味著預(yù)定義了用于存儲數(shù)據(jù)的基礎(chǔ)模型。”
圖形數(shù)據(jù)庫的主要優(yōu)勢之一是它們表示數(shù)據(jù)的方式。缺乏剛性使得數(shù)據(jù)存儲方式和數(shù)據(jù)點之間的關(guān)系更加靈活。
Jagannathan說:“節(jié)點可以獨立于它們的邊緣或關(guān)系而存儲。關(guān)系可以在開發(fā)時插入。此關(guān)鍵功能還為圖形數(shù)據(jù)庫提供其他優(yōu)點,例如性能、敏捷性和靈活性。”