自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

我們?yōu)槭裁葱枰獔D數(shù)據(jù)庫(kù)?

數(shù)據(jù)庫(kù) SQL Server
當(dāng)前,互聯(lián)網(wǎng)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),但是以更快速度增加的是數(shù)據(jù)之間的關(guān)系。企業(yè)的 CIO 和 CTO 不僅要管理大量數(shù)據(jù),還要從現(xiàn)有的數(shù)據(jù)中挖掘商業(yè)價(jià)值,在這種情況下處理數(shù)據(jù)之間的關(guān)系比處理單個(gè)數(shù)據(jù)更為重要。

 當(dāng)前,互聯(lián)網(wǎng)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),但是以更快速度增加的是數(shù)據(jù)之間的關(guān)系。企業(yè)的 CIO 和 CTO 不僅要管理大量數(shù)據(jù),還要從現(xiàn)有的數(shù)據(jù)中挖掘商業(yè)價(jià)值,在這種情況下處理數(shù)據(jù)之間的關(guān)系比處理單個(gè)數(shù)據(jù)更為重要。

[[315515]]

傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),在處理復(fù)雜數(shù)據(jù)關(guān)系運(yùn)算上表現(xiàn)很差,隨著數(shù)據(jù)量和深度的增加,關(guān)系型數(shù)據(jù)庫(kù)無(wú)法在有效的時(shí)間內(nèi)計(jì)算出結(jié)果。所以,為了更好的利用數(shù)據(jù)間的連接,企業(yè)需要一種——將關(guān)系信息存儲(chǔ)為實(shí)體、靈活拓展數(shù)據(jù)模型的數(shù)據(jù)庫(kù)技術(shù),這項(xiàng)技術(shù)就是圖數(shù)據(jù)庫(kù)(Graph Database)。

圖數(shù)據(jù)庫(kù)具有天然可解釋性

圖數(shù)據(jù)庫(kù)是基于圖模型,對(duì)圖數(shù)據(jù)進(jìn)行存儲(chǔ)、操作和訪問(wèn)的一項(xiàng)技術(shù),即使沒(méi)有專業(yè)的圖論知識(shí)儲(chǔ)備,也能輕松理解。它可以接受比實(shí)時(shí)查詢更為復(fù)雜的分析需求,來(lái)挖掘圖數(shù)據(jù)中的潛在價(jià)值。從分類上來(lái)說(shuō),圖數(shù)據(jù)庫(kù)屬于 NoSQL 的一種。

圖模型是圖數(shù)據(jù)庫(kù)中的重要概念。圖模型由兩個(gè)要素組成:節(jié)點(diǎn)和邊。每個(gè)節(jié)點(diǎn)代表一個(gè)實(shí)體(一個(gè)人,地方,事物或其他數(shù)據(jù)),每條邊代表兩個(gè)節(jié)點(diǎn)之間的連接,這種通用結(jié)構(gòu)可以對(duì)各種場(chǎng)景進(jìn)行建模,如社交網(wǎng)絡(luò)以及由關(guān)系定義的任何其他事物。

例如:下面這個(gè)圖模型中包含 3 個(gè)節(jié)點(diǎn):中國(guó)、四川、大熊貓。其中他們的兩條邊分別是:大熊貓是四川的特色、四川屬于中國(guó)。

 

圖模型的基礎(chǔ)要素:節(jié)點(diǎn)和邊

從上面的圖模型可以看出,圖數(shù)據(jù)庫(kù)的目標(biāo)就是基于圖模型以一種直觀的方式模擬這些關(guān)系。因?yàn)槭腔谑挛镪P(guān)系的模型表達(dá),圖因此也具有天然的可解釋性。

圖數(shù)據(jù)庫(kù)在處理關(guān)聯(lián)數(shù)據(jù)時(shí)的優(yōu)勢(shì)

與關(guān)系型數(shù)據(jù)庫(kù)相比,圖數(shù)據(jù)庫(kù)在處理關(guān)聯(lián)數(shù)據(jù)時(shí)有三個(gè)非常突出的技術(shù)優(yōu)勢(shì):

  • 高性能:隨著數(shù)據(jù)量的增多和關(guān)聯(lián)深度的增加,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)受制于檢索時(shí)需要多個(gè)表之間連接操作,數(shù)據(jù)寫入時(shí)也需考慮外鍵約束,從而導(dǎo)致較大的額外開(kāi)銷,產(chǎn)生嚴(yán)重的性能問(wèn)題。而圖模型固有的數(shù)據(jù)索引結(jié)構(gòu),使得它的數(shù)據(jù)查詢與分析速度更快。
  • 靈活:圖數(shù)據(jù)庫(kù)有非常靈活的數(shù)據(jù)模型,使用者可以根據(jù)業(yè)務(wù)變化隨時(shí)調(diào)整數(shù)據(jù)模型,比如任意添加或刪除頂點(diǎn)、邊,擴(kuò)充或者縮小圖模型這些都可以輕松實(shí)現(xiàn),這種頻繁的 Schema 更改在關(guān)系型數(shù)據(jù)庫(kù)上不能到很好的支持。
  • 敏捷:圖數(shù)據(jù)庫(kù)的圖模型非常直觀,支持測(cè)試驅(qū)動(dòng)開(kāi)發(fā)模式,每次構(gòu)建時(shí)可進(jìn)行功能測(cè)試和性能測(cè)試,符合當(dāng)今比較流行的敏捷開(kāi)發(fā)需求,對(duì)于提高生產(chǎn)和交付效率也有一定幫助。

我們可以繼續(xù)擴(kuò)展前面介紹到的圖模型用例,來(lái)展示圖數(shù)據(jù)庫(kù)的優(yōu)勢(shì)。北京也屬于中國(guó),長(zhǎng)城位于北京,Tom 去過(guò)長(zhǎng)城,火鍋店張師傅出生于四川,Tom 出生在中國(guó)喜歡大熊貓,張師傅在北京開(kāi)店,Tom 是張師傅的顧客。

 

拓展后的圖模型

如果你是業(yè)務(wù) / 產(chǎn)品工作人員,你一定希望你的產(chǎn)品或業(yè)務(wù)拓展到用戶的方方面面。如果你是開(kāi)發(fā)人員你一定希望能夠簡(jiǎn)單高效地描述這個(gè)紛繁復(fù)雜的世界。

在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)中,要想進(jìn)行關(guān)聯(lián)查詢,我們需要建立多少?gòu)埍砟?國(guó)家、省 / 市、人、動(dòng)物、地標(biāo)、動(dòng)物與省 / 市的關(guān)系、國(guó)家與省 / 市的關(guān)系、人與省 / 市的關(guān)系、人與人..... 粗算一下 至少十幾張表。

構(gòu)建這些表倒沒(méi)什么。但如果,現(xiàn)在我們需要查詢:在哪些城市上班的人最喜歡大熊貓?

首先需要關(guān)聯(lián)動(dòng)物表、人員表、人喜歡的動(dòng)物表,關(guān)聯(lián)這三張表就可以查到 Tom 喜歡大熊貓。但是接下來(lái)你還需要再關(guān)聯(lián)兩張表,找到他們?cè)谀膫€(gè)地標(biāo)工作,然后再關(guān)聯(lián)兩張表找到這些地標(biāo)在哪個(gè)城市。等等,還沒(méi)完,你還得 group by 一下,再排個(gè)序。

你會(huì)發(fā)現(xiàn)這個(gè)查詢實(shí)在太難了!但這恰恰是數(shù)據(jù)分析師最基本的工作,也是大數(shù)據(jù)時(shí)代海量信息處理的一個(gè)縮影。而使用圖數(shù)據(jù)庫(kù),我們可以輕易的描述和查詢上圖所示的關(guān)系。在處理復(fù)雜數(shù)據(jù)關(guān)系運(yùn)算上,圖數(shù)據(jù)庫(kù)查詢效率遠(yuǎn)高于關(guān)系型數(shù)據(jù)庫(kù)。

圖數(shù)據(jù)庫(kù)的應(yīng)用場(chǎng)景

圖數(shù)據(jù)庫(kù)技術(shù)已經(jīng)應(yīng)用于現(xiàn)實(shí)生活中的方方面面,諸如 Google、Facebook 等科技巨頭已經(jīng)開(kāi)始使用圖數(shù)據(jù)庫(kù)的力量來(lái)蓬勃發(fā)展業(yè)務(wù)。據(jù) Gartner 在《十大數(shù)據(jù)分析技術(shù)趨勢(shì)》預(yù)測(cè),2012 年至 2022 年,全球圖處理及圖數(shù)據(jù)庫(kù)的應(yīng)用都將以每年 100% 的速度迅猛增長(zhǎng)。

如果說(shuō)知識(shí)圖譜是圖數(shù)據(jù)庫(kù)的底層應(yīng)用場(chǎng)景,充分利用了圖模型在存儲(chǔ)和查詢的優(yōu)勢(shì)為多行業(yè)提供知識(shí)服務(wù)。那么金融風(fēng)控則是具有行業(yè)特點(diǎn)的高階應(yīng)用場(chǎng)景。

知識(shí)圖譜

知識(shí)圖譜作為圖數(shù)據(jù)庫(kù)的底層應(yīng)用,已服務(wù)于多種行業(yè),包括:智能問(wèn)答、搜索、個(gè)性化推薦等。以智能問(wèn)答為例,產(chǎn)品主要分為聊天機(jī)器人、行業(yè)智能問(wèn)答系統(tǒng)兩種。開(kāi)放領(lǐng)域的知識(shí)圖譜能為聊天機(jī)器人提供廣泛知識(shí),機(jī)器不僅能和使用者聊天還能提供日常知識(shí)。行業(yè)智能問(wèn)答系統(tǒng)則使用行業(yè)知識(shí)圖譜,能夠?yàn)橛脩粲嗅槍?duì)性的提供專業(yè)領(lǐng)域知識(shí),在法律、醫(yī)療行業(yè)已得到運(yùn)用。

在知識(shí)圖譜的應(yīng)用落地上,主要有兩點(diǎn)因素影響著知識(shí)圖譜的質(zhì)量和實(shí)現(xiàn) -NLP 自然語(yǔ)言處理引擎、算法庫(kù)。NLP 自然語(yǔ)言處理引擎決定了 NLP 爬蟲(chóng)平臺(tái)獲取數(shù)據(jù)的質(zhì)量和數(shù)量,而這些原始數(shù)據(jù)作為知識(shí)圖譜的知識(shí)原料又決定了知識(shí)圖譜的水平。算法庫(kù)中的圖算法決定了圖構(gòu)建、圖存儲(chǔ)和圖操作的能力,知識(shí)原料豐富而圖算法落后,依然不能構(gòu)建出強(qiáng)大的知識(shí)圖譜。

金融反欺詐

圖數(shù)據(jù)庫(kù)通過(guò)利用多維交叉關(guān)聯(lián)信息深度刻畫(huà)申請(qǐng)和交易行為,可以有效識(shí)別規(guī)?;?、隱蔽性的欺詐網(wǎng)絡(luò)和洗錢網(wǎng)絡(luò);結(jié)合機(jī)器學(xué)習(xí)、聚類分析、風(fēng)險(xiǎn)傳播等相關(guān)算法,可以實(shí)時(shí)計(jì)算用戶的風(fēng)險(xiǎn)評(píng)分,在風(fēng)險(xiǎn)行為發(fā)生前預(yù)先識(shí)別,有效幫助金融機(jī)構(gòu)提升效率、降低風(fēng)險(xiǎn)。應(yīng)用圖數(shù)據(jù)庫(kù)的金融風(fēng)控場(chǎng)景很多,例如個(gè)人信貸、洗錢路徑追蹤、個(gè)人 / 企業(yè)征信等

基于圖數(shù)據(jù)庫(kù)在金融風(fēng)控的優(yōu)異表現(xiàn),很多企業(yè)表示對(duì)這項(xiàng)技術(shù)的看好,在這之中也有一些前瞻性的企業(yè)已率先使用此技術(shù)并取得競(jìng)爭(zhēng)性優(yōu)勢(shì)。圖技術(shù)發(fā)展多年,這項(xiàng)技術(shù)仍然有很多企業(yè)沒(méi)有使用,是什么原因阻礙了技術(shù)的推進(jìn)?

首先是數(shù)據(jù)存儲(chǔ)的問(wèn)題,在反洗錢的場(chǎng)景中,需對(duì)用戶的借記卡和信用卡數(shù)據(jù)存儲(chǔ)分析。在存儲(chǔ)時(shí)發(fā)現(xiàn),僅 10 個(gè)月借記卡數(shù)據(jù) +1 個(gè)月信用卡數(shù)據(jù)規(guī)模就有 5 個(gè) T,這樣的數(shù)據(jù)量是過(guò)去圖數(shù)據(jù)庫(kù)無(wú)法支持的。

第二點(diǎn)是多步分析問(wèn)題。在反洗錢應(yīng)用場(chǎng)景中需要做到 3-10 步以上的分析,而目前的圖數(shù)據(jù)庫(kù)在企業(yè)級(jí)場(chǎng)景下,2 度到 3 度查詢時(shí)就會(huì)出現(xiàn)超時(shí)或者內(nèi)存溢出的問(wèn)題。這樣的性能對(duì)于欺詐甄別的幫助很小。

針對(duì)這些問(wèn)題,圖數(shù)據(jù)庫(kù)廠商正在積極構(gòu)建成熟的解決方案來(lái)滿足這兩點(diǎn)要求,市面上有越來(lái)越多高性能圖數(shù)據(jù)庫(kù)出現(xiàn)。目前,部分企業(yè)采取的替代方案是通過(guò)圖數(shù)據(jù)庫(kù) + 大數(shù)據(jù)平臺(tái)的方式實(shí)現(xiàn)大數(shù)據(jù)量的效果,但是這樣的解決方案由于技術(shù)門檻較高無(wú)法輕易掌握。

工業(yè)領(lǐng)域

圖模型具有強(qiáng)大的表現(xiàn)力對(duì)于快速更新的事物有很強(qiáng)的適應(yīng)性,在工業(yè)領(lǐng)域用來(lái)管理快速變化的庫(kù)存、供應(yīng)鏈關(guān)系。目前已有沃爾沃等汽車制造商,依靠圖數(shù)據(jù)庫(kù)優(yōu)化生產(chǎn)流程和供應(yīng)鏈管理。

在制造業(yè),供應(yīng)鏈的管理涉及到多人協(xié)作和實(shí)時(shí)庫(kù)存信息的反饋,包括匯總后的信息和明細(xì)數(shù)據(jù)的查詢,查詢過(guò)程涉及實(shí)體很多且關(guān)系復(fù)雜。此時(shí)圖數(shù)據(jù)庫(kù)在面對(duì)這類深度關(guān)聯(lián)的場(chǎng)景時(shí),優(yōu)勢(shì)就顯現(xiàn)出來(lái)了,因?yàn)橹恍枰ㄟ^(guò)邊的查詢就能找到相關(guān)聯(lián)的數(shù)據(jù),而無(wú)需對(duì)某一頂點(diǎn)做全局掃描,圖數(shù)據(jù)庫(kù)能夠做到對(duì)于流入數(shù)據(jù)的實(shí)時(shí)更新和數(shù)據(jù)深度遍歷。

圖數(shù)據(jù)庫(kù)技術(shù)的架構(gòu)

圖數(shù)據(jù)庫(kù)的技術(shù)架構(gòu)如下圖所示,整體上采用分層架構(gòu)的模式,由上至下分別是:接口層、計(jì)算層、存儲(chǔ)層。

 

圖數(shù)據(jù)庫(kù)的系統(tǒng)架構(gòu)

(1)接口層:接口層對(duì)外提供服務(wù),有如下幾種方式:

  • 查詢語(yǔ)言接口:提供除該圖數(shù)據(jù)庫(kù)原有查詢語(yǔ)言之外的語(yǔ)言查詢,例如 Cypher、Gremlin 等主流圖查詢語(yǔ)言接口。
  • API:提供 ODBC、JDBC、RPC、RESTful 等接口與應(yīng)用端交互。
  • SDK:在 Python、Java、C++ 等編程語(yǔ)言中通過(guò)庫(kù)函數(shù)的方式調(diào)用圖數(shù)據(jù)庫(kù)的接口。
  • 可視化組件:通過(guò)圖形化界面的形式展示和實(shí)現(xiàn)用戶的交互。

(2)計(jì)算層:提供對(duì)操作的處理和計(jì)算,包括語(yǔ)法解析、查詢引擎、優(yōu)化器、事務(wù)管理、任務(wù)調(diào)度和圖算法實(shí)現(xiàn)等。其中,圖算法可能是由圖數(shù)據(jù)庫(kù)本身提供,也可能是提供接口與圖處理引擎對(duì)接

(3)存儲(chǔ)層:圖數(shù)據(jù)庫(kù)有原生和非原生存儲(chǔ)兩種存儲(chǔ)方式,圖存儲(chǔ)引擎提供了圖數(shù)據(jù)結(jié)構(gòu)、索引邏輯上的管理。

圖查詢語(yǔ)言標(biāo)準(zhǔn)統(tǒng)一代表市場(chǎng)認(rèn)可度提升

與關(guān)系型數(shù)據(jù)庫(kù)不同,圖數(shù)據(jù)庫(kù)領(lǐng)域目前沒(méi)有統(tǒng)一的查詢語(yǔ)言,大多數(shù)查詢語(yǔ)言與產(chǎn)品緊密關(guān)聯(lián)。當(dāng)企業(yè)需要使用新的圖數(shù)據(jù)時(shí)需要重新學(xué)習(xí)語(yǔ)法,這帶來(lái)了不必要的學(xué)習(xí)成本。是否擁有一個(gè)統(tǒng)一的查詢語(yǔ)言標(biāo)準(zhǔn),也標(biāo)志著圖數(shù)據(jù)庫(kù)市場(chǎng)的成熟度。

在 2019 年 9 月 17 日,SQL 標(biāo)準(zhǔn)國(guó)際委員會(huì)投票決定,將 GQL 作為一種新的圖數(shù)據(jù)查詢標(biāo)準(zhǔn)語(yǔ)言。目前還無(wú)法確定 GQL 的第一個(gè)可實(shí)現(xiàn)版本,但很有可能在 2020 下半年會(huì)推出 GQL 圖查詢語(yǔ)言的完備草案。

查詢語(yǔ)言統(tǒng)一帶來(lái)的好處:

  • 降低企業(yè)學(xué)習(xí)成本—前期的學(xué)習(xí)成果是能夠積累在將來(lái)發(fā)揮作用的。新的查詢語(yǔ)言不只是簡(jiǎn)單的語(yǔ)法,還是一種新的語(yǔ)言使用思考方式。統(tǒng)一語(yǔ)言后,使用不同的圖數(shù)據(jù)庫(kù)將只意味工具不同,但是語(yǔ)言基礎(chǔ)是相通的。
  • 提升技術(shù)成熟度—企業(yè)不只擔(dān)心學(xué)習(xí)成本,更擔(dān)心的是整個(gè)技術(shù)的成熟程度。如果業(yè)界有一門統(tǒng)一的查詢語(yǔ)言,也就是當(dāng)企業(yè)認(rèn)為這種分析方式是穩(wěn)定而成熟的,才會(huì)認(rèn)可它。

云讓數(shù)據(jù)查詢和分析變得簡(jiǎn)單易用

目前將圖數(shù)據(jù)庫(kù)上云的廠商并不多,少數(shù)圖數(shù)據(jù)庫(kù)廠商提供云上圖數(shù)據(jù)庫(kù)部署,供數(shù)據(jù)科學(xué)家,開(kāi)發(fā)人員,業(yè)務(wù)分析師,學(xué)生和其他愛(ài)好者使用。開(kāi)發(fā)者可以在短時(shí)間里通過(guò)簡(jiǎn)單的步驟開(kāi)啟基于圖的解決方案配置。

大數(shù)據(jù)時(shí)代時(shí)代的業(yè)務(wù)增長(zhǎng)帶來(lái)了數(shù)據(jù)量的劇增和數(shù)據(jù)關(guān)聯(lián)的復(fù)雜化,與此同時(shí)企業(yè)對(duì)數(shù)據(jù)價(jià)值的期望也越來(lái)越高。根據(jù) DB Engines 近 7 年數(shù)據(jù)庫(kù)流行趨勢(shì)顯示,圖數(shù)據(jù)庫(kù)相較其他主流數(shù)據(jù)庫(kù)受歡迎程度遙遙領(lǐng)先,目前,國(guó)內(nèi)越來(lái)越多的廠商進(jìn)入圖數(shù)據(jù)庫(kù)領(lǐng)域,開(kāi)始構(gòu)建自己的圖數(shù)據(jù)庫(kù),圖數(shù)據(jù)庫(kù)的建設(shè)既需要全面的大數(shù)據(jù)技術(shù)又需要圖數(shù)據(jù)庫(kù)工程師和業(yè)務(wù)專家的持續(xù)協(xié)作,是一項(xiàng)長(zhǎng)期持續(xù)的工作,未來(lái),圖數(shù)據(jù)庫(kù)技術(shù)必將成為最為熱點(diǎn)的技術(shù)之一。

 

責(zé)任編輯:華軒 來(lái)源: AI前線
相關(guān)推薦

2020-02-25 17:04:05

數(shù)據(jù)庫(kù)云原生分布式

2025-04-03 11:04:40

2022-08-31 15:40:13

云原生數(shù)據(jù)

2020-04-06 14:45:22

云計(jì)算邊緣計(jì)算網(wǎng)絡(luò)

2022-12-01 14:43:56

物聯(lián)網(wǎng)智慧城市

2018-09-14 18:00:29

無(wú)損網(wǎng)絡(luò)

2019-08-05 08:42:37

物聯(lián)網(wǎng)IOT技術(shù)

2022-08-26 08:00:19

企業(yè)架構(gòu)IT

2023-09-05 09:49:03

2021-08-04 10:51:04

數(shù)據(jù)庫(kù)單元測(cè)試SQL

2020-03-17 08:29:29

數(shù)據(jù)庫(kù)備份技術(shù)

2016-01-20 09:54:51

微服務(wù)架構(gòu)設(shè)計(jì)SOA

2012-11-28 10:05:46

信息大數(shù)據(jù)

2015-08-03 10:40:45

動(dòng)效設(shè)計(jì)優(yōu)勢(shì)

2015-11-11 13:35:15

2021-05-24 11:30:49

智能建筑IOT物聯(lián)網(wǎng)

2024-10-25 09:19:18

2018-05-30 14:49:51

編程語(yǔ)言API語(yǔ)法

2022-02-11 11:17:24

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT

2020-03-27 16:05:49

數(shù)據(jù)庫(kù)數(shù)據(jù)MySQL
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)