中國信通院云大所主任魏凱解讀金融大數(shù)據(jù)
“所有大數(shù)據(jù)應(yīng)用的探索和技術(shù)的研發(fā),其實(shí)是圍繞著如何分析挖掘海量信息中的信息和價(jià)值,必須把大數(shù)據(jù)作為一種大資產(chǎn)來看待。”
在日前舉行的2018中國金融科技產(chǎn)業(yè)峰會(huì)上,中國信息通信研究院大數(shù)據(jù)研究部主任、可信區(qū)塊鏈聯(lián)盟(籌)秘書長、國際電聯(lián)分布式賬本焦點(diǎn)組副主席魏凱圍繞金融大數(shù)據(jù)和區(qū)塊鏈標(biāo)準(zhǔn)與評測,從三大方面解讀大數(shù)據(jù)之“大”的內(nèi)涵。
中國信息通信研究院大數(shù)據(jù)研究部主任 魏凱
魏凱表示:大數(shù)據(jù)要解決三個(gè)問題——大分析、大事務(wù)與大資產(chǎn),才能帶來大的價(jià)值,這是對大數(shù)據(jù)含義的理解,也是信通院近年在金融科技方面、大數(shù)據(jù)方面相關(guān)工作的代表。
大分析
“圍繞金融行業(yè),大分析的發(fā)展,可以劃分成幾個(gè)階段。”魏凱介紹。
2000年以前,銀行業(yè)是最早引入數(shù)據(jù)倉庫、數(shù)據(jù)分析的行業(yè)之一。銀行業(yè)傳統(tǒng)上是數(shù)據(jù)密集型行業(yè)。有相關(guān)報(bào)告顯示,每單位產(chǎn)值里,金融業(yè)的數(shù)據(jù)投資是最多的。在2000年之前,金融業(yè)就開始使用數(shù)據(jù)挖掘的技術(shù),主要依靠的是專用的數(shù)據(jù)庫、專用的硬件,應(yīng)用方面主要是經(jīng)營分析報(bào)表等較為簡單。
隨后,金融業(yè)的大數(shù)據(jù)應(yīng)用發(fā)生了顛覆性的轉(zhuǎn)變。以互聯(lián)網(wǎng)崛起為標(biāo)志,互聯(lián)網(wǎng)公司在軟件上的創(chuàng)新,用價(jià)格低廉的計(jì)算資源來做大分析,隨就又進(jìn)入到金融業(yè),進(jìn)入到更多傳統(tǒng)行業(yè)如電信、公安、醫(yī)療、交通等等。
從2010年起,大數(shù)據(jù)進(jìn)一步在社會(huì)各方面廣泛滲透,并產(chǎn)生了很強(qiáng)的技術(shù)基礎(chǔ),如Hadoop、Spark等等技術(shù)都成為支撐大數(shù)據(jù)發(fā)展非常堅(jiān)強(qiáng)的基礎(chǔ)。

回顧大分析所產(chǎn)生的重要變化,魏凱提到,首先,在互聯(lián)網(wǎng)業(yè)務(wù)的推動(dòng)下,不得不做的一件事就是分析系統(tǒng)的分布式轉(zhuǎn)型,必須采用分布式架構(gòu),既有成本上的考慮,更重要的是性能和擴(kuò)展性的需求,因此分析系統(tǒng)、數(shù)據(jù)挖掘系統(tǒng)首先進(jìn)行分布式的遷移。其次,新的理念從互聯(lián)網(wǎng)行業(yè)持續(xù)向金融業(yè)拓展,在銀行或其他金融機(jī)構(gòu)建設(shè)大數(shù)據(jù)分析系統(tǒng)時(shí),基于分布式成為了普遍選擇。其中的原因在于大分析的技術(shù)近年來突飛猛進(jìn)的發(fā)展,同時(shí)互聯(lián)網(wǎng)創(chuàng)造了開源的福利。
對于大分析技術(shù)的演進(jìn),魏凱主任從軟件、硬件層次的演進(jìn)給出了一張全面的圖解。

圍繞大分析這一主題,中國信通院近年來持續(xù)進(jìn)行相關(guān)的標(biāo)準(zhǔn)和評測的工作,從大數(shù)據(jù)產(chǎn)品、服務(wù)兩個(gè)方面,在基礎(chǔ)產(chǎn)品、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)分析應(yīng)用的多個(gè)維度,展開相關(guān)標(biāo)準(zhǔn)研究與測試,目前已經(jīng)有50多款相關(guān)產(chǎn)品參與了大數(shù)據(jù)平臺的評測。


大資產(chǎn)
“第二個(gè)大是資產(chǎn),如果數(shù)據(jù)是垃圾,我們的分析結(jié)果肯定靠不住,這是大家所有從業(yè)者的共識。”魏凱表示。
幾年前,傳統(tǒng)的金融機(jī)構(gòu)一直專注于投入大量資金去請咨詢公司做數(shù)據(jù)治理的項(xiàng)目。魏凱指出,幾年前,大家認(rèn)為,數(shù)據(jù)需要管理,需要去養(yǎng)數(shù)據(jù),不是說系統(tǒng)、平臺建好以后應(yīng)用就能運(yùn)行很順暢,數(shù)據(jù)還需要去管理、治理、運(yùn)維。近年來,數(shù)據(jù)管理也發(fā)生了很大的變化,帶來了概念上的升級,主要的變化在于:
數(shù)據(jù)應(yīng)用對象已經(jīng)發(fā)生了很大變化。原來的數(shù)據(jù)管理都是面向一些報(bào)表的等任務(wù),所以數(shù)據(jù)的應(yīng)用對象主要在于少數(shù)人?,F(xiàn)在,很多金融機(jī)構(gòu)的數(shù)據(jù)應(yīng)用對象是基層員工、柜員,甚至是最終用戶。數(shù)據(jù)管理的手段也發(fā)生很大變化,以前數(shù)據(jù)的管理靠人工,現(xiàn)在越來越多地依靠人工智能等手段進(jìn)行語義字段的匹配。數(shù)據(jù)管理的職能發(fā)生了重要變化。以前金融機(jī)構(gòu)的數(shù)據(jù)管理部門和業(yè)務(wù)部門涇渭分明。在信息科技下,數(shù)據(jù)和業(yè)務(wù)越來越分不開,因此數(shù)據(jù)管理職能也發(fā)生了重要變化。數(shù)據(jù)架構(gòu)發(fā)生很大變化,從經(jīng)典的數(shù)據(jù)倉庫類型的架構(gòu),正在向數(shù)據(jù)湖的方向發(fā)展,數(shù)據(jù)不需要去清洗、轉(zhuǎn)換、加載,而是數(shù)據(jù)線加載,需要使用的時(shí)候再轉(zhuǎn)換,這意味著架構(gòu)上的變化。數(shù)據(jù)種類發(fā)生變化。原有的數(shù)據(jù)主要是結(jié)構(gòu)化的數(shù)據(jù)為主,現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)越來越多。

“這五個(gè)層次的變化導(dǎo)致了數(shù)據(jù)管理需要向下一代演進(jìn)。”魏凱表示。“最重要的,數(shù)據(jù)要成為資產(chǎn)。”

因此,中國信通院牽頭成立了數(shù)據(jù)資產(chǎn)管理工作組,與業(yè)界在這方面領(lǐng)先的企業(yè)共同歸納總結(jié)數(shù)據(jù)資產(chǎn)管理的方法論,希望能夠給大家提供參考。在大數(shù)據(jù)的時(shí)代下,要把大數(shù)據(jù)資產(chǎn)管好,面臨的挑戰(zhàn)巨大。未來,大數(shù)據(jù)資產(chǎn)管理面臨的是大集中、全鏈接的趨勢,是支撐業(yè)務(wù)運(yùn)營深度融合的趨勢,同時(shí)將有更多新的技術(shù)可以支撐數(shù)據(jù)資產(chǎn)管理的發(fā)展。

大事務(wù)
魏凱主任從雙十一的電商年度大戰(zhàn)展開對于大事務(wù)的解讀:每年雙十一,阿里、京東等電商平臺的交易峰值節(jié)節(jié)攀高,基本上保持在每年都能夠翻一番的節(jié)奏。隨著網(wǎng)銀、互聯(lián)網(wǎng)金融的發(fā)展,傳統(tǒng)金融機(jī)構(gòu)這幾年交易處理量也在飛速增長,傳統(tǒng)的依賴主機(jī)中心化數(shù)據(jù)庫難以應(yīng)對增長如此迅猛的事物處理流量。
于是,金融機(jī)構(gòu),特別是各大銀行都開始了“核心下移”的工作,也就是用分布式數(shù)據(jù)庫承載越來越多的交易,為核心系統(tǒng)“減負(fù)”,并逐步向全開放的分布式架構(gòu)演進(jìn)。我們都知道,任何一家金融機(jī)構(gòu),用戶交易數(shù)據(jù)的處理系統(tǒng),是企業(yè)的生命線,是核心系統(tǒng)。但是,事物數(shù)據(jù)處理的分布式處理,實(shí)現(xiàn)起來難度很大,是硬骨頭,目前還沒有非常成熟的方案。為了解決這個(gè)痛點(diǎn),信通院也正在與多家銀行和數(shù)據(jù)庫廠商聯(lián)合攻關(guān)。

總的來看,當(dāng)前無論是金融業(yè)還是IT業(yè),都正在經(jīng)歷臨翻天覆地的變化,技術(shù)需求方與技術(shù)供給方都需要攜手,共同解決金融大數(shù)據(jù)應(yīng)用面臨的挑戰(zhàn)。

“我們信通院希望能夠扮演的角色,就是成為大數(shù)據(jù)技術(shù)發(fā)展的橋梁,鏈接各個(gè)方面,成為一個(gè)平臺,推動(dòng)術(shù)變得更好用,讓技術(shù)與金融行業(yè)融合的門檻不斷降低,讓科技更好的服務(wù)金融業(yè)務(wù)創(chuàng)新。”魏凱表示。
為進(jìn)一步落實(shí)國家《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》和《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》,支撐國家大數(shù)據(jù)戰(zhàn)略落地,推動(dòng)大數(shù)據(jù)產(chǎn)業(yè)交流與合作,展示我國大數(shù)據(jù)產(chǎn)業(yè)***發(fā)展成果,由中國信息通信研究院與數(shù)據(jù)中心聯(lián)盟大數(shù)據(jù)發(fā)展促進(jìn)委員會(huì)共同主辦的“2018大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)”將于2018年4月18-19日在北京國家會(huì)議中心隆重開幕。