金融大數(shù)據(jù)的機(jī)會
2016年12月3日第19期智能金融沙龍,文因互聯(lián)非常榮幸地邀請到金融大數(shù)據(jù)的大咖——北京視野金融的COO張燦,和大家聊聊金融大數(shù)據(jù)、人工智能金融和新三板數(shù)據(jù)的分析與整合。
張燦,視野金融聯(lián)合創(chuàng)始人、COO。12年金融IT從業(yè)經(jīng)驗(yàn),證券、基金從業(yè)資格。擁有大型、中型、創(chuàng)業(yè)公司工作經(jīng)驗(yàn),歷任銷售、咨詢、管理等崗位,具有豐富的企業(yè)管理和實(shí)戰(zhàn)經(jīng)驗(yàn)。
在金融大數(shù)據(jù)、新三板數(shù)據(jù)研究、XBRL、信貸財(cái)務(wù)分析、風(fēng)險(xiǎn)評級、支付、IT營銷管理領(lǐng)域有很深的研究,并擁有豐富的實(shí)踐經(jīng)驗(yàn)和深厚的人脈資源,曾主導(dǎo)過多家大型銀行、證券公司、第三方支付機(jī)構(gòu)信息系統(tǒng)及互聯(lián)網(wǎng)項(xiàng)目的建設(shè)。
本文為張燦在文因互聯(lián)智能金融沙龍現(xiàn)場分享的實(shí)錄:
一、金融大數(shù)據(jù)行業(yè)的發(fā)展
真正的金融信息化,應(yīng)該是在1998年之后才真正開始的。為什么說1998年之后?因?yàn)楫?dāng)時(shí)我們在某銀行做系統(tǒng)時(shí)就發(fā)現(xiàn)早些年的數(shù)據(jù)根本找不到。而到了2010年,金融機(jī)構(gòu)的數(shù)據(jù)質(zhì)量才慢慢好起來。
1.金融信息化二十年,金融數(shù)據(jù)在做什么?
數(shù)據(jù)大集中
數(shù)據(jù)大集中是一個(gè)過程,之前整個(gè)銀行體系都在分行,包括證券公司也是如此。這些金融機(jī)構(gòu)并沒有集中的數(shù)據(jù)中心概念,所以他們先做了數(shù)據(jù)大集中。
數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是在數(shù)據(jù)大集中的基礎(chǔ)上,提升、改善了數(shù)據(jù)的質(zhì)量。
報(bào)表
在上面兩步的基礎(chǔ)上,做了兩個(gè)報(bào)表:一個(gè)是監(jiān)管報(bào)表,另一個(gè)是內(nèi)部管理報(bào)表。
決策支持
決策支持是基于報(bào)表而形成的系統(tǒng)。但是,最后形成的決策支持系統(tǒng)扮演的角色并不是全局性的。比如,針對風(fēng)險(xiǎn)部門的是風(fēng)險(xiǎn)數(shù)據(jù)倉庫,針對業(yè)務(wù)部的是客戶數(shù)據(jù)倉庫,所以在金融信息化過程中,以上四個(gè)方面還是部分處于分離的狀態(tài)。
2. 最近幾年,金融數(shù)據(jù)在做什么?
數(shù)據(jù)效率和即席分析
最近幾年,大家又開始認(rèn)為數(shù)據(jù)收集過多。對國內(nèi)的金融機(jī)構(gòu)來講更是這樣。實(shí)際上從數(shù)據(jù)的角度來講,用戶量實(shí)在太大了?,F(xiàn)在我有幾個(gè)同事在用Hadoop給銀行做解決方案,大家發(fā)現(xiàn)數(shù)據(jù)效率已經(jīng)成了非常大的瓶頸,因?yàn)槠渲杏行┯?jì)算實(shí)在太復(fù)雜。
原來從數(shù)據(jù)庫導(dǎo)到數(shù)據(jù)倉庫里,可以延時(shí)來算這個(gè)數(shù)據(jù),但現(xiàn)在發(fā)現(xiàn)這樣不可行了。最典型的一個(gè)案例就是“反欺詐”。 P2P現(xiàn)在已經(jīng)有團(tuán)伙性作案詐騙,這就導(dǎo)致選擇模型很難,然而又不能像銀行放貸一樣速度很慢。所以我覺得,提升數(shù)據(jù)效率和即席分析這兩個(gè)結(jié)合起來,誕生了非常多的機(jī)會。
數(shù)據(jù)整合
無論做什么樣的分析,數(shù)據(jù)質(zhì)量是最重要的。如果數(shù)據(jù)質(zhì)量差,很多事情都做不了。
公開數(shù)據(jù)現(xiàn)在越來越開放,比如說工商數(shù)據(jù)、征信數(shù)據(jù)。所以我覺得很多公開數(shù)據(jù)的運(yùn)用,確實(shí)為數(shù)據(jù)分析提供了非常好的基礎(chǔ)。
智能金融的嘗試
為什么用嘗試二字,因?yàn)槲疫€是持一個(gè)比較保守的觀點(diǎn)。就智能金融而言,現(xiàn)在的數(shù)據(jù)挖掘技術(shù)與人工智能技術(shù)還是不夠的,但是我相信科技的不斷發(fā)展肯定會解決這個(gè)問題。我一直堅(jiān)信一個(gè)觀點(diǎn)就是:以后絕對不會存在物理上云的概念。再過十年或者二十年所有的東西都是云,這就是趨勢,是你沒有辦法改變的。我覺得智能金融或者大數(shù)據(jù)是一個(gè)趨勢,是一個(gè)沒有辦法去改變、沒有余地可討論的趨勢。
3. 銀行、貸款機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用熱點(diǎn)
信用評級+
這部分對金融機(jī)構(gòu)來說是不可或缺的,無論是何種形式的評級都發(fā)展得很快。
押品管理
這是大家沒有解決好的一點(diǎn)。比如車貸評級還是一個(gè)弱項(xiàng)。
實(shí)時(shí)放貸
銀行在這方面的應(yīng)用上其實(shí)要負(fù)一大部分責(zé)任。因?yàn)槲覀兊慕鹑隗w系還不健全,導(dǎo)致小額貸款難度較大。
實(shí)時(shí)預(yù)警
提到實(shí)時(shí)放款就會涉及到實(shí)時(shí)預(yù)警。做到實(shí)時(shí)預(yù)警,需要將現(xiàn)有數(shù)據(jù)系統(tǒng)變成一個(gè)可計(jì)算的系統(tǒng)。整個(gè)的存儲架構(gòu)包括業(yè)務(wù)邏輯與數(shù)據(jù)計(jì)算的架構(gòu),都需要做出改變。實(shí)時(shí)預(yù)警并不僅僅是計(jì)算模型這么簡單,貸前、貸中與貸后的實(shí)時(shí)預(yù)警都是必須的。如果大家有興趣做,這會是一塊很大的市場。
另外還有兩個(gè)大數(shù)據(jù)的應(yīng)用熱點(diǎn)是“營銷和客戶分析”和“金融機(jī)構(gòu)的工廠化”。
4. 投資機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用熱點(diǎn)
投資機(jī)構(gòu)的大數(shù)據(jù)應(yīng)用是這兩年我們一直在做的事情。
第一張圖是“百度股市通”,我覺得挺有意思的是股票雷達(dá),用搜索的情緒來看其對A股的影響。因?yàn)锳股確實(shí)是散戶市場,情緒的影響確實(shí)很明顯。使用以后你會發(fā)現(xiàn),搜索熱度和上證指數(shù)在一年和兩年的時(shí)期內(nèi)基本是一致的。
對于現(xiàn)在比較熱門的量化,我們也在和公募基金、私募基金合作進(jìn)行研究。但是需要明白的是,量化還有很長的路要走。再往下講就是風(fēng)控、投資機(jī)構(gòu)合規(guī)性做的很好。但是對市場的預(yù)警與企業(yè)的預(yù)警,銀行比證券公司做得好,比如在證券市場崩盤前很多銀行已經(jīng)在撤資了。
二、企業(yè)分析評價(jià)探討
1. 企業(yè)評級的演變
企業(yè)風(fēng)險(xiǎn)評級有一個(gè)演變的過程:打分卡 → 評級 → 風(fēng)險(xiǎn)預(yù)警
關(guān)于影響企業(yè)評級的因素,有以下幾個(gè)維度:
財(cái)務(wù)因素
只考慮財(cái)務(wù)指標(biāo),數(shù)據(jù)全部來源于財(cái)務(wù)報(bào)表,并可由系統(tǒng)自動計(jì)算指標(biāo)值,標(biāo)識指標(biāo)值的表現(xiàn)好壞,按照一定規(guī)則計(jì)算出財(cái)務(wù)評分,得到財(cái)務(wù)子模型評級級別。
非財(cái)務(wù)因互素
涉及一般情況下可獲取的客戶相關(guān)信息,例如財(cái)務(wù)管理水平,經(jīng)營管理水平,外部征信情況,銀企關(guān)系等。
行業(yè)地區(qū)因素
主要業(yè)務(wù)范圍所處地區(qū)的信用分析、所在行業(yè)的前景展望和行業(yè)信用分析。
財(cái)務(wù)預(yù)警
主要考慮對客戶評級級別影響較大的財(cái)務(wù)指標(biāo),其值可以由系統(tǒng)自動從財(cái)務(wù)報(bào)表中計(jì)算得到。比較指標(biāo)值與預(yù)警的閥值,顯示是否有預(yù)警。
非財(cái)務(wù)預(yù)警
考慮出現(xiàn)概率比較小,影響程度比較大的預(yù)警事件。
外部影響
要考慮與企業(yè)相關(guān)的宏觀信息,例如政府支持、政策導(dǎo)向、重大經(jīng)濟(jì)事件等。
2. 行業(yè)分析的拓展
大家做企業(yè)評級、分析、參照的核心其實(shí)是兩點(diǎn):行業(yè)和規(guī)模。實(shí)際上,我覺得行業(yè)分類無論是采用統(tǒng)計(jì)局還是證監(jiān)會的分類標(biāo)準(zhǔn),其實(shí)差別都不大。況且,在分析中小企業(yè)時(shí),這些標(biāo)準(zhǔn)的適用性并不強(qiáng)。
關(guān)于行業(yè)分析的擴(kuò)展,視野金融也正在進(jìn)行嘗試。
首先,我們做的是宏觀數(shù)據(jù)和行業(yè)數(shù)據(jù)的配比。宏觀數(shù)據(jù)的可讀性較差,可以說只是一個(gè)庫而已。但對單列的某個(gè)行業(yè)來講,比如鐵路運(yùn)輸量和煤炭行業(yè),白酒的銷售和A股白酒行業(yè)的業(yè)績表現(xiàn),這些指標(biāo)和行業(yè)趨勢還是比較吻合的。將統(tǒng)計(jì)局的數(shù)據(jù)與行業(yè)數(shù)據(jù)相結(jié)合,還是可以看到大趨勢的。
其次,是關(guān)聯(lián)關(guān)系的分析。A股的兩千多家公司中有很多關(guān)聯(lián)公司,如果再加上新三板的掛牌企業(yè),相當(dāng)于將一萬多家企業(yè)進(jìn)行關(guān)聯(lián)。將這兩部分關(guān)聯(lián)關(guān)系的優(yōu)點(diǎn)是:披露信息更全。因?yàn)橥ㄟ^工商數(shù)據(jù)的關(guān)聯(lián)關(guān)系,只能查到一些股權(quán)關(guān)系,信息不夠全面。
最后,是大家都在嘗試的產(chǎn)業(yè)鏈分析。這其中涉及前五大供應(yīng)商、前五大供貨商的分析等。
三、新三板數(shù)據(jù)挖掘探討
大家在新三板上想做的事情,我覺得都很類似。無非是企業(yè)畫像、投資機(jī)構(gòu)畫像、投資模型、并購模型、引入第三方數(shù)據(jù)等。我們現(xiàn)在其實(shí)也能感覺出來,通過數(shù)據(jù)發(fā)現(xiàn)企業(yè)價(jià)值和對投資機(jī)構(gòu)分析的需求是非常核心的。目前,我認(rèn)為新三板還處于一個(gè)“不透明”的起步階段,大家想知道很多問題。比如投資機(jī)構(gòu)想知道其他類似投資機(jī)構(gòu)的投資收益。新三板公司也希望知道同行業(yè)里有哪些投資機(jī)構(gòu)在投,有哪些動作,如果融資的話,以一個(gè)怎樣的價(jià)格談比較合適。
在引入第三方數(shù)據(jù)時(shí),我們發(fā)現(xiàn)三板四板、A股、美股港股、國家統(tǒng)計(jì)局、國資委、工商、證監(jiān)協(xié)會的數(shù)據(jù)量比A股大的多。A股是兩千多家公司,加上四板和新三板企業(yè),差不多有五萬多家企業(yè)。所以,對這部分?jǐn)?shù)據(jù)的挖掘任務(wù)還是非常重的。
四、聊聊企業(yè)融資
在做新三板市場時(shí),我們發(fā)現(xiàn)大家都在考慮股權(quán)融資。但是適當(dāng)借債或者是用并購的思路去融資也是不錯(cuò)的選擇?,F(xiàn)在,很多新三板企業(yè)融資難,解決這個(gè)問題的核心就是要讀懂金融機(jī)構(gòu)的思維。簡單來說,銀行思考的是企業(yè)的償債能力,而投資機(jī)構(gòu)思考的是能不能退出。因?yàn)殂y行的錢基本來自于存在,所以銀行要保證資金的安全性,其次是能否兌付。投資機(jī)構(gòu)則需要保證資金的按時(shí)的收益率。
最后一點(diǎn),我認(rèn)為企業(yè)要對照投資機(jī)構(gòu)的思維挖掘自身優(yōu)勢,包括投資機(jī)構(gòu)看重的行業(yè)的一些優(yōu)勢,比如這家投資機(jī)構(gòu)投過產(chǎn)業(yè)鏈里哪些企業(yè)等。除此之外,企業(yè)還需要對金融機(jī)構(gòu)有一個(gè)判斷,了解投資機(jī)構(gòu)的偏好、創(chuàng)始人和合伙人的背景,這樣你會發(fā)現(xiàn)融資的脈絡(luò)就會變得很清晰了。
嘉賓提問環(huán)節(jié):
1.關(guān)于建設(shè)企業(yè)數(shù)據(jù)庫,很多金融機(jī)構(gòu)都有這方面的需求,但是為什么現(xiàn)在還沒有出現(xiàn)?
答: 我簡單說一下我的觀點(diǎn),第一個(gè)就是銀行和證券行業(yè)看起來都是金融行業(yè),但其實(shí)處于信息不對稱的割裂狀態(tài)。去年,某銀行在做一個(gè)項(xiàng)目時(shí)需要一些企業(yè)數(shù)據(jù),而那家供應(yīng)商的解決方式是在新浪網(wǎng)上搜。我認(rèn)為,這樣的信息是割裂的。另一方面,這件事情雖然有價(jià)值,但前期投入太高,所以收益并不太高,比如說國內(nèi)的知名金融數(shù)據(jù)終端在新三板上面吃力但不討好。
但是我們想過一個(gè)方式,比如大智慧在安徽建立了一個(gè)基地。把這個(gè)標(biāo)準(zhǔn)定好的話,可以請一些稍微便宜的人力來解決這個(gè)問題。機(jī)器雖然可以解決一大部分事情,但是很多事后還是需要依靠人力。
2.能不能具體分享一下,在特定行業(yè)中的數(shù)據(jù)服務(wù)?
答:目前,針對特定行業(yè)數(shù)據(jù)服務(wù)的需求還是挺多的,這是一個(gè)典型的金融機(jī)構(gòu)需求。因?yàn)榻鹑跈C(jī)構(gòu)其實(shí)是不懂行業(yè)的,也不可能去培養(yǎng)那么多特定行業(yè)的人去研究某個(gè)行業(yè)。所以我覺得金融機(jī)構(gòu)獲取行業(yè)信息的途徑可以分三部分:第一部分就是研究報(bào)告,比如券商或者獨(dú)立研究機(jī)構(gòu)的研究報(bào)告;第二部分則是聘請咨詢公司做調(diào)研;第三部分就是請一些行業(yè)專家做一個(gè)訪談。像大型金融機(jī)構(gòu)會在每年校招的時(shí)候傾向去招相關(guān)專業(yè)的人才。