人工智能進軍風(fēng)控,血肉之軀會不會失業(yè)?
史蒂夫·喬布斯的“reinvents the phone”不僅重新定義了手機,而且改變了世界,將人類一舉拉近移動互聯(lián)網(wǎng)時代,并且結(jié)合金融,形成了互聯(lián)網(wǎng)+金融的普惠模式。
目前來看,天朝的移動支付妥妥的處于全球領(lǐng)先地位。只要會使用智能手機,在大天朝的一線城市已經(jīng)可以不帶錢包出行了,普羅大眾都已經(jīng)能體會到互聯(lián)網(wǎng)金融時代的便利。
而近期阿爾法狗(AlphaGo)的成功,讓吃瓜群眾發(fā)現(xiàn) AI (人工智能-Artificial Intelligence)已非昔年靠窮舉法贏棋的“深藍”(IBM開發(fā)的國際象棋機器人),而是有了自主推理學(xué)習(xí)能力,大家不免擔(dān)心人類是不是有朝一日會被人工智能機器人“顛覆”掉?
只看當(dāng)下,人工智能已經(jīng)在無人駕駛、圖像處理、語音識別方面取得了突破性的應(yīng)用,那金融領(lǐng)域呢?
李開復(fù)老師曾談及人工智能應(yīng)用的三個要素:數(shù)據(jù)、處理數(shù)據(jù)的能力和商業(yè)變現(xiàn)的場景。人工智能解決金融界問題的過程, 很好的對應(yīng)了這三個要素。也許, 金融領(lǐng)域是人工智能最合適不過的顛覆場景了。
在金融業(yè)務(wù)的前端,已經(jīng)有不少傳統(tǒng)銀行將人工智能用于為客戶定制服務(wù),開發(fā)理財產(chǎn)品的應(yīng)用,例如巴克萊銀行和花旗銀行等。 國內(nèi)招商銀行也開始試用全新的人工智能業(yè)務(wù)模式,未來人工智能和機器學(xué)習(xí)技術(shù)在金融業(yè)前端會有更多的便捷精準(zhǔn)服務(wù)提供給客戶。
那么金融應(yīng)用領(lǐng)域的后端呢? 尤其是信息安全、投資風(fēng)控、資產(chǎn)管理等方面的,對于躲在觸屏手機背后的客戶,缺失央行數(shù)據(jù)的客戶,銀行沒有辦法通過一雙雙眼睛去看到用戶是謙謙君子還是騙子流氓。這個時候, 金融后端,傳統(tǒng)金融風(fēng)控手段覆蓋不到和難以觸及的, 那么“互聯(lián)網(wǎng)+金融”業(yè)務(wù)就要結(jié)合更廣泛的互聯(lián)網(wǎng)數(shù)據(jù)和人工智能手段, 就可以處理更廣泛的金融客戶問題。
從這個角度考慮,新金融時代,具備自主學(xué)習(xí)能力后的AI,是真的要“顛覆”傳統(tǒng)金融風(fēng)控了嗎? 在引入人工智能處理互聯(lián)網(wǎng)行業(yè)幾十萬維數(shù)據(jù)的處理手段,“降維”處理金融業(yè)界萬維、千維數(shù)據(jù)的時候,會形成有效的降維攻擊嗎?
在談及機器學(xué)習(xí)在金融場景中的實際應(yīng)用之前,首先我們對金融風(fēng)控的一個標(biāo)準(zhǔn)業(yè)務(wù)流程進行梳理,通常一個風(fēng)控業(yè)務(wù)包括前端頁面用戶資料申請?zhí)峤缓褪占?,反欺詐、合規(guī)、邏輯校驗,核心決策授信包括申請評分和電調(diào),以及最后的催收。
面對這套業(yè)務(wù)流程, 新金融風(fēng)控領(lǐng)域面對的數(shù)據(jù)痛點,一般有幾大類:
反欺詐
業(yè)務(wù)流程上,AI自主學(xué)習(xí)已經(jīng)在每個風(fēng)控節(jié)點發(fā)揮作用。比如反欺詐環(huán)節(jié),在互聯(lián)網(wǎng)的環(huán)境里, 金融風(fēng)控面臨的傳統(tǒng)個體欺詐已迅速演變?yōu)橛薪M織、有規(guī)模的群體欺詐和關(guān)聯(lián)風(fēng)險。而傳統(tǒng)反欺詐還停留在識別一度風(fēng)險等這種簡單規(guī)則方式,如聯(lián)系人中借貸人個數(shù)等,對于二度、三度乃至更廣范圍的網(wǎng)絡(luò)全局風(fēng)險苦無良策。
AI學(xué)習(xí)里面基于圖的半監(jiān)督算法完美解決了這一訴求,基于申請人、手機號、設(shè)備、IP地址等各類信息節(jié)點構(gòu)建龐大網(wǎng)絡(luò)圖,并可在此之上進行基于規(guī)則和機器學(xué)習(xí)的反欺詐模型實時識別。
核心授權(quán)決策
在申請評分環(huán)節(jié),傳統(tǒng)金融風(fēng)控往往是基于評分卡體系對強征信數(shù)據(jù)如銀行借貸記錄等進行建模,而新金融的業(yè)務(wù)下,客群的進一步“下沉”,覆蓋更多收入群體,新增群體的強征信數(shù)據(jù)往往大量缺失,金融機構(gòu)不得不使用更多弱金融數(shù)據(jù), 辟如消費數(shù)據(jù)、運營商數(shù)據(jù)、互聯(lián)網(wǎng)行為數(shù)據(jù)等。
這類底層數(shù)據(jù)的改變,對傳統(tǒng)信用評分卡造成了巨大的困難,具體體現(xiàn)在:
- 諸如互聯(lián)網(wǎng)行為、運營商數(shù)據(jù)很多都是非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)繁雜, 建模前的特征工程很難用傳統(tǒng)人工的方式完成加工。
- 由于數(shù)據(jù)類型和范圍的大幅擴大,新模型面對的往往是加工出來的上千維弱變量特征,評分卡體系根本無法融合吸收這些特征。
- 線上新金融業(yè)務(wù)風(fēng)險環(huán)境頻繁演化,傳統(tǒng)人工迭代模型無法適應(yīng)風(fēng)險變化速度,迭代優(yōu)化太慢。
AI學(xué)習(xí)對上述問題有獨到處理。面對數(shù)據(jù)繁雜的問題,基于深度學(xué)習(xí)的特征生成框架已被成熟運用于大型風(fēng)控場景中,對諸如時序、文本、影像等互聯(lián)網(wǎng)行為、運營商非結(jié)構(gòu)化數(shù)據(jù)實現(xiàn)了深層特征加工提取,顯現(xiàn)出對模型效果超出想象的提升。
【圖注】上圖為大型信用貸場景中模型重要性特征列表,機器學(xué)習(xí)特征比例已經(jīng)超過專家人工特征。
經(jīng)過大量實踐表明,針對數(shù)據(jù)駕馭難的挑戰(zhàn),不同的數(shù)據(jù)用合適的模型才能挖掘出其最大價值。AI學(xué)習(xí)方法過去在互聯(lián)網(wǎng)廣告、搜索、推薦等技術(shù)的成熟應(yīng)用,正是對不同類型的數(shù)據(jù)用不同的機器學(xué)習(xí)模型進行處理,將此移植到金融場景中,用復(fù)雜集成模型就可以輕車熟路地處理上千維度的弱變量,并將之與違約風(fēng)險精準(zhǔn)掛鉤。
解決模型迭代慢是AI最擅長的事情。 過去互聯(lián)網(wǎng)公司每天都產(chǎn)生海量用戶數(shù)據(jù),需要對搜索、推薦模型持續(xù)頻繁地在線優(yōu)化,自迭代頻次比金融領(lǐng)域更快速更準(zhǔn)確,這是人工迭代幾乎無法解決的問題。因此在金融風(fēng)控中,通過對模型特征、借貸群體、模型性能和業(yè)務(wù)反饋等多方面的監(jiān)控,AI學(xué)習(xí)模型已經(jīng)能很好地進行在線快速自迭代。
事實上,AI學(xué)習(xí)要解決的問題很清晰,所有的這一套數(shù)據(jù)適配融合、群體反欺詐、特征工程、模型構(gòu)建和訓(xùn)練、性能監(jiān)控與自迭代的機制,包括深度學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、在線學(xué)習(xí)等技術(shù),核心都是為了將互聯(lián)網(wǎng)級別的機器學(xué)習(xí)技術(shù)“降維”應(yīng)用到金融領(lǐng)域,解決新金融場景上數(shù)據(jù)的獨特性。因此,可能在不久的將來,AI風(fēng)控結(jié)合大數(shù)據(jù)將成為線上主流的風(fēng)控模式,只是這一天,到底有多遠呢?