自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

打造線上的大數(shù)據(jù)風(fēng)控,我們發(fā)現(xiàn)了這三個(gè)坑

大數(shù)據(jù)
這三個(gè)坑是我回國(guó)以后需要解決的課題,從目前的情況來(lái)看,國(guó)內(nèi)的Fintech行業(yè)前景還是非常樂(lè)觀。中國(guó)的大數(shù)據(jù)風(fēng)控不論在實(shí)用性還是開(kāi)放性上,都要優(yōu)于國(guó)外,企業(yè)也愿意投入更多的資金來(lái)促進(jìn)技術(shù)的進(jìn)步,這都為我們行業(yè)的發(fā)展提供了充足的動(dòng)力。

[[178506]]

今年10月,我在羅敏的邀請(qǐng)下從美國(guó)回到了國(guó)內(nèi),在這之前,我一直都在美國(guó)的商業(yè)銀行Capital One工作。

在美國(guó)期間,我也在關(guān)注中國(guó)的消費(fèi)金融市場(chǎng)。一方面,中國(guó)這幾年在Fintech領(lǐng)域的突破令全世界都嘆為觀止,對(duì)全球的金融機(jī)構(gòu)來(lái)說(shuō),“中國(guó)Fintech”都是一個(gè)很好的研究樣本。另一方面,有很多我在美國(guó)的同事在近幾年陸陸續(xù)續(xù)的回國(guó)投身到了金融創(chuàng)新的大潮中,我們有一個(gè)微信群,也會(huì)經(jīng)常在群里面交流,這也成了我了解中國(guó)金融現(xiàn)狀的另外一個(gè)通道。

在回國(guó)的這一個(gè)多月里,我跟我現(xiàn)在的同事有過(guò)很多的交流。這是一個(gè)很能打仗的團(tuán)隊(duì),他們?cè)谝荒臧氲臅r(shí)間內(nèi)已經(jīng)基本上完成了將線下風(fēng)控搬到線上的目標(biāo)。

風(fēng)控由線下轉(zhuǎn)到線上是一個(gè)大趨勢(shì),對(duì)這一點(diǎn)我在之后的文章會(huì)探討。但線上大數(shù)據(jù)風(fēng)控的搭建需要長(zhǎng)期的完善過(guò)程,不論從我們個(gè)體還是整個(gè)行業(yè)來(lái)看,大數(shù)據(jù)風(fēng)控都還有許多的坑需要我們?nèi)ヌ睢?/p>

***個(gè)坑是具有中國(guó)特色的團(tuán)伙欺詐難題。

目前國(guó)內(nèi)的信用市場(chǎng),反欺詐仍然是頭號(hào)難題,而授信將會(huì)被作為長(zhǎng)期的目標(biāo)逐步完善。當(dāng)然,我提到中國(guó)特色反欺詐并不意味國(guó)外就沒(méi)有欺詐,只不過(guò)各地的犯罪分子會(huì)“因地制宜”的制定不同的欺詐策略使得欺詐更容易得手。

在Capital One的時(shí)候,我們會(huì)對(duì)欺詐進(jìn)行分類,比如說(shuō)有first-party fraud以及third-party fraud。

所謂的first-party fraud是指欺詐主體就是犯罪分子自己,沒(méi)有第三方受害者,犯罪分子會(huì)用虛假的信息來(lái)偽裝成好人然后獲取信用。在美國(guó),曾經(jīng)很常用的一種first-party fraud手段是虛假信息養(yǎng)號(hào)。

美國(guó)的銀行調(diào)用傳統(tǒng)征信機(jī)構(gòu)數(shù)據(jù)時(shí),如果能發(fā)現(xiàn)某個(gè)人的信用記錄,那就會(huì)默認(rèn)這個(gè)人存在。犯罪分子會(huì)利用這一點(diǎn),先制造多個(gè)假的名字和身份去申請(qǐng)信用貸款或成為主賬號(hào)的授權(quán)用戶,初期他們很可能會(huì)被拒絕,但這些假的身份信息已經(jīng)被記錄在案,而且他的信用等級(jí)也有可能會(huì)隨著時(shí)間的推移而逐漸好轉(zhuǎn)。接下來(lái),他可能會(huì)去申請(qǐng)一些小額的次級(jí)信貸,比如抵押300美元,獲得500美元的貸款,如果他表現(xiàn)良好,信用等級(jí)會(huì)進(jìn)一步提高。在把賬號(hào)逐漸養(yǎng)肥了以后,這些犯罪分子會(huì)申請(qǐng)高額度的貸款然后跑路。

而third-party fraud是指犯罪分子將自己偽裝成別人來(lái)欺詐,也就是盜用別人的信用身份。在國(guó)外最猖獗的一種欺詐方式是交易欺詐,比如說(shuō)信用卡盜用。國(guó)外的信用卡非常普及,犯罪分子可能會(huì)利用黑客技術(shù)去盜用信息復(fù)制卡片,然后刷卡跑路。這種詐騙的危險(xiǎn)性很高,如果你不在交易當(dāng)時(shí)就阻止他,之后就很難追回被欺詐的錢款。這種欺詐在國(guó)內(nèi)也有過(guò)相關(guān)的記錄,但數(shù)量比較少。

[[178507]]

黑客問(wèn)題始終在威脅美國(guó)信用卡用戶

中國(guó)特色的欺詐特點(diǎn)是有組織的黑產(chǎn)軍團(tuán),直接與商家短兵相接,一有不慎,商家就損失慘重。

針對(duì)first-party fraud,我們現(xiàn)在有比較完善的解決方案,主要是采用人臉動(dòng)靜態(tài)識(shí)別,手機(jī)實(shí)名識(shí)別,筆跡識(shí)別等一系列的手段,讓你證明“你是你”,然后通過(guò)自有和第三方的詐騙黑名單,將一系列有詐騙嫌疑的用戶剔除。但有的詐騙老手可能已經(jīng)知道自己在黑名單里面了,他在填寫(xiě)信息時(shí)會(huì)采用更改敏感信息的方式來(lái)欺騙數(shù)據(jù)庫(kù),這個(gè)時(shí)候我們需要用到機(jī)器學(xué)習(xí)里面的模糊匹配,用一些關(guān)鍵詞的變種去捕捉用戶的真實(shí)身份。更高級(jí)的方式是進(jìn)行用戶網(wǎng)絡(luò)畫(huà)像,根據(jù)用戶的地址、電話、社交圈等等屬性,以一個(gè)個(gè)人為點(diǎn),形成一個(gè)復(fù)雜的用戶網(wǎng)絡(luò)。每個(gè)人在他的網(wǎng)絡(luò)里會(huì)有一些活躍的因素,如果你的網(wǎng)絡(luò)里面欺詐的指數(shù)比其他的網(wǎng)絡(luò)要高,那就可以判斷你的欺詐指數(shù)比較高。

真正棘手的問(wèn)題在于團(tuán)伙作案的third-party fraud。比較常見(jiàn)的一種方式是刷單詐騙:詐騙分子以付費(fèi)刷單為由找到我們的用戶,讓用戶下單以后將借到的錢或買的貨轉(zhuǎn)給他,并保證借款不需要由用戶來(lái)還,但事實(shí)上,詐騙分子在拿到借款以后就會(huì)跑路,還款以及逾期都?jí)旱搅擞脩舻念^上。這樣的案例,跟銀行儲(chǔ)蓄用戶被欺詐轉(zhuǎn)賬實(shí)際上是同樣的性質(zhì),行業(yè)內(nèi)的多家企業(yè)都已經(jīng)受到侵害,從根本上看,這不僅僅是線上風(fēng)控的問(wèn)題,線下風(fēng)控團(tuán)隊(duì)也難以規(guī)避,因?yàn)檎业轿覀兘杩畹挠脩粲玫亩际钦鎸?shí)的信息,我們給用戶的額度也在合理的范圍內(nèi),這樣的詐騙方式會(huì)讓平臺(tái)處于很被動(dòng)的處境。

現(xiàn)在的處理方式只能是發(fā)現(xiàn)一起就抓一起,發(fā)生之后處理的速度是關(guān)鍵。但之后,我們會(huì)采用更主動(dòng)的方式來(lái)防御。目前,我們?cè)谒鸭覀冏约汉屯袀冇龅降南嚓P(guān)案例,尋找這部分容易被利用的人群身上的共性。在有足夠的樣本以后,我們可以梳理出這些用戶的畫(huà)像,并建立相關(guān)的風(fēng)控模型。在以后,我們將不僅僅是守株待兔,更可以主動(dòng)出擊,對(duì)有被欺詐風(fēng)險(xiǎn)的用戶主動(dòng)做出提醒、溝通確認(rèn)或暫緩貸款的規(guī)避措施。

第二個(gè)坑是系統(tǒng)和數(shù)據(jù)沒(méi)經(jīng)過(guò)壓力測(cè)試。

硬件產(chǎn)品在出廠之前往往要經(jīng)過(guò)壓力測(cè)試,例如蘋果手機(jī)在發(fā)布前會(huì)抽樣進(jìn)行摔落、重壓、扭曲、敲擊等一系列的折磨,以保障產(chǎn)品在真實(shí)使用過(guò)程中的高度可靠。

風(fēng)控系統(tǒng)也一樣,我們?cè)诖罱L(fēng)控系統(tǒng)時(shí)要考慮可能會(huì)面臨的各種經(jīng)濟(jì)狀況,以保障風(fēng)控的有效性。而我們的大數(shù)據(jù)概念,是近幾年才建立起來(lái)的,客觀來(lái)說(shuō),現(xiàn)在的大數(shù)據(jù)并不全面,無(wú)法覆蓋到所有的經(jīng)濟(jì)情況。這個(gè)時(shí)候,更多的是需要風(fēng)控專家的經(jīng)驗(yàn),保證風(fēng)控系統(tǒng)在經(jīng)濟(jì)環(huán)境發(fā)生變化時(shí)不會(huì)突然失控。

我在Capital One的時(shí)候,曾經(jīng)經(jīng)歷過(guò)風(fēng)控突然失靈的狀況。我們?cè)诖罱L(fēng)控模型初期,曾經(jīng)把剛畢業(yè)的用戶是否申請(qǐng)了學(xué)生貸款作為一個(gè)重要的參數(shù)。理論上來(lái)說(shuō),學(xué)生申請(qǐng)學(xué)生貸款,通常是為了就讀高花費(fèi)的學(xué)位,例如MBA。畢業(yè)后,這些學(xué)生也往往能獲得華爾街和硅谷名企的offer,是一個(gè)受到高等教育同時(shí)擁有高收入的群體,因此風(fēng)險(xiǎn)相對(duì)較小。在很長(zhǎng)的一段時(shí)間內(nèi),他們的風(fēng)控表現(xiàn)的確符合我們的預(yù)期。

然而,這個(gè)參數(shù)在2008年金融危機(jī)時(shí)期突然失效了,雖然那段時(shí)間美國(guó)整體的逾期率都有上升,但這部分曾經(jīng)的優(yōu)質(zhì)用戶逾期率上升幅度遠(yuǎn)大于平均值。我們?cè)诜治鰰r(shí)發(fā)現(xiàn),這部分用戶在雙重經(jīng)濟(jì)壓力下導(dǎo)致信用崩潰。美國(guó)失業(yè)率在2009年10月上升到10.2%,是1983年以來(lái)的***失業(yè)率,是危機(jī)前失業(yè)率的兩倍。而這部分高學(xué)歷學(xué)生所向往的金融行業(yè)是失業(yè)高發(fā)行業(yè),他們?cè)诋厴I(yè)后面臨著非常嚴(yán)苛的就業(yè)環(huán)境,同時(shí),他們?cè)诋厴I(yè)后也面臨著償還高額的學(xué)生貸款。雙重壓力使他們的還款能力大幅下降。

[[178508]]

經(jīng)濟(jì)危機(jī)中,雷曼兄弟破產(chǎn)

我們發(fā)現(xiàn)這個(gè)問(wèn)題后也想做一些模型上的改動(dòng),但發(fā)現(xiàn)這將會(huì)牽扯太多的因素,修改周期內(nèi)也會(huì)產(chǎn)生更多的損失,***我們強(qiáng)行加了一個(gè)算法,有學(xué)生貸款的用戶在進(jìn)風(fēng)控之前就先砍掉,先止損然后逐步改進(jìn)算法。

我們國(guó)內(nèi)的風(fēng)控也面臨著同樣甚至更大的風(fēng)險(xiǎn),美國(guó)經(jīng)歷過(guò)的金融危機(jī)我們并沒(méi)有經(jīng)歷過(guò),但這不能保證以后不會(huì)發(fā)生。這要求我們?cè)谧鲲L(fēng)控時(shí)要考慮更多的細(xì)節(jié),更有預(yù)見(jiàn)性和前瞻性。但這件事情同時(shí)也充滿了挑戰(zhàn),大數(shù)據(jù)的維度太多,要在哪些維度上深入探究才能起到***的防范效果,需要進(jìn)行長(zhǎng)期的測(cè)試。

第三個(gè)坑是高速發(fā)展過(guò)程中的模型搭建問(wèn)題。

中國(guó)的Fintech市場(chǎng)經(jīng)歷過(guò)一段搶用戶的時(shí)期,高速的增長(zhǎng)意味著我們沒(méi)有時(shí)間先給風(fēng)控體系做出規(guī)劃,而往往是走一步,看需要什么樣的算法,然后進(jìn)行開(kāi)發(fā)、測(cè)試。

這樣的風(fēng)控做法很符合互聯(lián)網(wǎng)思維:快速試錯(cuò)、快速糾偏。我們能這樣做也是基于現(xiàn)在業(yè)務(wù)小額、短周期的特點(diǎn),而這樣的打法也有利于我們快速的做出決策。從逾期率等一系列業(yè)務(wù)指標(biāo)來(lái)看,這樣的風(fēng)控很適合我們現(xiàn)在的業(yè)務(wù)模式。但從長(zhǎng)期來(lái)看,長(zhǎng)期的、中大額的借貸肯定是我們要發(fā)展的方向,在開(kāi)展這類業(yè)務(wù)時(shí),目前的風(fēng)控將面臨很多的問(wèn)題。

首先,我們的系統(tǒng)不是一個(gè)有條理性的系統(tǒng)。我們?cè)谟脩舻淖?cè)、審核、消費(fèi)等階段都會(huì)有反欺詐?,F(xiàn)在的做法是,如果發(fā)現(xiàn)風(fēng)控結(jié)果有偏差,就會(huì)逐個(gè)階段去測(cè)試相關(guān)參數(shù),用第三方的數(shù)據(jù)加在上面,去看結(jié)果。然而,我們?cè)诖蛟祜L(fēng)控時(shí)并沒(méi)有按照一個(gè)邏輯順序來(lái)設(shè)計(jì),而是需要什么算法,就在外面嵌套一層,從結(jié)構(gòu)上來(lái)看,就像一鍋大雜燴,所有的算法都混雜在一起,沒(méi)有主次優(yōu)先。

其次,這個(gè)系統(tǒng)是龐雜而混亂的,我們沒(méi)有一個(gè)人能完完整整的推理出目前風(fēng)控系統(tǒng)的邏輯,它是如何運(yùn)轉(zhuǎn)的,又是怎樣實(shí)現(xiàn)這樣的算法。這導(dǎo)致的問(wèn)題是,一旦我們的業(yè)務(wù)轉(zhuǎn)向長(zhǎng)期和大額,在遇到問(wèn)題時(shí)去調(diào)整時(shí)會(huì)很吃力,效率也會(huì)很低。因?yàn)槟阋吹牟恢皇俏磥?lái)的一兩個(gè)月,而是未來(lái)一兩年,甚至更長(zhǎng)的風(fēng)控狀況。我們不知道哪些數(shù)據(jù)是在緊急情況中最核心的,我們也不知道一個(gè)策略會(huì)產(chǎn)生一個(gè)什么樣的影響。

為了解決這個(gè)問(wèn)題,我們已經(jīng)開(kāi)始著手進(jìn)行系統(tǒng)梳理。我們要做的是把現(xiàn)在的風(fēng)控引擎進(jìn)行拆分,梳理出所有的策略模型,然后用模塊化的方式架構(gòu)起來(lái)。之后,每個(gè)風(fēng)控模塊有自己獨(dú)立的功能,模塊之間的架構(gòu)也不是一層套一層,而是像積木一樣,以API的形式來(lái)連接。當(dāng)主體邏輯判斷某個(gè)用戶的審核需要某個(gè)模塊時(shí),引擎會(huì)自己調(diào)用。

這樣模塊化的風(fēng)控引擎有三個(gè)優(yōu)點(diǎn):

首先,在每個(gè)客戶每個(gè)階段的風(fēng)控審核中,風(fēng)控引擎的作用將會(huì)非常明晰,有利于對(duì)用戶分級(jí)的進(jìn)一步細(xì)化?,F(xiàn)在,我們根據(jù)多個(gè)維度給用戶做了近千層的分級(jí),但這樣的分級(jí)還是太過(guò)粗略,我們真正的目標(biāo)是要做到微分層,細(xì)化到每個(gè)用戶個(gè)體,這可以通過(guò)每個(gè)用戶調(diào)用不同的模塊實(shí)現(xiàn)。

其次,風(fēng)控系統(tǒng)出現(xiàn)問(wèn)題時(shí),我們可以快速定位出現(xiàn)問(wèn)題的模塊,修改將會(huì)更有目的性。

***,系統(tǒng)的進(jìn)化將更為便捷快速。新的算法和模塊可以獨(dú)立開(kāi)發(fā),即插即用,而不會(huì)出現(xiàn)牽一發(fā)而動(dòng)全身的情況。

總結(jié):

這三個(gè)坑是我回國(guó)以后需要解決的課題,從目前的情況來(lái)看,國(guó)內(nèi)的Fintech行業(yè)前景還是非常樂(lè)觀。中國(guó)的大數(shù)據(jù)風(fēng)控不論在實(shí)用性還是開(kāi)放性上,都要優(yōu)于國(guó)外,企業(yè)也愿意投入更多的資金來(lái)促進(jìn)技術(shù)的進(jìn)步,這都為我們行業(yè)的發(fā)展提供了充足的動(dòng)力。

責(zé)任編輯:武曉燕 來(lái)源: 新浪創(chuàng)事記
相關(guān)推薦

2021-03-30 15:10:50

Java序列化

2021-05-07 13:42:30

大數(shù)據(jù)互聯(lián)網(wǎng)工作

2019-05-07 18:45:21

崩潰應(yīng)用程序Android

2020-06-09 08:05:11

Android 代碼操作系統(tǒng)

2024-05-20 08:25:55

2021-09-01 18:37:36

大數(shù)據(jù)功能風(fēng)控

2018-04-16 10:22:08

超融合基礎(chǔ)設(shè)施

2020-11-04 09:41:07

大數(shù)據(jù)信貸技術(shù)

2021-08-27 07:32:23

自動(dòng)駕駛輔助駕駛事故

2021-08-27 10:30:51

自動(dòng)駕駛數(shù)據(jù)人工智能

2013-01-06 11:01:59

大數(shù)據(jù)分析

2018-03-13 16:09:58

物聯(lián)網(wǎng)應(yīng)用

2018-08-28 12:07:42

微信數(shù)據(jù)分析

2017-01-06 10:07:39

Linuxwindowsatime

2023-08-04 16:22:09

大數(shù)據(jù)

2020-01-07 09:15:03

大數(shù)據(jù)故事信息

2020-06-16 08:39:35

JavaScript圖像處理庫(kù)

2020-07-02 09:22:29

Web開(kāi)發(fā)大數(shù)據(jù)平臺(tái)大數(shù)據(jù)

2020-05-18 08:42:23

CSS背景圖像前端開(kāi)發(fā)

2021-12-29 19:20:41

數(shù)據(jù)GitHub服務(wù)器
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)