一種基于數(shù)據(jù)中臺的實時欺詐行為識別架構(gòu)
在信用卡、消費貸等金融服務(wù)場景下,#消費貸款#需要識別客戶是否存在欺詐,是否有騙貸行為,審批系統(tǒng)需要根據(jù)對用戶行為的判斷給出拒絕、接受、人工審核的結(jié)論。
在電商促銷、權(quán)益發(fā)放等消費場景下,需要判斷用戶是否為羊毛黨、是否為惡意用戶,促銷系統(tǒng)需要根據(jù)對用戶性的判斷給出發(fā)放、拒絕的結(jié)論。
在入侵檢測、上網(wǎng)行為識別等信息安全場景下,需要判斷上網(wǎng)用戶是否存在安全隱患,并根據(jù)對用戶行為的判斷給出放行、阻斷的結(jié)論。
......
諸如以上這些情景,都涉及欺詐行為的識別,即判定用戶的行為是否正當(dāng)并基于判定結(jié)果對用戶的請求予以響應(yīng),本文給出一種基于圖特征和客戶標簽的模型化欺詐行為識別架構(gòu),如下圖所示。

欺詐行為識別架構(gòu)
該架構(gòu)包括用戶申請、消息傳遞、圖特征生成、標簽特征生成、模型運行、規(guī)則判斷、業(yè)務(wù)管理反饋等環(huán)節(jié),涉及Kafka消息隊列、知識圖譜平臺、標簽管理平臺、機器學(xué)習(xí)建模平臺、決策引擎平臺、業(yè)務(wù)管理系統(tǒng)等平臺和系統(tǒng)。
用戶申請
用戶通過大促活動、貸款申請、瀏覽器等入口,申請權(quán)益、資金或訪問指定網(wǎng)站。
消息傳遞
由于上述場景往往涉及諸多用戶的集中申請,短時間內(nèi)有多個申請行為,而且要求系統(tǒng)對用戶的行為實時反饋,因此將用戶的申請行為、申請信息,連同時間、地點、設(shè)備等信息一起,通過Kafka消息隊列向下傳遞。
圖特征生成
本架構(gòu)充分考慮到欺詐行為之間的相關(guān)性,即往往緊鄰的欺詐行為或用戶之間具有某種內(nèi)在關(guān)聯(lián),如同地址、同設(shè)備等。因此,通過知識圖譜平臺實時對緊鄰申請行為之間的相關(guān)性進行分析并生成圖特征,如同IP地址段客戶數(shù)、賬號類似客戶數(shù)等。
標簽特征生成
如果說圖特征關(guān)注的是申請行為之間的關(guān)聯(lián),那么標簽特征更多的是關(guān)注申請用戶及其行為本身的特征,如是否黑名單、是否白戶、是否首次訪問等,這些標簽組合在一起刻畫了用戶的行為特征,這些特征的生成基于通用的實時標簽管理平臺。
機器學(xué)習(xí)建模
在本架構(gòu)中,并不直接將圖特征和標簽特征用于欺詐識別,二是將這兩組特征組合在一起,利用有監(jiān)督或者無監(jiān)督學(xué)習(xí)的方法構(gòu)建欺詐客戶識別模型。當(dāng)有新的客戶特征進來的時候,運行該模型并給出行為屬于欺詐的概率。#機器學(xué)習(xí)#
當(dāng)然,也可以根據(jù)需要,直接利用圖特征和標簽特征進行判斷。
規(guī)則判斷
將用戶行為的欺詐概率作為一條規(guī)則,當(dāng)概率高于某一閾值時視為存在欺詐行為,否則視為不存在,并將這一規(guī)則部署到?jīng)Q策引擎平臺上。當(dāng)一個新的申請行為經(jīng)過機器學(xué)習(xí)模型判斷后,即生成判定概率,繼而通過決策引擎的規(guī)則判斷。
業(yè)務(wù)反饋
通過決策引擎之后,業(yè)務(wù)管理系統(tǒng)就得到對申請行為的反饋結(jié)果,如通過、拒絕、受理、允許等,并將結(jié)果反饋給申請用戶。
上面介紹了一種基于圖特征和標簽特征的欺詐行為實時識別架構(gòu),綜合了實時計算、知識圖譜、客戶標簽、機器學(xué)習(xí)建模、決策引擎等AI技術(shù),實現(xiàn)了企業(yè)數(shù)據(jù)中臺組件的組合應(yīng)用,作為實際業(yè)務(wù)應(yīng)用和框架應(yīng)用都有一定的意義。