自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<rt id="lnwkb"></rt><sub id="lnwkb"><rt id="lnwkb"></rt></sub>

<blockquote id="lnwkb"><p id="lnwkb"></p></blockquote>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

金融科技公司如何運用 AI 進行風(fēng)控

原創(chuàng)

作者：汪昊 2019-04-28 09:00:00

21世紀(jì)以來的金融科技大潮洶涌澎湃。伴隨著人工智能和互聯(lián)網(wǎng)技術(shù)的興起，傳統(tǒng)金融行業(yè)受到了顛覆性的沖擊。特別是在金融風(fēng)控領(lǐng)域，伴隨著機器學(xué)習(xí)理論的發(fā)展和成熟，以及人們對技術(shù)的信賴度逐漸增加，越來越多的金融企業(yè)和機構(gòu)采納了人工智能的方式來處理傳統(tǒng)的業(yè)務(wù)問題。

【51CTO.com原創(chuàng)稿件】21世紀(jì)以來的金融科技大潮洶涌澎湃。伴隨著人工智能和互聯(lián)網(wǎng)技術(shù)的興起，傳統(tǒng)金融行業(yè)受到了顛覆性的沖擊。特別是在金融風(fēng)控領(lǐng)域，伴隨著機器學(xué)習(xí)理論的發(fā)展和成熟，以及人們對技術(shù)的信賴度逐漸增加，越來越多的金融企業(yè)和機構(gòu)采納了人工智能的方式來處理傳統(tǒng)的業(yè)務(wù)問題。

站在人工智能的角度上來說，風(fēng)控本身是一個不均衡分類問題。所謂不均衡分類問題，是指在分類的過程中正負(fù)樣本的分布極為不均。因為在銀行借貸的過程中，欺詐用戶畢竟是少數(shù)人，互聯(lián)網(wǎng)金融公開的數(shù)據(jù)欺詐率在 10% 到 20%，傳統(tǒng)銀行業(yè)的欺詐率通常更低。所以金融科技公司要解決的就是如何在數(shù)據(jù)分布不均衡的情況下通過分類的方法把惡意用戶篩選掉。

因為本質(zhì)上是分類問題，所以只要是分類算法，都可以用來嘗試解決問題。像傳統(tǒng)的淺層模型邏輯回歸、隨機森林、xgboost 以及后續(xù)的混合模型和深度學(xué)習(xí)模型都可以用來做風(fēng)控。這里分享恒昌利通的研究人員在 2018 年的國際會議 DMKD 2018 發(fā)表的一篇介紹金融行業(yè)風(fēng)控的論文《Detection of fraudulent users in P2P financial market》。

論文作者的數(shù)據(jù)輸入主要是線下門店的用戶填表信息，包括用戶的家庭信息，工作單位信息，貸款信息等。作者嘗試使用隨機森林和 xgboost 的方法，并進行了對比。對比主要采用了 Grid Search 枚舉了模型參數(shù)。評測指標(biāo)為 AUC 。

輸入數(shù)據(jù)總共有 97 個特征，其中有 33 個特征是類別特征。類別特征用 one-hot 的形式進行了處理。實驗數(shù)據(jù)分為訓(xùn)練集、測試集和驗證集，數(shù)據(jù)比例為 4:1:1。因為數(shù)據(jù)總體維度較高，因此在分類前嘗試用 PCA 的方法進行數(shù)據(jù)降維處理，得到隨機森林 + PCA 的 Grid Search 效果圖如下所示：

隨機森林+PCA 在測試集上的 AUC 為 0.78 ，在訓(xùn)練集上的 AUC為 0.797。隨后作者比較了 xgboost + PCA 的效果。因為數(shù)據(jù)集合的分布跨度很大，因此考慮采用 tanh 對數(shù)據(jù)進行歸一化處理，歸一化處理后 xgboost + tanh 的效果***，排除奇異點得到的 AUC基本在 0.88 左右，如下圖所示：

作者也嘗試了 PCA + tanh 結(jié)合的方式，但是效果并不如 xgboost + tanh 理想，所以最終采納的模型為 xgboost + tanh 。

風(fēng)控反欺詐領(lǐng)域的人工智能探索持續(xù)了多年，早在 2000 年初期美國的研究者就已經(jīng)在研究相關(guān)領(lǐng)域的技術(shù)。然而相關(guān)技術(shù)真正得到人們的信任，也是等到了許多年的時間檢驗之后。直到人工智能技術(shù)日趨成熟的今天，仍然會有許多的門戶之見：例如只有精通金融業(yè)務(wù)的人才能真正做好風(fēng)控，風(fēng)控數(shù)據(jù)重要還是模型重要等帶有嚴(yán)重偏見的無聊辦公室政治話題經(jīng)常影響公司內(nèi)部正常的業(yè)務(wù)開展。

2018年 Kaggle 上 Home Credit 這家公司組織了一次反欺詐比賽，提供的基本數(shù)據(jù)都是一樣的，參賽的基本都是技術(shù)人員，差別只在大家對特征工程和模型的選擇和處理上，最終的結(jié)果千差萬別。這樣的比賽活動能夠打消許多人對于人工智能技術(shù)的偏見和誤解。所以說很多時候影響一項技術(shù)或者事業(yè)進步的，不是技術(shù)本身，而是人的固有執(zhí)念。

當(dāng)然，這也并不是說技術(shù)不成熟就要硬上。比如深度學(xué)習(xí)模型在金融風(fēng)控領(lǐng)域其實現(xiàn)在還沒有取得比 xgboost 或者淺層模型更好的效果。為了績效或者面子工程而拿深度學(xué)習(xí)模型作秀實屬浪費公司的資源和開發(fā)者個人的寶貴時間。

總之，金融科技行業(yè)近幾年來發(fā)展迅猛，但是在發(fā)展的過程中泥沙俱下。作為金融科技從業(yè)者對于自己的事業(yè)要有清晰的認(rèn)知和定位。

作者簡介：

汪昊，區(qū)塊鏈公司科學(xué)家，前恒昌利通大數(shù)據(jù)部負(fù)責(zé)人，美國猶他大學(xué)本科/碩士，在百度，新浪，網(wǎng)易，豆瓣等公司有多年的研發(fā)和技術(shù)管理經(jīng)驗，擅長機器學(xué)習(xí)，大數(shù)據(jù)，推薦系統(tǒng)，社交網(wǎng)絡(luò)分析等技術(shù)。在 TVCG 和 ASONAM 等國際會議和期刊發(fā)表論文 10 篇。本科畢業(yè)論文獲國際會議 IEEE SMI 2008 ***論文獎。

【51CTO原創(chuàng)稿件，合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】

責(zé)任編輯：龐桂玉來源： 51CTO

人工智能金融科技風(fēng)控

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="gciys"><p id="gciys"></p></sub>