機器學習技術對保險行業(yè)的影響
譯文【51CTO.com快譯】利用機器學習成果推動業(yè)務績效提升的作法在過去18個月中已經得到廣泛認可,而我們也一直在同各類保險機構探討這項技術所能帶來的應用潛力和價值。
首先,機器學習必將改變保險公司的經營方式。長久以來,保險公司的核心任務在于預測未來事件,并評估這些事件的價值/影響。這一評估過程通過預測模型實現(xiàn)——特別是索賠損失的預測與定價。而隨著大數據及新型數據源的出現(xiàn),傳感器/遠程信息處理、外部數據源、數字化(交互)、社交與網絡(情緒傾向)等領域中的數據技術應用將讓保險業(yè)務擁有更可觀的運營空間。
機器學習如今已經成為保險公司的一類重要工具,被廣泛應用于核心價值鏈內以了解風險、索賠與客戶體驗情況。帶來的更為靈活/復雜的模型可幫助保險公司提升預測準確性。不過相較于傳統(tǒng)統(tǒng)計方法,機器學習需要強大的數據分析能力,同時有能力計算看似無關的結構化、半結構化與非結構化數據集。
舉例來說,基于機器學習的數據模型現(xiàn)在可分析:
結構化數據: 損失類型、損失金額與醫(yī)師身份等。
文本: 筆記、日記、醫(yī)療費用、事故報告、存款、社交數據與發(fā)票等。
空間圖表: 事故地點、工作地點、各方關系(醫(yī)師、索賠人、維修設施)等。
時間序列: 事件/行動序列、索賠日期、事故日期、事件/行動持續(xù)時間等。
如今,保險公司擁有遠超以往的承保/債權票據與記錄(非結構化數據)評估能力,同時也可以高效地處理各類標準化文件。
定價風險、定損以及欺詐監(jiān)控等工作對于機器學習方案而言非常重要。保險公司引入機器學習算法,主要用于處理風險相似性分析、風險傾向與溢價評估。另外,也被廣泛應用于索賠頻率/嚴重性、管理費用、代位追償(一般性保險)、訴訟與欺詐的核定。
機器學習中***影響力的用例在于從以往索賠審計中學習經驗,從而確保以往問題能夠被保險公司發(fā)現(xiàn)并借此汲取絕對值。索賠審計長久以來一直以人工方式完成,但如今機器學習技術能夠貫穿整個生命周期強化評估能力,并通過持續(xù)處理提升自身能力。
此類索賠處理算法也可用于監(jiān)控及檢測欺詐活動。不過,***的限制因素在于保險公司實際掌握的索賠欺詐案例/實例數量。這也是決定傳統(tǒng)與機器學習模型實際成效的基本條件。
很多保險公司會問,機器學習能否明顯降低欺詐率。我的答案是,機器學習能夠切實影響到各類早期識別技術,或者說“反欺詐”技術。其中的關鍵要素在于減少誤報,并利用機器學習算法以確定哪些索賠存在潛在欺詐可能。
保險公司可以通過兩種技術應用方式降低欺詐活動數量:欺詐的早期識別以及在欺詐調查工作中投入時間資源。由此帶來的索賠支付速度提升也將令客戶獲得更高滿意度。
利用機器學習技術,保險公司將能夠把索賠數據(無論其具體類型)加載至巨大的存儲庫內,即所謂“數據湖”。在欺詐檢測工作中,索賠審計、日志與文件將成為發(fā)現(xiàn)欺詐活動的關鍵所在,具體流程包括:
學習階段: 進行數據訓練或者從欺詐性索賠與真實索賠中進行學習。具體包括預處理(標準化、降維、圖像處理、航空圖像等)、學習(監(jiān)督、非監(jiān)督、最小化等)以及錯誤分析(精度、召回、過度擬合、測試/交叉驗證等)。
預測階段: 正式使用來自學習階段的模型并應用于新數據,而后部署以實現(xiàn)欺詐檢測與標記。
持續(xù)學習階段: 不過利用新數據與行為進行模型校準是實現(xiàn)成功的關鍵所在。
除了機器學習,保險公司也在越來越多地利用圖像分析機制以獲取欺詐模式的可視化能力。
亦有很多保險公司將圖像分析與Apache Spark/GraphX加以配合,其可同時利用神經網絡與社交網絡實現(xiàn)欺詐性索賠分析。這類方案能夠有效降低傳統(tǒng)評估中過高的誤報率。
圖像分析技術能夠幫助大家理解數據關系并用于調查個別索賠欺詐案例,最終讓保險公司更快實現(xiàn)欺詐模式可視化。
原文標題:Machine Learning and Its Impact On the Future for Insurance,原文作者:Cindy Maike
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】