智慧金融時代,大數(shù)據(jù)和AI如何為業(yè)務賦能?
前言:宜信技術(shù)人物專訪是宜信技術(shù)學院推出的系列性專題,我們邀請軟件研發(fā)行業(yè)的優(yōu)秀技術(shù)人,分享自己在軟件研發(fā)領(lǐng)域的實踐經(jīng)驗和前瞻性觀點。
第一期專訪我們邀請到宜信科技中心AI中臺負責人王東老師,從大數(shù)據(jù)和AI賦能金融業(yè)務的角度,分享了中臺、大數(shù)據(jù)、AI等軟件研發(fā)趨勢為業(yè)務賦能的經(jīng)驗與思路。
王東老師從技術(shù)視角到業(yè)務視角,在中臺的落地契機、AI與大數(shù)據(jù)關(guān)系、AI和大數(shù)據(jù)技術(shù)的落地等方面提出了自己的看法。
【采訪實錄】
記者:很多人將金融行業(yè)的發(fā)展劃分為三個階段:信息金融時代,主要指銀行卡的出現(xiàn),銀行開始做集中的數(shù)據(jù)管理;互聯(lián)網(wǎng)金融時代,互聯(lián)網(wǎng)的發(fā)展,使得用戶可以通過PC和APP辦理金融業(yè)務,這一階段金融機構(gòu)通過數(shù)據(jù)平臺管理和使用數(shù)據(jù);智慧金融時代,也就是現(xiàn)在,金融機構(gòu)通過大數(shù)據(jù)和AI技術(shù)讓金融服務智能化。
作為有多年金融行業(yè)經(jīng)驗的大數(shù)據(jù)專家,您認為在這3個階段里,數(shù)據(jù)為金融服務賦能的方式出現(xiàn)了哪些變化?分別有哪些典型的產(chǎn)品化表現(xiàn)?
王東:按照DIKW體系, 這三個階段對應的是數(shù)據(jù)電子化、數(shù)據(jù)信息化、數(shù)據(jù)知識化和數(shù)據(jù)智能化的過程。
- 信息金融時代,金融機構(gòu)都在進行金融基礎(chǔ)設(shè)施建設(shè),數(shù)據(jù)被集中化管理,金融機構(gòu)從手工勞動和紙質(zhì)單據(jù)中解放出來,提高效率,本質(zhì)上這是電子化、信息化的一個過程,金融機構(gòu)的數(shù)據(jù)進行結(jié)構(gòu)化和梳理,并被分析和使用。這個階段數(shù)據(jù)倉庫和數(shù)據(jù)集市的理論體系誕生并得到完善,基于數(shù)倉理論體系的軟件工具發(fā)布,數(shù)據(jù)的BI分析(使用ETL、建立數(shù)據(jù)倉庫、OLAP分析和可視化報表)在金融機構(gòu)中最先開始落地并產(chǎn)生價值,基于數(shù)據(jù)的早期信用卡風控模型開始建立并投入使用。
- 互聯(lián)網(wǎng)金融時代,是數(shù)據(jù)爆炸的時代,云計算和大數(shù)據(jù)技術(shù)興起,金融機構(gòu)面臨業(yè)務變化快、大數(shù)據(jù)量、高并發(fā)量等各種不同需求的沖擊,前端業(yè)務系統(tǒng)進行大規(guī)模改造以適應大數(shù)據(jù)的沖擊。數(shù)據(jù)層面上,企業(yè)的數(shù)據(jù)量已經(jīng)變得非常龐大,業(yè)務變化也非??欤瑐鹘y(tǒng)的報表迭代速度慢,需要排期,無法滿足金融機構(gòu)的數(shù)據(jù)分析需求。大數(shù)據(jù)理論和大數(shù)據(jù)分布式平臺蓬勃發(fā)展,基于大數(shù)據(jù)平臺的相關(guān)技術(shù)讓敏捷式報表的概念逐漸成為可能,數(shù)據(jù)實時化、自助化深入人心。BI的流程已經(jīng)大幅縮短,在金融機構(gòu)的決策中被廣泛使用。大數(shù)據(jù)技術(shù)、機器學習等技術(shù)在金融領(lǐng)域的引用,催生了大數(shù)據(jù)風控技術(shù)、反欺詐分析、精準營銷和個性化推薦、銷售渠道優(yōu)化&產(chǎn)品服務優(yōu)化、輿情分析等智能應用。
- 智慧金融時代,是數(shù)據(jù)知識化和智能化的高級階段,大數(shù)據(jù)和AI能力重塑和改造金融服務,創(chuàng)造業(yè)務,降低成本,提高效率。金融機構(gòu)業(yè)務部門的數(shù)據(jù)分析需求進一步增加,商業(yè)智能分析產(chǎn)品被業(yè)務專家廣泛使用在輔助分析、協(xié)助決策、智能助理等各個領(lǐng)域。BI分析更加自動化,增強型分析(是數(shù)據(jù)準備和洞察過程自動化、使用自然語言或語音交互、根據(jù)AI分析給出決策建議、利用機器學習和AI管理數(shù)據(jù))逐步成為可能?;诖髷?shù)據(jù)和AI提供的各項能力,客服機器人、外呼機器人、智能投顧、智能投研、客戶流失預測、績優(yōu)銷售預測、千人千面的金融產(chǎn)品等變?yōu)楝F(xiàn)實。
記者:智慧金融時代,AI技術(shù)在金融服務的落地場景也越來越多。您能否以宜信的某一個AI產(chǎn)品為例,簡單介紹AI在金融服務業(yè)務場景中的落地實踐。
王東:這里,我就介紹一下我們智能聊天機器人平臺吧。該平臺是結(jié)合自然語言處理、搜索引擎、會話領(lǐng)域場景的一站式人機對話解決方案,只需簡單導入自己的業(yè)務問答數(shù)據(jù)知識,系統(tǒng)的智能模型就會快速學習并生成相應的機器人,創(chuàng)建出定制化的業(yè)務咨詢專家。
智能聊天機器人平臺包含QA聊天機器人、任務機器人、閑聊機器人、人工后臺、文檔管理、模型管理、會話管理、統(tǒng)計報表等諸多功能。平臺支持多租戶,對算力、數(shù)據(jù)和資源進行隔離。對接公司LDAP、SMP、SSO等認證系統(tǒng),支持功能角色和數(shù)據(jù)角色,對業(yè)務系統(tǒng)無侵入,可以內(nèi)嵌到公司PC端業(yè)務系統(tǒng)中或手機APP中。
以CSC場景為例:CSC的一線同事在日常工作中,每天都會產(chǎn)生大量業(yè)務問題需要咨詢。此前這些問題通過蜜蜂等IM軟件在工作群內(nèi)進行詢問,由CSC客服管理部相關(guān)同事支持。但由于問題數(shù)量大、涉及業(yè)務線多,這些業(yè)務咨詢往往不能得到迅速解決,影響業(yè)務的順利開展。另一方面,通過人工進行業(yè)務問題支持的工作還存在著響應緩慢、效率不高、成本高昂等問題。最終從客戶角度來看,業(yè)務問題的無法解決或解決流程不規(guī)范,將嚴重影響客戶體驗和品牌認知。
使用了智能問答機器人后, 門店客服可以通過智能機器人快速得到一致性答案,通過搜索引擎快速檢索到業(yè)務文檔相關(guān)資料,當遇到機器人無法解答問題,可以將問題轉(zhuǎn)入人工后臺。讓大部分常見問題由機器人代勞,少部分復雜的問題轉(zhuǎn)后臺人工處理,通過智能機器人+人工后臺的方式,共同提供完整的快捷的一體化用戶體驗。
由于智能聊天機器人平臺是按照平臺化方式來建設(shè)的,因此很容易推廣到公司其他需要智能聊天的場景中,除了CSC客服問答機器人以外,目前已經(jīng)在公司車貸客服問答、催收業(yè)務咨詢、財富智能問答、指尖金融家APP和信審業(yè)務咨詢等領(lǐng)域中上線和使用,成為客服管理重要的日常工具,實現(xiàn)了運營管理智能化從0到1的過程,幫助運營人員減輕壓力,提升運營效率。
金融領(lǐng)域正掀起一場智能化的變革,智能聊天機器人在這場變革中將扮演重要角色。眾多分析師認為,聊天機器人的商業(yè)化應用,其真正潛力正是在金融領(lǐng)域。除了對企業(yè)內(nèi)部業(yè)務的智能化支持,更加令人興奮的是聊天機器人與金融的結(jié)合將徹底顛覆個人金融服務的形式,相信在不遠的將來,智能金融機器人將在客服、咨詢、理財、支付等各種場景下提供更加科學而自然、理性兼具人性的服務,這也是我們平臺的最終發(fā)展目標。
記者:智能化的AI產(chǎn)品可以解決復雜多樣的業(yè)務問題,但面對眾多的需求,需要進行優(yōu)先級排列,您和團隊是如何判斷業(yè)務問題優(yōu)先級的呢?
王東:就能力分層來說,我們認為智慧化AI產(chǎn)品可以分為三層:
最底層——AI平臺層:提供在線訓練、在線標注、特征工程、自助訓練、算法庫、訓練環(huán)境等AI基礎(chǔ)設(shè)施。服務的對象是AI科學家和數(shù)據(jù)科學家,為他們提供平臺和工具支撐。
中間層——AI服務層:提供語言合成、詞法分析、相似度比較、觀點抽取、卡證票據(jù)類識別等通用AI服務,以及與業(yè)務方合作的智能服務項目。服務的對象是我們各個業(yè)務系統(tǒng),為各個業(yè)務系統(tǒng)提供AI能力支持,助力業(yè)務發(fā)展。
最上層——AI產(chǎn)品層:提供類似智能聊天機器人平臺這樣的端到端解決方案。服務的對象是我們的一線業(yè)務同事、甚至可能是我們的客戶。
從技術(shù)難度來說,最挑戰(zhàn)的是最底層-AI平臺層,打造一套自己的在線訓練平臺一直是很多AI科學家和數(shù)據(jù)科學家所期待的,但打造一套非常好用的在線訓練平臺并不容易,需要投入大量人力和時間,維護成本也很高,需要增加最新算法庫等,對使用的用戶要求也比較高,一般都是算法工程師和科學家。我們的業(yè)務方對這個一般沒有什么感知。
從業(yè)務影響力和優(yōu)先級來說,最上層和中間層的優(yōu)先級會更高一些,這兩層主要是為公司一線業(yè)務系統(tǒng)服務,會直接或間接觸達到一線業(yè)務同事或客戶,直接產(chǎn)生商業(yè)價值和降低成本。
作為AI中臺來說,在有限的人力情況下,我們會更優(yōu)先支持最上層和中間層的AI服務,例如:聊天機器人平臺、語音合成、主題提取、卡證類識別等通用類AI服務以及與業(yè)務方合作的智能服務項目。而對于最底層AI平臺,我們也會在日常工作中,通過積累和沉淀可以復用的工具集,逐步形成相應平臺能力。
記者:據(jù)悉,宜信的智能聊天機器人平臺是基于AI中臺研發(fā)的,那么AI中臺為智能聊天機器人平臺的研發(fā)提供了哪些優(yōu)勢呢?相比AI中臺建設(shè)之前,有哪些地方得到了改善?
王東:從AI中臺的使命來說,AI中臺承擔一些跨領(lǐng)域的、平臺級的服務研發(fā)和推廣,避免煙囪式的開發(fā),強調(diào)開發(fā)合作、通用性和可復用性。智能聊天機器人平臺就是這樣一款產(chǎn)品,它具有平臺的通用性,可以內(nèi)嵌到公司各個業(yè)務系統(tǒng)中,以自然語言的方式提供問題咨詢、任務執(zhí)行、業(yè)務解答等支持,最終達到節(jié)省人力,降本增效的目標。
智能聊天機器人在AI中臺開發(fā)是有諸多好處的:
- 從人員方面來說,智能聊天機器人涉及到自然語言處理、語音轉(zhuǎn)換等技術(shù),這需要在NLP和語音識別等專業(yè)領(lǐng)域深耕的AI科學家來支持。一方面機器人平臺可以借助AI中臺的AI科學家通過更好的算法讓聊天機器人更加智能,更加多樣化,另外一方面機器人平臺也為AI中臺的專業(yè)AI人員找到了合適的用武之地和實踐場景。
- 從平臺層面來說,智能聊天機器人所需要的模型服務是可以向下沉淀的,通用化后成為AI中臺的AIHub模型服務平臺。這樣聊天機器人平臺不必關(guān)心模型管理,只需要關(guān)注自己聊天機器人領(lǐng)域的事情,例如模型服務、模型編排、模型監(jiān)控預警等這些模型通用能力的事情交給AI中臺的AIHub模型服務平臺來解決。實現(xiàn)產(chǎn)品模塊邊界清晰,并提高復用性和專業(yè)度,減少重復建設(shè)。
記者:宜信技術(shù)學院組織了2次直播分享,主題分別是數(shù)據(jù)中臺和AI中臺,您在這兩個項目都扮演了重要的角色,現(xiàn)在也越來越多的人提到數(shù)據(jù)中臺需要向AI中臺演進,您對此怎么看?宜信的數(shù)據(jù)中臺和AI中臺之間是什么樣的關(guān)系?二者之間是如何支持協(xié)作的?
王東:數(shù)據(jù)中臺除了提供數(shù)據(jù)平臺本身的兩大能力(數(shù)據(jù)存儲和數(shù)據(jù)計算)以外,還提供了更高級的能力,就是把數(shù)據(jù)變成一種基礎(chǔ)服務提供給業(yè)務方,業(yè)務方可以以自助的方式在數(shù)據(jù)中臺上獲取數(shù)據(jù),進行數(shù)據(jù)處理、數(shù)據(jù)探索、數(shù)據(jù)挖掘、分析鉆取、多維分析、自助化報表、數(shù)據(jù)分享等,以快速的實現(xiàn)自己的商業(yè)價值。
隨著業(yè)務的發(fā)展,越來越多的智能化數(shù)據(jù)需求被提出,這些智能化需求涉及到模型訓練、數(shù)據(jù)標注、特征工程、模型部署、性能監(jiān)控等,需要使用機器學習、深度學習等算法支持。數(shù)據(jù)中臺的主要目標還是服務數(shù)據(jù),對于智能化和模型并不能很好地支持,因此AI中臺應運而生。
我們把智能服務的需求抽象出來,形成一個獨立的AI中臺層。AI中臺是一個用來構(gòu)建智能服務的基礎(chǔ)設(shè)施平臺,對公司所需的模型提供了分布分層的構(gòu)建能力和全生命周期管理的服務,鼓勵各個業(yè)務領(lǐng)域基礎(chǔ)性、場景性、通用性的AI能力沉淀到平臺中,加強模型復用、組合創(chuàng)新、規(guī)?;?,最終實現(xiàn)降本增效和快速響應業(yè)務方。
數(shù)據(jù)中臺和AI中臺兩者是相互依存,承前啟后的關(guān)系。
- 數(shù)據(jù)中臺和AI中臺兩者都對外提供服務,只是側(cè)重點不同:數(shù)據(jù)中臺提供各種數(shù)據(jù)服務(BI報表應用、數(shù)據(jù)探索等),AI中臺提供各種智能服務(模型預測、智能推薦等);
- AI中臺依托數(shù)據(jù)中臺提供的數(shù)據(jù)能力和工具集,加速AI相關(guān)服務的開發(fā)和復用,來應對前臺智能業(yè)務需求。有了數(shù)據(jù)中臺清洗好的數(shù)據(jù),搭建智能項目事半功倍;
- 數(shù)據(jù)中臺也需要使用AI中臺的智能化能力使得數(shù)據(jù)使用更加平民化和智能化。例如增強型BI分析:通用自然語言交互方式,降低BI使用門檻;通過AI分析給出參與建議,幫助普通用戶在沒有數(shù)據(jù)專家的情況下有效訪問數(shù)據(jù);增強型數(shù)據(jù)管理:利用機器學習來管理數(shù)據(jù),包括數(shù)據(jù)質(zhì)量、元數(shù)據(jù)管理;主數(shù)據(jù)管理等。
記者:從去年開始,似乎每個公司都在談中臺,但其實很多人對中臺的具體價值還不是很理解,從宜信的數(shù)據(jù)中臺和AI中臺這兩個項目來看,中臺在賦能業(yè)務方面有哪些優(yōu)勢?請您舉幾個例子具體介紹。
王東:在“以用戶為中心”的思想指導下,企業(yè)需要快速響應、挖掘、引領(lǐng)⽤戶的需求,借助平臺化的力量可以事半功倍。后臺并不為前臺而生,要么不好用,要么變更速度跟不上前臺的節(jié)奏。就算是新建的后臺系統(tǒng),因為其后臺管理的屬性(考慮到企業(yè)安全、審計、合規(guī)、法律等限制)導致不能適應前臺快速開發(fā)的需求。前臺和后臺就像是兩個不同轉(zhuǎn)速的⻮輪,前臺要快速響應,后臺則要求越穩(wěn)定越好。
因此中臺應運而生,中臺存在的目的就是更好地服務前臺,進而更好地響應服務。在宜信,數(shù)據(jù)中臺和AI中臺也同樣是為了更好更快地服務前臺而存在:
以數(shù)據(jù)中臺為例:業(yè)務領(lǐng)域組數(shù)據(jù)團隊需要緊急制作一批報表,不希望排期,部分報表需要T+0時效性。數(shù)據(jù)來源是異構(gòu)數(shù)據(jù)庫,對數(shù)據(jù)時效性要求很高,需要對數(shù)據(jù)處理后并展示報表。使用數(shù)據(jù)中臺,業(yè)務方不需要關(guān)心數(shù)據(jù)的異構(gòu)性,無論是實時數(shù)據(jù)還是批量數(shù)據(jù),只需要懂SQL,業(yè)務方都可以在數(shù)據(jù)中臺上申請數(shù)據(jù),自助地寫SQL進行處理數(shù)據(jù)清洗、數(shù)據(jù)處理,最后,通過配置和寫SQL生成自己需要報表,不用等排期,完全自助快速完成。
以AI中臺為例:AI中臺的智能聊天機器人平臺,對接第一個業(yè)務方是從零開始,從研發(fā)平臺、模型研發(fā)、數(shù)據(jù)對接、到使用上線第一期,花了6個月的時間,第二個業(yè)務方享受到平臺的優(yōu)勢,直接導入數(shù)據(jù),進行驗證和對接后,4個月實現(xiàn)上線第一期,之后的業(yè)務方更快2個月上線,最近的一個業(yè)務方達到3周就上線的速度,體現(xiàn)了平臺的復用性帶來的便捷和快速響應業(yè)務方需求的能力。
中臺將前臺業(yè)務中相對穩(wěn)定的能力固化和沉淀下來,并共享給有需要的其他業(yè)務方使用,從而實現(xiàn)快速響應業(yè)務需求、降低成本和支持業(yè)務方進行規(guī)?;瘎?chuàng)新。
記者:以您的經(jīng)驗來看,什么樣的企業(yè)需要建設(shè)數(shù)據(jù)或者AI中臺?或者說企業(yè)在什么時候應該要建設(shè)中臺,是否有什么明顯的信號?比如說企業(yè)到了什么樣的階段或者遇到什么樣的問題。
王東:企業(yè)啟動自己的數(shù)據(jù)中臺和AI中臺建設(shè),是與企業(yè)當時的業(yè)務發(fā)展階段相關(guān)的。
很多企業(yè)在早期業(yè)務發(fā)展過程中,為了解決一些當時的業(yè)務問題,快速上線了很多功能,要么垂直的、個性化的業(yè)務邏輯與基礎(chǔ)系統(tǒng)耦合太深,橫向系統(tǒng)之間、上下游系統(tǒng)之間交叉邏輯錯綜復雜。要么缺乏統(tǒng)一規(guī)劃,建設(shè)了許多高度相似的系統(tǒng),大量重復建設(shè),但又不通用,用戶體驗不統(tǒng)一。這樣導致在新業(yè)務、新市場的拓展過程中,系統(tǒng)沒法直接復用,甚至沒法快速迭代。
我們稱為 “重復造輪子”和“煙囪式架構(gòu)”,本質(zhì)上是企業(yè)在早期高速發(fā)展過程當中,為了快速解決當時的業(yè)務問題,而欠下了許多技術(shù)債務。這些歷史技術(shù)債務積重難返,當企業(yè)進入成熟期之后,發(fā)現(xiàn)這些問題的存在,嚴重影響了企業(yè)的運行效率和運營成本。大多數(shù)提出中臺戰(zhàn)略或是建設(shè)大中臺的企業(yè),都面臨過類似的困境。
中臺化建設(shè)作為一種產(chǎn)品設(shè)計思想或者系統(tǒng)架構(gòu)思想,對于任何一家即將或者正在面臨業(yè)務高速增長的企業(yè)來說,都值得借鑒,對目前業(yè)務當中大量可復用的功能和場景進行梳理,為業(yè)務的高速增長做好準備,同時也起到了降本增效的目的。
這個過程很像是在飛行過程中修發(fā)動機。一方面,知道飛機發(fā)動機已經(jīng)存在一些問題,需要修理;另外一方面,還在飛行過程中,飛機還要飛,還要支持業(yè)務發(fā)展,不可能將發(fā)動機停了。這個過程是有一定難度,還要搶時間,為下一次業(yè)務發(fā)展做好準備。
通過機制化、產(chǎn)品化等方式,將企業(yè)內(nèi)部具有通用性的數(shù)據(jù)、功能、產(chǎn)品進行統(tǒng)一規(guī)劃和開發(fā),從而更好地幫助前臺業(yè)務部門更多地關(guān)注業(yè)務,提高業(yè)務運營效率,進而提升企業(yè)競爭力,是企業(yè)中臺化建設(shè)的目標。
記者:前面您也講到,智能聊天機器人平臺的研發(fā)要基于數(shù)據(jù)中臺所提供的數(shù)據(jù)挖掘和處理能力,可以說AI產(chǎn)品的研發(fā)和應用離不開大數(shù)據(jù)技術(shù)的支撐。那您認為大數(shù)據(jù)技術(shù)與AI應用落地之間是一種什么樣的關(guān)系?
王東:縱觀這次人工智能的浪潮,可以說是算法、大數(shù)據(jù)等技術(shù)和硬件多方面的因素促成的。一方面算法層面有了進一步突破,更重要的是大數(shù)據(jù)相關(guān)技術(shù)的成熟,使得數(shù)據(jù)的獲取變得容易,大數(shù)據(jù)計算變得可能,以前許多不可能完成的事情,現(xiàn)在可以通過大數(shù)據(jù)的算力來進行學習和訓練。再結(jié)合現(xiàn)在GPU、AI芯片以及傳感器等硬件技術(shù),使得需要大規(guī)模計算的深度學習訓練可以完成,這些都直接導致了AI應用的快速落地和到處開花。
以互聯(lián)網(wǎng)AI應用為例,互聯(lián)網(wǎng)巨頭是使用大數(shù)據(jù)標注并落地AI應用的最早受益者。AI應用最早應用在搜索引擎(Google、百度)、廣告系統(tǒng)(Ebay)、電子商務網(wǎng)站(阿里)等,它們都是大數(shù)據(jù)的產(chǎn)生方和使用方,然后是在擁有大數(shù)據(jù)流的社交平臺(Facebook,騰訊),到現(xiàn)在使用大數(shù)據(jù)技術(shù)在垂直細分領(lǐng)域做個性化推薦平臺(頭條、快手)。一方面大家在使用這些互聯(lián)網(wǎng)平臺,另外一方面大家也在進行免費的大數(shù)據(jù)標注。
以商業(yè)AI應用為例,商業(yè)機構(gòu)通過激活已有的大數(shù)據(jù),并結(jié)合AI算法創(chuàng)造商業(yè)價值。醫(yī)療機構(gòu)通過已有病歷實現(xiàn)疾病診斷/鑒別、個性化治療/行為矯正、臨床決策支持系統(tǒng)、流行病爆發(fā)預測等, 金融機構(gòu)通過已有交易數(shù)據(jù),進行大數(shù)據(jù)風控、個性化營銷、智能投顧、智能投研等。這些都是大數(shù)據(jù)與AI緊密結(jié)合的產(chǎn)物。
以實體世界AI應用為例,通過獲取實體世界的數(shù)據(jù),實現(xiàn)智能化,帶來新的應用、新的商機。通過大數(shù)據(jù)、AI與汽車行業(yè)結(jié)合,誕生了自動駕駛、路徑規(guī)劃、實時路況、危險預警等應用;大數(shù)據(jù)與商業(yè)零售結(jié)合,收集海量顧客信息,結(jié)合AI技術(shù),用于精準營銷、店鋪選址、庫存規(guī)劃、個性化服務等。大數(shù)據(jù)、AI技術(shù)與智慧城市、智能安監(jiān)、環(huán)境治理、教育等諸多領(lǐng)域結(jié)合后,都帶來了大量新的應用和商業(yè)機會。
因此,無論是傳統(tǒng)的數(shù)據(jù)挖掘、還是機器學習、深度學習,所有的模型都離不開大量的數(shù)據(jù),可以說大數(shù)據(jù)技術(shù)是AI應用的養(yǎng)料和土壤,大數(shù)據(jù)技術(shù)催生了AI應用的落地。
記者:最后一個問題我們來聊聊AI的應用前景吧。您覺得現(xiàn)在AI技術(shù)是否已經(jīng)成熟到可以大規(guī)模落地應用了?以金融行業(yè)舉例的話,您認為要真正實現(xiàn)AI技術(shù)在金融服務中的全面落地,現(xiàn)在還缺少什么?比如技術(shù)方面、數(shù)據(jù)資源方面等。
王東:最近對AI應用討論得挺多,有以下幾種觀點:
- “速勝論”:理由是基于深度學習技術(shù)的爆發(fā)式進步,由AlphaGo完勝人類職業(yè)圍棋頂尖水平為導火索,在圖像領(lǐng)域(圖像識別、人臉識別、視頻識別等)、語音領(lǐng)域(語言識別、語言合成、智能翻譯等)取得了巨大的成功,火熱的人工智能帶來了很多機會,資本的大量涌入,市場上涌現(xiàn)了一大批 AI 初創(chuàng)公司,同時媒體的大肆宣揚,比如說「人類要被機器人取代」「機器開始威脅人類」等等,導致一部分人對AI技術(shù)已經(jīng)能夠大規(guī)模普及和落地充滿信心。
- “投降主義論”:隨著進一步研究發(fā)現(xiàn),許多問題并沒有解決。例如開放領(lǐng)域的聊天機器人不夠聰明,整體有待加強。主要原因在于自然語言理解的發(fā)展進程并沒有我們想象中快,深度學習也似乎沒有解決這個問題,可以與人類對話交流的機器人好像從未出現(xiàn)過。有外媒甚至評論道:“我不確定能不能說聊天機器人死了,因為我不知道它是否活過。”除了上述的一些成功領(lǐng)域,深度學習也并沒有解決其他所有領(lǐng)域的問題。
了解到人工智能歷史的同行都知道,其實人工智能至今經(jīng)歷了三次大的熱潮。每次都經(jīng)歷了開始是“人類要毀滅了”,后來是“騙子”的過程。
實際上,在一個特定領(lǐng)域的優(yōu)秀表現(xiàn),并不能代表 AI 技術(shù)無所不能。同樣的,在通用領(lǐng)域不能解決的問題,不代表特定領(lǐng)域不能解決。
我更加相信“持久戰(zhàn)論”,羅馬從來都不是一天能夠建成的,技術(shù)的突破也必然會經(jīng)歷一定時間的積累。AI技術(shù)在金融服務中的落地,我比較贊同宜信CTO向江旭先生提的觀點“大膽擁抱,小心實踐”。
首先需要選擇金融領(lǐng)域的業(yè)務痛點,并通過AI技術(shù)來解決這些痛點,把非常炫酷的AI技術(shù)落實到實際業(yè)務需求中,而不是為炫酷而炫酷。就目前而言,我們的AI中臺會選擇在智能機器人和知識圖譜構(gòu)建上發(fā)力。智能聊天機器人能為公司內(nèi)外提供專業(yè)領(lǐng)域的知識解答,知識圖譜能為各業(yè)務方提供智能問答、智能搜索、精準營銷等。最重要的是,我們希望按照平臺化的方式去建設(shè)它們,希望建設(shè)知識圖譜的方法論、工具和平臺可復用。
目前在落地過程中,除了搭建AI中臺相關(guān)平臺以外,花費時間最多的是與數(shù)據(jù)相關(guān)的過程,無論是模型訓練,還是知識圖譜構(gòu)建,很多時間用在獲取數(shù)據(jù)和探索數(shù)據(jù)。
對于普通的模型訓練,需要多個維度的數(shù)據(jù),AI科學家需要對這些數(shù)據(jù)進行觀察和探索,一般這些數(shù)據(jù)都是結(jié)構(gòu)化數(shù)據(jù),這個問題會隨著數(shù)據(jù)中臺的成長,數(shù)據(jù)匯集越來越多后,得到逐步的解決。數(shù)據(jù)中臺提供自助化探索數(shù)據(jù)的能力,能夠大幅減少獲取數(shù)據(jù)和探索數(shù)據(jù)的時間和成本。
對于圖譜構(gòu)建和自然語言處理,我們很多的金融數(shù)據(jù)保存為非結(jié)構(gòu)化的數(shù)據(jù)和語料,例如pdf文檔、表格數(shù)據(jù)、掃描圖片等,一方面要求數(shù)據(jù)中臺或數(shù)據(jù)平臺能夠提供非結(jié)構(gòu)化數(shù)據(jù)的獲取能力,另一方面也要求AI中臺提供對這種非結(jié)構(gòu)化數(shù)據(jù)進行在線標注、在線提取的平臺級能力。
王東:宜信科技中心AI中臺團隊負責人
北京大學軟件工程專業(yè)碩士,宜信科技中心AI中臺團隊負責人,目前負責宜信AI中臺平臺的建設(shè)工作。研究領(lǐng)域方向包括開放AI平臺建設(shè)、智能聊天機器人、實時數(shù)據(jù)歸集和處理、大數(shù)據(jù)平臺研發(fā)和推廣等。擁有10年以上金融和互聯(lián)網(wǎng)企業(yè)基礎(chǔ)系統(tǒng)和數(shù)據(jù)類研發(fā)經(jīng)驗。宜信敏捷大數(shù)據(jù)棧DBus開源項目負責人,CUBRID-cluster開源項目發(fā)起人。曾任韓國最大搜索引擎公司——Naver資深工程師,多年負責CUBRID-cluster分布式數(shù)據(jù)庫引擎和CUBRID數(shù)據(jù)庫引擎研發(fā)工作。
【本文是51CTO專欄機構(gòu)宜信技術(shù)學院的原創(chuàng)文章,微信公眾號“宜信技術(shù)學院( id: CE_TECH)”】