?嘉賓 | 譚中意、祝世虎
整理 | 徐杰承
2022年對于人工智能而言注定是值得被銘記的一年,在這一年中,人工智能無論在技術(shù)還是產(chǎn)業(yè)層面都取得了巨大發(fā)展與長足的進步,大量創(chuàng)新技術(shù)從概念走向?qū)嵺`。年初,AI加持下的冬奧為我們帶來了煥然一新的觀賽體驗;年中,AI繪畫從虛幻走向現(xiàn)實并斬獲多項賽事大獎;年末,ChatGPT的橫空出世將再次將這一整年的狂歡推向高潮......
無論是底層技術(shù)的一次次突破,還是各類應(yīng)用的接連綻放,在過去的一年之中,人工智能向我們展示了它的無限可能。為了能更加全面地了解到人工智能領(lǐng)域的發(fā)展現(xiàn)狀與未來趨勢,51CTO內(nèi)容中心特別邀請第四范式架構(gòu)師譚中意;光大信托信息技術(shù)部副總經(jīng)理祝世虎兩位業(yè)內(nèi)資深專家,共同探討了有關(guān)人工智能技術(shù)與產(chǎn)業(yè)的5個話題,希望能夠從中收獲更多答案。
1、2022人工智能領(lǐng)域的關(guān)鍵詞
譚中意:技術(shù)層面2022年最熱的關(guān)鍵詞無疑是“AIGC”,而在產(chǎn)業(yè)層面我想應(yīng)該是“AI 工程化”或者叫MLOps。因為如今無論是國內(nèi)還是國外,技術(shù)媒體、產(chǎn)品以及風投領(lǐng)域?qū)τ贏I工程化的關(guān)注度都非常高。AI工程化和MLOps的核心理念就是讓機器學習在企業(yè)內(nèi)部更快地實現(xiàn)規(guī)?;涞兀@也是過去一年人工智能相關(guān)產(chǎn)業(yè)所最關(guān)注的。
祝世虎:從政策角度看,2022年政府主導(dǎo)了數(shù)據(jù)要素的國家戰(zhàn)略,提出了數(shù)據(jù)要素是重組全球資源;重塑全球經(jīng)濟結(jié)構(gòu);改變競爭格局的關(guān)鍵力量。目前中國的 IT 底層的標準、架構(gòu)、產(chǎn)品、生態(tài),大多是由國外的科技廠商決定的,因此存在諸多的底層技術(shù)、信息安全等問題。所以隨著全球的 IT 生態(tài)由過去的單級向未來的多級方向去發(fā)展,我們需要建設(shè)自己的 IT 的底層框架。因此,在信創(chuàng)的背景下,我認為2022年人工智能甚至是整個科技產(chǎn)業(yè)的關(guān)鍵詞應(yīng)該是“科技有國界”。
2、前沿人工智能領(lǐng)域技術(shù)發(fā)展與應(yīng)用現(xiàn)狀
譚中意:應(yīng)用層面,在AI工程化領(lǐng)域,第四范式在過去一年將大量自研技術(shù)積累進行了對外開源,其中包括線上線下一致性的生產(chǎn)級特征平臺OpenMLDB,能夠?qū)崿F(xiàn)對快速開發(fā)企業(yè)內(nèi)部的實時預(yù)測、風控與場景推薦,解決時序特征、高效讀取以及線上線下一致性問題。開源一年多以來,與上下游的開源技術(shù)生態(tài)形成了良好的合作,也取得了很好的成績。
在技術(shù)層面,第四范式始終堅持AI方向的深耕,現(xiàn)階段主要專注于企業(yè)內(nèi)部兩種AI的落地。其一是感知類AI落地,例如CV、NLP。另一種則是決策類AI的落地,針對企業(yè)進行策略制定,例如風控、推薦、預(yù)測等此類與企業(yè)經(jīng)營密切相關(guān)的場景。這一過程中比較重要的兩個關(guān)鍵點,其一是將模型以較高的質(zhì)量進行快速上線;其二則是對模型進行持續(xù)的訓(xùn)練、反饋與調(diào)整,使模型始終保持其前沿性與高效性。
對于AI場景較多的企業(yè)而言,在這種情況下,一家企業(yè)中就能夠產(chǎn)生規(guī)模化的效益,實現(xiàn)從量變到質(zhì)變的躍遷,使企業(yè)從傳統(tǒng)的數(shù)據(jù)公司進化為AI公司,達到通過AI提升核心競爭力的目的。
祝世虎:近幾年金融行業(yè)對于人工智能技術(shù)的應(yīng)用已經(jīng)比較成熟了,過去一年包括未來幾年主要做的事情就是利用金融業(yè)務(wù)去引領(lǐng)金融科技的發(fā)展。例如在消費金融領(lǐng)域,銀行在做消費金融的準入模型時,第一代是規(guī)則驅(qū)動的模型、第二代是規(guī)則 + 數(shù)據(jù)驅(qū)動的模型,第三代則是大數(shù)據(jù)驅(qū)動的模型。
而在現(xiàn)階段,智能算法要解決的一個核心問題就是樣本不足。在實際做智能風控的過程中,我總結(jié)一套手冊。例如當數(shù)據(jù)的維度不足時,第一種方式,可以使用新型特征組合方法AutoCross升維。第二種方式則是當樣本不足時,可以使用遷移學習。當樣本的標注成本較高的時候,很多樣本標注沒有,可以使用Active learning的方法。當樣本標注錯誤率偏高的時候,比如存在外來的一些數(shù)據(jù),它標注的數(shù)據(jù)標簽錯誤率比較高,我們要用Confident Learning的算法。而在當樣本的標簽非常少時,例如在用于交易反欺詐時,這個時候可以選擇用半監(jiān)督學習的算法。這也是在過去一兩年內(nèi)總結(jié)出的相對成熟的應(yīng)對方案。
3、人工智能上下游產(chǎn)業(yè)市場環(huán)境的演化方向
譚中意:未來從事AI應(yīng)用的技術(shù)企業(yè),可能會分為三種。第一種是有資源做大模型,例如擁有海量數(shù)據(jù)、海量算力;擁有業(yè)界頂尖科學家的企業(yè),他們能做出精度很高且普適性較好的大模型,就像AutoAI,他們可能會以API的方式對外提供服務(wù)。
第二類則是具備豐富場景的企業(yè),針對各個場景,例如AIGC可以用在各種需要內(nèi)容的地方,來做出各種的應(yīng)用。
第三類則是介于兩者之間,更多的是提供工具,能夠幫助兩者做更好的連接,例如保證數(shù)據(jù)的準確性、保證線上服務(wù)的穩(wěn)定和監(jiān)控、做模型的版本和Beta這類的企業(yè)。
從行業(yè)角度講,國內(nèi)目前AI落地主要集中在企業(yè)智能化轉(zhuǎn)型的相關(guān)行業(yè),目前最熱門的行業(yè)是金融行業(yè),有場景、有錢。幾乎是每一個AI技術(shù)企業(yè)必爭的行業(yè)。
第二種有前景的是新消費、新零售。新消費和新零售在目前的狀態(tài)下,很多企業(yè)、很多行業(yè)在不斷推出新品,新品的爆發(fā)速度是相當快的,而且它們通過現(xiàn)在很多新媒體和新渠道的方式來做,對于營銷、物流、供應(yīng)鏈方面有很多很多AI的需求。
第三種則是一些制造業(yè),目前重點都還在一些安全檢查、安全生產(chǎn)、故障檢測這種傳統(tǒng)的CV領(lǐng)域,CV領(lǐng)域也能夠提升一定的效率,但是還到不了能夠徹底改變行業(yè)工作模式的時候,徹底顛覆可能還需要幾年時間。
祝世虎:從一個AI從業(yè)者的職業(yè)變化中,我們就很容易了解到人工智能產(chǎn)業(yè)的變化趨勢。以個人為例,我最初從事的人工智能算法行業(yè),而后從算法轉(zhuǎn)做科技,再從科技轉(zhuǎn)到了做數(shù)據(jù),現(xiàn)在又從做數(shù)據(jù)變成了做業(yè)務(wù),這其中實際上是有很深刻的邏輯的。
起初在做模型時,我發(fā)現(xiàn)如果沒有科技去承載的話,模型只能嵌入到企業(yè)的風險管理中,它只能嵌入管理流程,并不能嵌入到具體的業(yè)務(wù)中,必須把模型嵌到科技系統(tǒng)中,才能下沉到具體的業(yè)務(wù)中,所以我從做模型到了做科技。
到了做科技之后,發(fā)現(xiàn)了第二個問題,就是對模型和算法而言,數(shù)據(jù)對模型的貢獻度遠遠大于算法對模型的貢獻度,意識到數(shù)據(jù)的重要性后,又轉(zhuǎn)而用科技去做數(shù)據(jù)去了。做完數(shù)據(jù)之后,又轉(zhuǎn)去做業(yè)務(wù),這其中有兩個邏輯在里面。第一,模型是基于數(shù)據(jù)的,數(shù)據(jù)是基于統(tǒng)計的,統(tǒng)計是基于口徑的,口徑是業(yè)務(wù)部門定的。但是業(yè)務(wù)部門在制定業(yè)務(wù)口徑的時候,往往出于業(yè)務(wù)的需要,對業(yè)務(wù)口徑進行戰(zhàn)略性的模糊處理。其次,大多數(shù)行業(yè)的數(shù)字化轉(zhuǎn)型,本質(zhì)還是業(yè)務(wù)去引領(lǐng)的,在產(chǎn)業(yè)發(fā)展這方面其實也是如此。
4、生成式AI的演進路徑與可能的落地場景
譚中意:生成式AI近期得到了業(yè)界的廣泛關(guān)注,這的確是一件好事。AI領(lǐng)域這兩年來,大模型的新場景其實是比較匱乏的。而如今ChatGPT之所以讓大家耳目一新是在于,真的讓用戶感覺它解決了很多之前多輪對話解決不了的問題,而且也用大模型的方式生成出了一些比較切實的答案,給大家更多的信心。市場永遠是需要技術(shù)熱點的,技術(shù)熱點的存在才能保持資本家的信心,而資本家的信心才能夠推動他們掏錢把這些技術(shù)更快的落下去。
對于生成式AI的商業(yè)化落地,可能會分為三種。第一種,OpenAI這種有錢、有人、有算法,通過API就可以足夠的生成Revenue了。例如AutoCAD這家公司,它的Photoshop現(xiàn)在已經(jīng)集成了AIGC的部分功能,而另外幾家做AIGC的公司也產(chǎn)生了上千萬的Revenue。這是少數(shù)幾家做大模型的公司能做出的事情。
第二類就是將AIGC的能力跟業(yè)務(wù)場景結(jié)合,業(yè)務(wù)集成商需要尋找很多業(yè)務(wù)的具體場景,然后再去思考成本、效率等問題,需要很多的設(shè)計,如果在剛需、利潤、推廣三方面都能夠?qū)崿F(xiàn)進步,才能形成很好的模式。
第三類模式也是OpenAI的CEO最近提到的,在這兩者之間還有第三類公司,能對普通的、普適的大模型做Finetune的技術(shù)提供商,它能針對一個具體的商業(yè)場景,然后對大模型進行針對這種具體商業(yè)場景的Finetune,也能夠?qū)崿F(xiàn)商業(yè)落地。
回到根本,都還是需要解決商業(yè)或者解決用戶的實際問題,而這是需要不斷地去摸索和嘗試的。我很高興看到AIGC的火,讓大家對AI的事業(yè)有更多的信心,也能讓更多的風險投資把錢投進來。我覺得這都是好事。
祝世虎:同樣以O(shè)penAI的ChatGPT為例,它最吸引人的地方在于,每次和它進行溝通,所收獲的內(nèi)容都不一樣,這也是它最有意思的地方。但從應(yīng)用的角度來看,這里存在著一個很嚴重的問題,當用戶對這個系統(tǒng)每次輸入同樣的變量時,它返回的變量是不可控的,這就意味著這個AI很難承擔責任。
以前包括現(xiàn)在,我們所使用的智能客服都令用戶感到非常傻,其語料都是事先設(shè)定好的。但恰恰是這種“傻”,才使得很多行業(yè)敢去使用智能客服,因為其反饋給用戶的每一條信息都是受控的,它的每一句話都是公司能夠負責的。但是當智能客服不可控時,在實用中就會產(chǎn)生很多問題。比如說當一個聯(lián)邦學習的公司來推薦聯(lián)邦學習算法時,他會介紹這個算法能干什么,但對于很多行業(yè)而言,恰恰關(guān)注的是我把我的數(shù)據(jù)聯(lián)邦給你了,我的數(shù)據(jù)使用范圍一定要受控,它一定不能干某些事,我關(guān)注的是它不能干什么,而不是它能干什么。
同樣,對ChatGPT來說,我關(guān)注的是你的說法一定要在我們能承受的范圍內(nèi),你的說法一定要受我們的控制,你不能異想天開的做一些你自己的發(fā)散的想法。但是作為技術(shù)上來講,很遺憾我們目前還無法實現(xiàn)這點,太過于靈活、太聰明的AI能干出我們很多想不到且難以承擔后果的事,這是做技術(shù)和做產(chǎn)業(yè)不同的地方。
總的來說,技術(shù)的風光和商業(yè)模式之間更多的是間接的關(guān)系,生成式AI現(xiàn)階段的確能夠幫我我們做一些創(chuàng)造性的工作,但這里的商業(yè)模式,目前我們還沒有完全跑通。而在需要更高精確度的工作中,生成式AI需要走的路還很遙遠。
5、未來人工智能技術(shù)與行業(yè)的結(jié)合趨勢
譚中意:AI是一個算法,它與各個企業(yè)的結(jié)合是必然的,尤其是隨著各個企業(yè)做數(shù)字化、做智能化轉(zhuǎn)型的展開,AI+各種企業(yè) + 各種場景,也就是就是AI+everything,已經(jīng)呈現(xiàn)出了越來越快的趨勢。
未來幾年內(nèi)的killer app個人認為會是自動駕駛,自動駕駛是AI集大成的應(yīng)用,它是能在極大程度方便人們出行的應(yīng)用,當它和車、和路很好的結(jié)合,各種算法都能發(fā)揮很好的作用,同時又把這種規(guī)章制度完善起來,未來五年內(nèi)能大批落地的、能讓大家耳目一新的killer app很可能會是L4甚至L5級別的自動駕駛。
祝世虎:未來五年之內(nèi),證券、股票的自動化交易將變得更加成熟,甚至于取代人類。在這個領(lǐng)域中機器取代人是一個非常明顯的趨勢。并且很值得關(guān)注的一點是,此前基于股價因子庫的算法正在被逐漸拋棄。AI未來在自動化交易領(lǐng)域中面臨的最大的問題不會再是股價的變化,而是AI1要和AI2成為交易對手,兩者之間將會是模型的對抗。
也就是學習你的對手會怎么處理這只股票,當AI模擬得差不多時,用戶就可以賺到錢了。所以說AI算法未來會在自動化交易的領(lǐng)域90%甚至99%取代人類,并且未來自動化交易的算法將不再是現(xiàn)在常用的基于因子庫的模型,而會是借鑒博弈論模型對抗的一套理論。而人們要做的,只是選中目標與策略,剩下的全權(quán)交給AI就夠了。?