數(shù)字化轉型浪潮之下,買車也能靠算法優(yōu)化?
原創(chuàng)近年來,汽車產業(yè)在數(shù)字化轉型浪潮的驅動下,不斷進行著穩(wěn)步的轉型升級與業(yè)務重塑。而在此過程中,AI 算法的介入為汽車產業(yè)各業(yè)務線的經(jīng)營效率提升與價值平衡起到了極大的幫助。在不久前由 51CTO 舉辦的【T·TALK】全年系列技術分享活動中,大搜車集團 AI 中心負責人 / 資深總監(jiān)張揚老師就“AI 算法在汽車行業(yè)數(shù)字化轉型中的應用”話題進行了公開的直播分享,結合汽車行業(yè)自身特性,重點介紹了 AI 技術在多場景數(shù)字化中的應用以及基于 AI 算法的汽車行業(yè)業(yè)務優(yōu)化案例。以下為本次分享的核心內容整理,希望能為讀者帶來一些收獲。
互聯(lián)網(wǎng)演進
1、從消費互聯(lián)到產業(yè)互聯(lián)
本次分享,主要想與大家聊一聊 AI 算法以及我在汽車行業(yè)和消費互聯(lián)網(wǎng)行業(yè)的一些工作實踐。在這其中,首先要介紹的是消費互聯(lián)網(wǎng)與產業(yè)互聯(lián)網(wǎng)的概念。
結合自身經(jīng)驗來講,我從 2012 年開始負責搜狗輸入法的算法團隊,對于搜狗而言,更多的是涉足到消費互聯(lián)網(wǎng)上的,大家對消費互聯(lián)網(wǎng)都比較了解,包括衣食住行在內,每一個行業(yè)在目前也都有每一個行業(yè)的劇情。
從 2021 開始,我加入了搜車集團,投身到了產業(yè)互聯(lián)網(wǎng)行業(yè)。產業(yè)互聯(lián)網(wǎng)的核心其實同樣是應用 AI、云計算、大數(shù)據(jù)等技術,對行業(yè)上的一些經(jīng)典應用場景進行賦能。從狹義角度看,產業(yè)互聯(lián)網(wǎng)主要涉及生產制造領域。而從廣義角度來講,產業(yè)除了生產制造外,還必須經(jīng)過流通、交易、物流及倉儲,因此產業(yè)互聯(lián)網(wǎng)也并非完全局限于生產制造的領域。
2、數(shù)智化演進
互聯(lián)網(wǎng)的賦能技術,其中所涉及的方法很多都是相通的,包括 AI、大數(shù)據(jù)、云計算以及現(xiàn)在的區(qū)塊鏈和物聯(lián)網(wǎng)的一些技術。而這其中的趨勢,可以理解為信息化、數(shù)字化和智能化三個階段。
信息化,是一個形式上的變化和差異。數(shù)字化,更多的是商業(yè)模式包括應用方式的轉變。而在數(shù)字化的一個更高級階段,所經(jīng)歷的則是廣泛的應用 AI 以及相關技術對數(shù)字化的提速。通過 AI 技術的賦能,如今各行業(yè)的數(shù)字化進程正呈現(xiàn)出指數(shù)加速的趨勢。
AI 賦能產業(yè)互聯(lián)網(wǎng)
1、典型應用場景
接下來,我將以汽車行業(yè)為例介紹產業(yè)互聯(lián)網(wǎng)的算法應用。選擇汽車行業(yè)作為具體案例的主要原因有兩個,第一是因為汽車行業(yè)的市場規(guī)模與市場空間比較大,目前中國已是全球規(guī)模最大的汽車消費市場,不管是新車還是二手車,都擁有著比較大的規(guī)模。
第二,在汽車行業(yè)里涉及到的商品數(shù)量是較少的,這使得技術更容易實現(xiàn)。以車型為例,品牌下有不同的車系,車系下有不同的車型,數(shù)目大概是六七萬的規(guī)模。當在進行 AI 實踐的時候,如果需要做知識圖譜的話,一個幾億規(guī)模的圖譜和一個幾萬規(guī)模的圖譜,其中的差異是很大的,會涉及到工作量以及重復勞動的問題,這會影響 AI 工作所能提供的技術高度。
在具體業(yè)務線的選擇上,本次會以二手車作為業(yè)務主線。目前,包括搜車在內的國內外頭部汽車行業(yè)企業(yè),都是以二手車作為主業(yè)的,這其中也有著幾點重要的原因。首先,二手車是非標品。二手車作為一個商品去買賣的時候,是一車一況的,其使用情況、折舊情況都有所不同,這就會造成較大的議價空間,正因為有利益的驅使,所以做車輛流通的企業(yè)都傾向于二手車作為主業(yè),不像廣告詞說的那樣,確實是需要有中間商賺差價的。
另外,目前中國的二手車交易是逐年增長的,并且有相關的政策扶持,國家也在促進二手車的應用和流通。
2、目標及需求分析
從 AI 從業(yè)者的角度來講,當我們在做汽車流通,尤其是二手車流通領域業(yè)務時,是會遇到一些困難和挑戰(zhàn)的。其中最主要的便是之前所提到過的一車一況,二手車的車況是難以判定的,但是當我們將二手車進行商品化時,需要去判定車況損耗的情況,比如剮蹭、掉漆、磨損,需要去界定它的狀態(tài)和價值,這樣才能完成對它的完全商品化。另外,對車輛相關證件的信息化錄入也是必不可少的。這些都是將二手車從一個線下實體變?yōu)榫€上可瀏覽頁面所需要做的工作。
其次,因為我們的主要工作是行業(yè)賦能,對于傳統(tǒng) 4S 店以及二手車商而言,它們的店面主要是存在于線下的。對于一些線上或線下的 C 端客戶而言,它們需要的是快速的匹配,但這其中難免會存在一些地域差異等影響因素。
最后,在二手車的售后過程中也很容易出現(xiàn)問題,如果顧客接手了事故車,那么顧客后續(xù)的使用包括安全方面是會存在很大隱患的,這里面也存在很多難以處置的問題。
而搜車所做的,則是為上述問題提供基于 AI 技術的行業(yè)解決方案,AI 解決的基礎可以理解為 ABC。A 代表 AI,B 代表大數(shù)據(jù),C 代表云計算。搜車的側重點主要在交易和營銷領域,從一開始商品的上架,到交易的匹配,再到交易的金融方案與物流售后,每一個環(huán)節(jié)我們都會有相應的賦能。整體流程可分為前中后三個階段,其中的定損檢測和殘值預測是二手車特有的,去掉這兩個步驟,剩余的階段對于新車交易也是同樣適用的。
基于 AI 技術的優(yōu)化方案
1、車況檢測優(yōu)化
本次主要選擇整體流程中的車況檢測、殘值預測與匹配交易三個環(huán)節(jié),與大家分享 AI 算法在其中的應用。首先,是車況檢測環(huán)節(jié)。做定損檢測分成五個環(huán)節(jié),首先對于車輛的車證進行錄入,接下來檢測師會對車輛的外觀和內飾做拍照或錄制視頻,AI 算法則會自動識別視頻或者圖片里的車輛部件及瑕疵。隨后,檢測師將對所呈現(xiàn)的瑕疵進行核對及修改。在確認信息無誤后,檢測師會把數(shù)據(jù)傳輸?shù)皆贫撕笈_進行審核。
在這個流程中要解決的核心問題,是要提升算法識別的精確度。而其中主要的困難,在于汽車部件與瑕疵類型的數(shù)目過多且難以區(qū)分。對此,所做出的提速和效果優(yōu)化分成幾個維度,一般圖像識別的任務會用 CNN 去抽取基本特征,而后是基于 Transformer 的模型在圖像中進行應用,并使用 Transformer 的模型做了一些簡單的調整。另一方面,基于汽車的圖片,我們構建了一個汽車領域的預訓練的模型,并在流程上做了一些優(yōu)化,使得一張圖里邊能夠識別盡可能多的缺陷,當然這里也有可能誤檢與漏檢,對此我們做了一些調整,使得我們后面的提速得到了比較明顯的體現(xiàn)。
2、殘值預測優(yōu)化
其次是車輛殘值預測環(huán)節(jié),這里的第一個困難是在于缺乏標準,二手車很難用一個很確切的方式去衡量。它的價格影響因素很多,有地域因素、車況因素、顏色因素,這是在品牌車型之外的一些需要去考量的目標。第二,在所使用的數(shù)據(jù)中,車輛要么作為零售賣出,要么就是批售賣出,不會同時存在零售價和批售價,因此會存在零售價和批售價倒掛的問題。
對于上述問題,首先需進行數(shù)據(jù)層面的優(yōu)化,采用新車與二手車的零售價、批售價數(shù)據(jù)進行共同考慮。由于國產車與外國品牌車輛的銷售策略不同,因此新車的指導價與到手價會是二手車估價的一個重要影響因素。另一方面,是否有足夠的交易數(shù)據(jù)量支撐也是極為重要的一點。而在特征層面,則需要更加全面的特征考量,這其中包括車輛的車型信息、車齡、地域、顏色、過戶次數(shù)、里程數(shù)、車況、新車指導價、新車到手價等特征。其次是模型層面,這部分的差異化是比較小的,各企業(yè)都會利用深度學習模型或者樹模型。最后的接口層面,零售、批售對應的價格以及處置的周期,都是往經(jīng)營分析上面去靠的。
3、匹配交易優(yōu)化
最后一個環(huán)節(jié),是車輛的匹配與交易,該環(huán)節(jié)存在的困難第一是車輛的購買,C 端是一個高消費但低頻的環(huán)節(jié),用戶的決策周期是比較長的,而車商往往是聚集到線下的。因此,獲取采集它們信息并放到線上去做自動的匹配是比較困難的,并且這其中還存在一些地域的差異。對此的解決的方式是,通過集團內部資源的整合,盡可能讓交易能夠掛到線上,并綜合考慮物流,盡可能地解決其中的跨地域問題,包括對一些頂價策略、一些 bot 策略去做提升。這里的技術架構其實也是比較經(jīng)典的,就是推薦系統(tǒng)的模型。
而為了更好的賦能匹配與交易環(huán)節(jié),需要對傳統(tǒng)推薦系統(tǒng)進行優(yōu)化,更多的考慮用戶的系統(tǒng)優(yōu)化,并把用戶的推薦系統(tǒng)的系統(tǒng)目標與平臺的營收目標結合起來,基于 MMoE 模型進行整合。綜合的考慮用戶使用的滿意度以及平臺營收的滿意度。采用田忌賽馬的思想,在某些部分進行一定程度的舍棄,去降低某些客戶的需求,實現(xiàn)保證全局收益的最終目標。
總結與展望
無論是消費互聯(lián)網(wǎng)還是產業(yè)互聯(lián)網(wǎng),其中都會應用到很多的 AI 技術。而我們要做的,是根據(jù)業(yè)務的需求和目標選擇合適的模型,以結果作為技術應用的最終導向,為業(yè)務目標的提升、用戶體驗的提升,去選擇最合適的技術手段。
并且在許多業(yè)務之中,一些人工的、規(guī)則的,包括一些統(tǒng)計的簡單模型,其實也是有著生存空間的,而且它們所發(fā)揮的作用有時會比我們所追求的高大上的算法還要大。最后,在技術的應用方面,希望大家能進行更多新的嘗試,這將會是很有意思的事情。
嘉賓介紹
張揚,大搜車集團 AI 中心負責人 / 資深總監(jiān)。搜狗輸入法初創(chuàng)成員之一,歷任搜狗輸入法算法負責人,前平安人壽 AI Lab 語義問答產品負責人,現(xiàn)大搜車集團 AI 中心負責人、資深總監(jiān)。發(fā)表及合作發(fā)表 ACL、EMNLP、IJCAI 等 CCF A/B 類國際 AI 會議論文 10 篇,國際及國內技術專利 28 項。
此外,更加值得關注的是,在今年的 4 月 9 日 -10 日,張揚老師還將以專題出品人及演講嘉賓的身份出席 WOT 全球技術創(chuàng)新大會,并在大會的“算法與 AI 應用”專題中為參會聽眾帶來更多 AI 技術細節(jié)層面的內容分享。對 AI 算法及產業(yè)數(shù)字化轉型感興趣的同學,這將是你不容錯過的學習與成長機會。
目前大會 8 折購票中,現(xiàn)在購票立減 1160 元,團購還有更多優(yōu)惠!感興趣的同學可掃描下圖二維碼或點擊閱讀原文了解更多參會信息。任何大會相關問題歡迎聯(lián)系票務小姐姐秋秋:15600226809(電話同微信)