火山引擎基于大模型 ChatBI 的演進(jìn)與實(shí)踐
一、背景與趨勢
1. BI 平臺演進(jìn) - 全面進(jìn)入智能化
在探討火山引擎 BI 工具的發(fā)展歷程時(shí),可以清晰地劃分為幾個(gè)關(guān)鍵階段,這些階段亦與市面上主流 BI 工具的演進(jìn)過程相吻合。
最初,傳統(tǒng) BI 工具主要聚焦于報(bào)表平臺,由業(yè)務(wù)方提出需求,產(chǎn)研團(tuán)隊(duì)作為數(shù)據(jù)的主要生產(chǎn)者,負(fù)責(zé)制造簡單的報(bào)表,以輔助經(jīng)營儀表盤的制作。這一階段的生產(chǎn)過程相對原始,成本較高,主要服務(wù)于一線業(yè)務(wù)和決策層,提供聚合性數(shù)據(jù)的定向查看。
隨后,BI 工具進(jìn)入全民數(shù)據(jù)分析時(shí)代,即第二階段。此階段,業(yè)務(wù)方和數(shù)據(jù)分析師對數(shù)據(jù)的生產(chǎn)準(zhǔn)備、看板制作及數(shù)據(jù)分析產(chǎn)生了強(qiáng)烈訴求,自助分析的概念應(yīng)運(yùn)而生。這一階段標(biāo)志著自助 BI 的普及,全民數(shù)據(jù)分析成為主流。
進(jìn)入第三階段,當(dāng)數(shù)據(jù)生產(chǎn)、加工及簡單的數(shù)據(jù)呈現(xiàn)不再是瓶頸時(shí),基于 AI 能力、自動(dòng)化及智能化的數(shù)據(jù)分析、提取及加工需求變得愈發(fā)重要。這一階段,歸因能力、基于數(shù)據(jù)的智能洞察與決策能力,以及分析助手等功能的訴求逐漸增強(qiáng)。火山引擎的 BI 平臺正是在這三個(gè)階段的逐步演進(jìn)中,不斷成熟與發(fā)展。
2. 火山引擎 DataWind 企業(yè)級 BI 平臺建設(shè)歷程
DataWind 是火山引擎推出的 BI 平臺。在建設(shè)初始階段,DataWind 主要聚焦于 MVP 產(chǎn)品路徑的構(gòu)建,致力于滿足研發(fā)者、分析師、一線業(yè)務(wù)及日常協(xié)同辦公等多方面的需求。具體而言,它涵蓋了搜索查詢、可視化查詢、儀表盤搭建、數(shù)據(jù)協(xié)同及數(shù)據(jù)集構(gòu)建等核心功能,為平臺的后續(xù)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
隨著基礎(chǔ)能力的逐步完善,DataWind 平臺邁入了第二個(gè)發(fā)展階段。在這一階段,平臺開始關(guān)注數(shù)據(jù)隔離、智能歸因及移動(dòng)端能力等更高層次的需求。項(xiàng)目中心的建立、智能歸因系統(tǒng)的引入以及移動(dòng)端多端能力的提升,不僅滿足了經(jīng)營者及一線業(yè)務(wù)人員在移動(dòng)端查看數(shù)據(jù)的迫切需求,也進(jìn)一步增強(qiáng)了平臺的決策支持能力。
如今,DataWind 正經(jīng)歷著創(chuàng)新與突破的關(guān)鍵時(shí)期。平臺不僅補(bǔ)全了可視化建模的能力,還在近年來逐步拓展了洞察決策、歸因分析以及結(jié)合大模型構(gòu)筑的 copilot 等前沿能力。這些創(chuàng)新不僅提升了平臺的智能化水平,也為其在未來的發(fā)展中注入了新的活力。
3. 產(chǎn)品能力矩陣
DataWind 展現(xiàn)了一個(gè)全面且強(qiáng)大的能力矩陣。其核心價(jià)值體現(xiàn)在“零門檻、全自助、強(qiáng)協(xié)調(diào)、強(qiáng)協(xié)作”上,旨在使業(yè)務(wù)用戶能夠輕松學(xué)習(xí)并高效運(yùn)用該工具。
DataWind 巧妙融合了當(dāng)前先進(jìn)的大模型技術(shù),從而實(shí)現(xiàn)了 BI 與 AI 的深度融合,為用戶提供了洞察決策與交互式分析等高級功能。特別是智能歸因預(yù)警及數(shù)據(jù)協(xié)同辦公等功能。
4. 服務(wù)于抖音集團(tuán)內(nèi)部業(yè)務(wù)的數(shù)據(jù)產(chǎn)品
DataWind 在抖音集團(tuán)內(nèi)部是極為關(guān)鍵的數(shù)據(jù)產(chǎn)品工具之一,其用戶規(guī)模龐大覆蓋了集團(tuán)內(nèi) 500 余條業(yè)務(wù),為超過 80% 的日常業(yè)務(wù)用戶提供服務(wù)。此外,DataWind 在性能上表現(xiàn)出色,能夠?qū)崿F(xiàn)秒級的數(shù)據(jù)查詢。
二、火山引擎 AI+BI 的探索與落地
文章第二部分將重點(diǎn)探討火山引擎 DataWind 如何與大模型或 AI 能力相結(jié)合,以推動(dòng)其在多個(gè)場景中的探索與落地。從業(yè)務(wù)閉環(huán)分析和決策的視角出發(fā),詳細(xì)闡述 DataWind 在大模型結(jié)合上的探索路徑。
1. DataWind AI+BI 探索路徑
整個(gè)數(shù)據(jù)生產(chǎn)與分析鏈路被清晰地劃分為幾個(gè)階段。
首先,數(shù)據(jù)生產(chǎn)階段,主要由產(chǎn)品研發(fā)團(tuán)隊(duì)負(fù)責(zé)數(shù)據(jù)準(zhǔn)備。隨后,數(shù)據(jù)進(jìn)入分析階段,由分析師或運(yùn)營團(tuán)隊(duì)進(jìn)行數(shù)據(jù)加工、分析與洞察。對于一線業(yè)務(wù)團(tuán)隊(duì)而言,他們可能不具備數(shù)據(jù)加工或分析能力,但可以通過臨時(shí)查詢獲得核心數(shù)據(jù)相關(guān) KPI,進(jìn)行定性或定向的分析。然而,這些查詢結(jié)果往往不足以指導(dǎo)業(yè)務(wù)決策,因此需要對加工或查詢后的數(shù)據(jù)進(jìn)行深入洞察,以輔助業(yè)務(wù)發(fā)展與決策。
DataWind 緊密配合這一業(yè)務(wù)分析與數(shù)據(jù)使用鏈路,通過融入大模型技術(shù),旨在提升整個(gè)分析閉環(huán)鏈路的效率并降低成本。在上述四個(gè)層次中,每一層都加入了大模型的加持,以實(shí)現(xiàn)這一目標(biāo)。
2. 智能數(shù)據(jù)洞察的大模型能力矩陣
從產(chǎn)品架構(gòu)的視角來看,DataWind 與大模型的結(jié)合展現(xiàn)出了全新的發(fā)展方向。在數(shù)據(jù)準(zhǔn)備階段,該工具充分利用大模型的能力,實(shí)現(xiàn)了指標(biāo)維度的智能識別、描述備注的自動(dòng)填充以及字段表達(dá)式的智能生成。此外,針對研發(fā)視角的數(shù)據(jù)準(zhǔn)備工作,火山引擎 BI 工具還提供了 SQL 自動(dòng)生成、SQL 自動(dòng)解釋、SQL 優(yōu)化,以及 SQL 一鍵修復(fù)等功能。
在分析師、運(yùn)營及產(chǎn)品研發(fā)的視角,DataWind 在分析功能上投入了大量精力。在可視化查詢方面,該工具配備了字段式表達(dá)式的生成、二次分析的能力,以及自然語言對話查詢、臨時(shí)查詢等便捷功能。用戶還可以輕松切換數(shù)據(jù)集、圖表類型,并享受一鍵美化圖表以及智能推薦相應(yīng)工作的服務(wù)。
面向一線業(yè)務(wù)、運(yùn)營和分析師,以及管理層決策者,提供了儀表盤探索分析的功能,包括智能生成儀表盤、數(shù)據(jù)自動(dòng)解讀等。針對移動(dòng)辦公需求,ChatBI 與辦公軟件也深度集成,如配合飛書提供了基于 IM 的對話查詢、多輪追問等分析能力。此外,DataWind 還結(jié)合了多端能力,除了移動(dòng)端外,還支持?jǐn)?shù)據(jù)大屏、數(shù)字孿生等多種工具。在數(shù)據(jù)大屏中,同樣配備了智能分析和智能語音交互的能力,為用戶提供了更加全面的數(shù)據(jù)支持。
DataWind 與大模型的結(jié)合場景已經(jīng)探索了 20+copilot 能力,全面覆蓋了 BI 工具的生產(chǎn)鏈路,顯著提升了用戶的生產(chǎn)效率。
3. 數(shù)據(jù)分析與消費(fèi)
- 在分析與消費(fèi)領(lǐng)域,該工具面向一線業(yè)務(wù)、分析師、管理層以及企業(yè)用戶,提供了豐富的功能。
- 對于一線業(yè)務(wù)人員,提供了 AI 洞察、數(shù)據(jù)解讀以及圖表數(shù)據(jù)探索等功能,幫助他們更深入地理解數(shù)據(jù)。
- 對于分析師,智能儀表盤的自動(dòng)生成、圖表的智能美化、二次分析及表達(dá)式生成等能力,可以大大提升他們的工作效率。
- 管理層則可以通過 ChatBI 移動(dòng)端、智能體以及移動(dòng)駕駛艙,隨時(shí)隨地掌握企業(yè)運(yùn)營狀況。
- 針對企業(yè)形象宣傳的需求,DataWind 還提供了智能語音大屏,以直觀、生動(dòng)的方式展示企業(yè)實(shí)力與形象。
DataWind 提供的儀表盤,通過集成大模型的能力,實(shí)現(xiàn)了數(shù)據(jù)的智能解讀。在儀表盤上,各個(gè)圖標(biāo)組件均可通過點(diǎn)擊數(shù)據(jù)解讀功能,迅速獲得對當(dāng)前數(shù)據(jù)的深度分析,包括折線圖的高點(diǎn)、低點(diǎn)、波峰、波谷及移動(dòng)值等,為一線業(yè)務(wù)團(tuán)隊(duì)提供了便捷的數(shù)據(jù)監(jiān)控與分析手段。
需要明確的是,此處的數(shù)據(jù)解讀并非傳統(tǒng)意義上的歸因分析,而是對數(shù)據(jù)的直觀呈現(xiàn)與初步理解。若系統(tǒng)提供的數(shù)據(jù)解讀無法滿足特定業(yè)務(wù)需求,DataWind 還配備了自定義數(shù)據(jù)解讀功能,允許業(yè)務(wù)團(tuán)隊(duì)根據(jù)自身需求配置解讀思路,實(shí)現(xiàn)千人千面的數(shù)據(jù)解讀效果。
此外,DataWind 儀表盤還融入了 AI 問答能力,針對圖表背后的完整數(shù)據(jù)集,允許用戶通過自然語言的方式詢問更細(xì)顆粒度的數(shù)據(jù),從而降低了數(shù)據(jù)提取的難度。這種自然語言的交互方式,更符合一線業(yè)務(wù)人員的常規(guī)使用習(xí)慣,提高了數(shù)據(jù)使用的便捷性。
為確保數(shù)據(jù)提取的準(zhǔn)確性和可信度,DataWind 還提供了多種輔助手段,如經(jīng)典BI 的膠囊位驗(yàn)證方式,以及查看原始 SQL 和數(shù)據(jù)集的功能。
DataWind 通過集成大模型的能力,為報(bào)表的解讀與探索提供了全新的解決方案,不僅提高了數(shù)據(jù)使用的便捷性,還確保了數(shù)據(jù)的準(zhǔn)確性和可信度。
針對一線業(yè)務(wù)人員的另一重要場景為 AI 查詢,這一獨(dú)立模塊專為滿足一線業(yè)務(wù)人員對數(shù)據(jù)的深度探索與自定義分析需求而設(shè)計(jì)。與儀表盤基于圖表本身的詢問不同,AI 查詢模塊允許資深業(yè)務(wù)人員或決策者對公司內(nèi)部數(shù)據(jù)進(jìn)行臨時(shí)性的深入探索。
用戶只需進(jìn)入 AI 查詢模塊,選擇相應(yīng)的數(shù)據(jù)集,即可通過自然語言進(jìn)行多輪對話,輕松獲取所需的數(shù)據(jù)結(jié)果。這種完全基于自然語言的交互方式,極大地降低了數(shù)據(jù)查詢的門檻,使得業(yè)務(wù)人員能夠更便捷地與系統(tǒng)進(jìn)行交互。
此外,DataWind 還注重細(xì)節(jié)工作,如提供數(shù)據(jù)集的常用字段等輔助性信息,以幫助用戶更好地理解和使用數(shù)據(jù)。這些措施旨在消除用戶與陌生系統(tǒng)或數(shù)據(jù)集之間的交互障礙,提升整體的數(shù)據(jù)使用體驗(yàn)。
在介紹了針對一線業(yè)務(wù)人員所提供的兩大能力后,接下來介紹為分析師群體所配備的能力。
對于分析師而言,構(gòu)建儀表盤是其日常工作的核心部分,而 DataWind 平臺則為此提供了智能生成儀表盤的功能。用戶僅需通過自然語言描述所需儀表盤的類型、分析思路及布局要求,系統(tǒng)便能據(jù)此智能生成一份初始化的儀表盤模板,極大地提升了工作效率。
值得注意的是,盡管大模型在智能生成過程中展現(xiàn)出強(qiáng)大的能力,但仍難以確保百分之百的準(zhǔn)確性。因此,DataWind 平臺還提供了二次調(diào)教的功能,允許用戶對生成的儀表盤進(jìn)行細(xì)致的調(diào)整與優(yōu)化,以確保數(shù)據(jù)的準(zhǔn)確性和分析的精準(zhǔn)性。這一功能不僅彰顯了 DataWind 平臺對用戶需求的深刻理解,也體現(xiàn)了其在技術(shù)層面的卓越實(shí)力。
分析師在進(jìn)行 BI 數(shù)據(jù)分析時(shí),常受限于數(shù)據(jù)集本身的顆粒度和明細(xì)程度。若數(shù)據(jù)集過于明細(xì),分析師可能僅能通過 BI 系統(tǒng)獲取當(dāng)前分析所需的部分?jǐn)?shù)據(jù),而難以在后鏈路中完成自定義字段的添加、數(shù)據(jù)的聚合與加工等長尾工作。這往往導(dǎo)致分析師需要向產(chǎn)研或中臺團(tuán)隊(duì)提出需求,請求對數(shù)據(jù)進(jìn)行二次加工,導(dǎo)致工作效率受到影響,也無法及時(shí)響應(yīng)業(yè)務(wù)人員的需求。
為解決這一問題,DataWind 推出了二次分析大模型能力。分析師在完成可視化查詢后,可基于當(dāng)前結(jié)果,通過自然語言與大模型進(jìn)行對話,由大模型完成后續(xù)的數(shù)據(jù)加工工作。例如,若原始數(shù)據(jù)集中僅有銷售額字段,分析師可要求大模型生成月銷售額占比的衍生字段。大模型將基于當(dāng)前結(jié)果直接生成該衍生字段,從而極大地簡化了分析師的工作流程。
這一功能大大提高了分析師的工作效率,解決了其在長尾需求分析中所面臨的痛點(diǎn)。分析師無需再將數(shù)據(jù)下載至 Excel 中進(jìn)行加工,而是可以直接在系統(tǒng)中完成所有分析工作。
分析師在運(yùn)用 BI 工具時(shí),常需構(gòu)建計(jì)算字段以滿足特定分析需求。然而,隨著 BI 工具功能的日益豐富和函數(shù)表達(dá)式的增多,構(gòu)建自定義字段的學(xué)習(xí)成本也隨之增加。為解決這一問題,DataWind 引入了結(jié)合大模型的能力。
通過自然語言與大模型進(jìn)行對話,分析師可以便捷地獲取構(gòu)建所需字段的函數(shù)表達(dá)式建議。大模型能夠根據(jù)分析師的需求,智能推薦合適的函數(shù),從而極大地降低了學(xué)習(xí)成本,提升了生產(chǎn)效率。這一功能雖然看似簡單,但在實(shí)際應(yīng)用場景中卻具有高頻次的使用價(jià)值。
在探討完分析師角色后,接下來是管理層的應(yīng)用場景。
首先,DataWind 與飛書實(shí)現(xiàn)了深度集成,為移動(dòng)端配備了 ChatBI 功能。在飛書平臺內(nèi),用戶可以激活 DataWind ChatBI 機(jī)器人,通過自然語言問詢的方式獲取所需數(shù)據(jù)結(jié)果。該功能支持多輪問答及常規(guī)圖形切換,用戶點(diǎn)擊圖表或獲取結(jié)果后,可進(jìn)一步查看詳情。此外,DataWind 還提供了查看原始 SQL、配置及輔助信息的能力,以增強(qiáng)數(shù)據(jù)的可信度。這些功能設(shè)計(jì)充分滿足了管理層及有移動(dòng)辦公需求的一線業(yè)務(wù)人員在出差或無法使用電腦時(shí),快速獲取所需數(shù)據(jù)的場景需求。
未來,大模型的能力不再是簡單的“指標(biāo)和維度”,而是“問題與答案”。DataWind 團(tuán)隊(duì)近期也在進(jìn)行相關(guān)探索,并孵化了一款“智能體”產(chǎn)品,與 ChatBI 有著本質(zhì)區(qū)別。
在 ChatBI 場景中,用戶需基于單數(shù)據(jù)集進(jìn)行自然語言問答,而在智能體中,用戶則直接與智能體對話,無需關(guān)注數(shù)據(jù)集的選擇。用戶提出問題后,智能體會從業(yè)務(wù)鏈路中所有數(shù)據(jù)庫表中獲取相關(guān)數(shù)據(jù),給出答案。此外,智能體還提供推薦問題、答案收藏及推送等功能,使用戶能更便捷地獲取所需信息。
智能體的產(chǎn)品形態(tài)脫離了數(shù)據(jù)集本身的概念,構(gòu)建了完整的業(yè)務(wù)域。作為核心或垂類業(yè)務(wù)方,用戶無需單獨(dú)指定某個(gè)數(shù)據(jù)庫表,而是直接基于業(yè)務(wù)問題進(jìn)行問答。這一發(fā)展初步實(shí)現(xiàn)了向“問題與答案”方向迭代和演進(jìn)的目標(biāo),為業(yè)務(wù)方和決策者提供了更為便捷、高效的數(shù)據(jù)查詢方式。
針對政企客戶及企業(yè)宣發(fā)與形象推廣需求,BI 系統(tǒng)能提供大屏與數(shù)字孿生等先進(jìn)功能。在此場景下,DataWind 探索并融入了大模型能力,使得用戶能夠與大屏進(jìn)行自然語言對話,即時(shí)輸出相關(guān)數(shù)據(jù)。此外,用戶還能通過交互獲取更多信息內(nèi)容,增強(qiáng)了場景的互動(dòng)性和智能化水平。
4. 數(shù)據(jù)生產(chǎn)與加工
在探討完數(shù)據(jù)消費(fèi)之后,接下來看一下數(shù)據(jù)生產(chǎn)和加工領(lǐng)域,大模型功能的演進(jìn)與孵化。在數(shù)據(jù)生產(chǎn)和加工過程中主要聚焦于三個(gè)關(guān)鍵角色:數(shù)據(jù)研發(fā)、分析師,以及業(yè)務(wù)合作伙伴。
對于數(shù)據(jù)研發(fā)人員而言,常規(guī)的數(shù)據(jù)生產(chǎn)工作通常依賴于 SQL 分析和 SQL 平臺的能力。為了進(jìn)一步提升效率,DataWind 結(jié)合了大模型技術(shù),孵化了一系列自動(dòng)化工具,包括一鍵 SQL 優(yōu)化、自動(dòng)生成 SQL、一鍵為 SQL 生成注釋,以及針對 SQL 錯(cuò)誤的一鍵診斷和一鍵修復(fù)功能。由于 SQL 本身具備工具化和語法規(guī)范的特點(diǎn),與大模型技術(shù)的結(jié)合顯得尤為契合,從而實(shí)現(xiàn)了高準(zhǔn)確率的自動(dòng)化處理。
在完成數(shù)據(jù)生產(chǎn)后,為了滿足業(yè)務(wù)需求,分析師還需進(jìn)行數(shù)據(jù)的二次分析和深度聚合。為此,DataWind 也配備了相應(yīng)的二次分析能力,確保數(shù)據(jù)研發(fā)人員或分析師在編寫 SQL 后,能夠?qū)?shù)據(jù)進(jìn)行進(jìn)一步的校驗(yàn)和深度挖掘,以保障數(shù)據(jù)的準(zhǔn)確性和可用性,從而滿足業(yè)務(wù)方的需求。
在數(shù)據(jù)生產(chǎn)和加工領(lǐng)域,結(jié)合大模型的能力,DataWind 推出了數(shù)據(jù)快速加工助手,即數(shù)據(jù)準(zhǔn)備助手。該助手能夠自動(dòng)識別加工后的數(shù)據(jù)集中的維度和指標(biāo),并實(shí)現(xiàn)一鍵描述與備注填充,這一功能雖看似細(xì)微,實(shí)則作用顯著。鑒于導(dǎo)入的數(shù)據(jù)底表、數(shù)據(jù)庫表及數(shù)據(jù)集常含英文字段,為便于業(yè)務(wù)方更好地理解庫表含義,大模型在識別維度、指標(biāo)并進(jìn)行智能填充時(shí),會將其轉(zhuǎn)譯為中文。
不僅如此,大模型還能基于語義理解,為包含復(fù)雜表達(dá)式的字段(如 CASE WHEN、IF ELSE 等)構(gòu)建業(yè)務(wù)描述,從而助力用戶準(zhǔn)確理解字段所表達(dá)的業(yè)務(wù)含義。這些業(yè)務(wù)描述在前端數(shù)據(jù)消費(fèi)環(huán)節(jié),還能作為大模型語義的補(bǔ)充,進(jìn)一步優(yōu)化字段召回,提升準(zhǔn)確率,形成了一個(gè)閉環(huán)優(yōu)化與反饋機(jī)制。
在數(shù)據(jù)探索與準(zhǔn)備的范疇中,知識庫管理占據(jù)著舉足輕重的地位。尤其在 BI 的商業(yè)化應(yīng)用中,知識庫與行業(yè)術(shù)語的黑話成為大模型與 BI 結(jié)合的一大挑戰(zhàn)。眾多客戶反饋,他們期望能依據(jù)行業(yè)特有的描述與問答模式,更有效地獲取相關(guān)數(shù)據(jù)。然而,目前的技術(shù)尚不支持直接導(dǎo)入文檔以供大模型自主學(xué)習(xí)并高效運(yùn)用行業(yè)知識。
我們發(fā)現(xiàn),在提供完全泛化的文案內(nèi)容時(shí),大模型的召回準(zhǔn)確率反而有所下降。實(shí)踐表明,大模型在有限且規(guī)則明確的知識體系內(nèi),尤其是經(jīng)過配置化的知識語料訓(xùn)練后,能更好地響應(yīng)客戶的查詢。因此,DataWind 引入了知識管理能力,針對數(shù)據(jù)集中的核心業(yè)務(wù)字段構(gòu)建同義詞,并補(bǔ)充業(yè)務(wù)場景描述,以增強(qiáng)大模型對行業(yè)術(shù)語及特殊詞匯的識別能力。
5. 數(shù)據(jù)決策與洞察
在 BI 生態(tài)中,為管理層量身定制的移動(dòng)駕駛艙功能助手是一大亮點(diǎn)。通過移動(dòng)駕駛艙,管理層能夠享有更加自由靈活的數(shù)據(jù)訪問體驗(yàn)。其中所呈現(xiàn)的數(shù)據(jù)均為經(jīng)過前置配置的核心數(shù)據(jù),旨在滿足管理層對數(shù)據(jù)嚴(yán)肅性與嚴(yán)謹(jǐn)性的要求。相較于泛化的分析工作,移動(dòng)駕駛艙更側(cè)重于核心數(shù)據(jù)的提取與移動(dòng)監(jiān)測,為管理層提供精準(zhǔn)、高效的數(shù)據(jù)支持。
結(jié)合大模型技術(shù),移動(dòng)駕駛艙能夠調(diào)取豐富的信息與知識,完美契合管理層日常辦公的需求。它不僅展示了核心指標(biāo)數(shù)據(jù),還集成了會議紀(jì)要、結(jié)論以及市場信息和輿情,為管理層提供了一個(gè)全面、深度的視角。因此,這款管理工具是面向管理層精心孵化,并與大模型深度結(jié)合的產(chǎn)物,旨在提升管理層的決策效率與質(zhì)量。
決策和洞察功能的第二塊是數(shù)據(jù)洞察與歸因。提供了三種歸因方式:
- 維度歸因:對指標(biāo)的變化,在各維度上進(jìn)行拆解,并給出定量的貢獻(xiàn)解釋。這里引入了定基法、加權(quán)占比法等算法。
- 指標(biāo)歸因:將復(fù)合指標(biāo)或計(jì)算指標(biāo)拆解成因子指標(biāo)來看其貢獻(xiàn)度。
- 異動(dòng)分析:結(jié)合時(shí)序預(yù)測算法,對指標(biāo)進(jìn)行自動(dòng)探查。
結(jié)合這三種歸因能力,還提供了更加全面的指標(biāo)分析樹的能力。
下圖展示了歸因報(bào)告的樣例。
DataWind 分析助手的整體架構(gòu)如下圖所示。收到一個(gè)自然語言的用戶提問后,首先會經(jīng)過初步的內(nèi)容審查和攔截,下一步是生成 prompt,提交給大模型,大模型返回 SQL 和回答,再經(jīng)過第二輪審計(jì),最終服務(wù)于不同分析場景。
大模型為 BI 帶來了兩大優(yōu)勢,一是數(shù)據(jù)開發(fā)提效,二是數(shù)據(jù)消費(fèi)擴(kuò)大。
火山引擎 DataWind 分析助手的顯著優(yōu)勢在于:
- 首先,得益于大量復(fù)雜場景與大規(guī)模用戶的實(shí)踐打磨,作為內(nèi)部最大的數(shù)據(jù)產(chǎn)品工具,其用戶體量龐大,為分析助手在客戶側(cè)的使用提供了豐富的驗(yàn)證機(jī)會,促使其逐步迭代并趨向成熟。
- 其次,火山引擎擁有豆包大模型的知識儲備,模型迭代與優(yōu)化進(jìn)程可控,且得到了全力投入與支持。
- 此外,火山引擎在算法工程、大模型應(yīng)用及數(shù)據(jù)應(yīng)用方面亦具備顯著實(shí)力,通過工程化層面的深入工作,確保了數(shù)據(jù)的高準(zhǔn)確性。
- 最后,火山引擎持續(xù)進(jìn)行超飽和的高質(zhì)量投入,其數(shù)據(jù)運(yùn)營團(tuán)隊(duì)中超過一半的產(chǎn)研力量在 2023 年至 2024 年間全力投入到分析助手的孵化與迭代中,未來還將加大投入。
因此,火山引擎 DataWind 有信心將大模型與 BI 的結(jié)合推向行業(yè)領(lǐng)先地位。
三、DataWind 外部實(shí)踐場景
1. 某全球化消費(fèi)電子品牌
某全球化消費(fèi)電子品牌面臨舊 BI 平臺 AI 能力不足、難以結(jié)合新技術(shù)、無法實(shí)現(xiàn)高速演進(jìn)、業(yè)務(wù)自助分析難以實(shí)現(xiàn)以及缺乏高效整合型 BI 平臺等問題。DataWind 憑借其優(yōu)勢能力,成功滿足了該品牌的需求。首先,DataWind 與飛書實(shí)現(xiàn)了強(qiáng)聯(lián)動(dòng)協(xié)同,提升了工作效率。其次,DataWind 提供了低門檻的可視化能力和敏捷的即席分析,滿足了業(yè)務(wù)的正常使用需求。此外,DataWind 當(dāng)時(shí)正孵化的 ChatBI 能力也引起客戶的興趣,符合其使用理念。因此,該品牌選擇了 DataWind 作為 BI 承載工具。
業(yè)務(wù)場景中,財(cái)務(wù)部門對數(shù)據(jù)的分析需求尤為突出,因其對數(shù)據(jù)要求嚴(yán)謹(jǐn)且分析視角多維。然而,財(cái)務(wù)人員雖專業(yè)于數(shù)據(jù),卻在描述需求時(shí)顯得瑣碎,難以精準(zhǔn)表達(dá),同時(shí)其底表明細(xì)復(fù)雜,構(gòu)建模型與數(shù)據(jù)集頗具挑戰(zhàn)。在此情境下,ChatBI 能力顯現(xiàn)出顯著優(yōu)勢,其分析視角多樣、數(shù)據(jù)建模靈活、適應(yīng)分析思路多變的特點(diǎn),恰好滿足了財(cái)務(wù)部門的需求。此外,ChatBI 還能很好地融入財(cái)務(wù)數(shù)據(jù)分發(fā)及與飛書等工具的協(xié)同辦公場景中。
同樣,行政與 HR 部門也面臨類似挑戰(zhàn),數(shù)據(jù)瑣碎、分析思路多樣,導(dǎo)致中臺部門難以準(zhǔn)確理解和實(shí)現(xiàn)其需求。因此,Chat BI 與分析助手同樣成為了這些部門的理想選擇。
針對 HR 人事考勤部門的痛點(diǎn),該客戶發(fā)現(xiàn)考勤點(diǎn)眾多且場景分散,難以向數(shù)據(jù)分析部門準(zhǔn)確傳達(dá)需求以生成完整報(bào)表。而通過引入分析助手,HR 團(tuán)隊(duì)能夠基于原始考勤數(shù)據(jù),高效地進(jìn)行統(tǒng)計(jì)分析,精確掌握員工在不同場景下的平均出勤情況。這一解決方案完美契合了分析助手的能力,有效解決了客戶的實(shí)際問題。
2. 某汽車企業(yè)
下面介紹的是一個(gè)汽車行業(yè)客戶,聚焦在移動(dòng)駕駛艙場景。近年來,汽車行業(yè)競爭激烈,每家汽車廠商除了關(guān)注自身核心數(shù)據(jù)以外,還會關(guān)注公共輿情、市場動(dòng)態(tài)以及競爭對手的市場數(shù)據(jù)。移動(dòng)駕駛艙首先可以滿足管理層數(shù)據(jù)盯盤和移動(dòng)辦公的需求,還可以提供公域信息中的相關(guān)數(shù)據(jù),同時(shí)還提供定期總結(jié),完美解決了客戶需求,為其降本增效、緊跟市場動(dòng)態(tài)提供了助力。
3. 某電商平臺
第三個(gè) B 端案例是某電商平臺。在 DataWind 大模型分析助手的能力加持下,客戶工作效率得到了大幅提升。
4. 某內(nèi)容平臺
最后是一個(gè)內(nèi)容平臺客戶案例。DataWind ChatBI 移動(dòng)辦公的能力,很好地滿足了創(chuàng)作者運(yùn)營團(tuán)隊(duì)隨時(shí)隨地獲取信息的需求,幫助他們及時(shí)識別運(yùn)營機(jī)會與方向,為精細(xì)化運(yùn)營奠定了基礎(chǔ)。
四、總結(jié)與展望
在探討 ChatBI 或 AI+BI 的未來發(fā)展方向與趨勢時(shí),有幾個(gè)關(guān)鍵點(diǎn)值得關(guān)注。
- 首先,垂類場景的深度挖掘?qū)⒊蔀橹匾厔?。隨著 BI 廠商與大模型結(jié)合能力的不斷探索,市場逐漸認(rèn)識到,在部分場景下,大模型加 BI 的準(zhǔn)確率難以完全滿足高預(yù)期。因此,針對復(fù)雜泛化問題的解決方案將趨向于收斂于具體的垂類場景,高效滿足用戶實(shí)際痛點(diǎn)將成為產(chǎn)品競爭力的關(guān)鍵。另外,跨表構(gòu)建業(yè)務(wù)主題分析域?qū)⒊蔀橹匾n題。初期 AI+BI 能力多基于單表問詢進(jìn)行孵化,但這并不符合業(yè)務(wù)實(shí)際應(yīng)用場景。未來,跨表構(gòu)建垂類主題域,實(shí)現(xiàn)問題與答案的緊密結(jié)合,或?qū)⒊蔀榇竽P偷陌l(fā)展方向。
- 第二,指標(biāo)的治理與應(yīng)用將是提升大模型應(yīng)用效率的重要手段。在實(shí)際應(yīng)用中,原始數(shù)據(jù)往往較為混亂,大模型難以直接進(jìn)行數(shù)據(jù)治理和加工。因此,用戶和供應(yīng)商需共同解決數(shù)據(jù)復(fù)雜度問題,以更好地應(yīng)用大模型服務(wù)于業(yè)務(wù)。
- 第三,深化 AI 能力將成為核心競爭力。數(shù)據(jù)分析領(lǐng)域 BI 的普及帶動(dòng)了 AI 能力的普及,未來 AI 能力需在生產(chǎn)、取數(shù)、決策洞察等全方位閉環(huán)解決業(yè)務(wù)全場景問題,才能構(gòu)筑 AI+BI 產(chǎn)品的競爭力。
- 最后,多邊系統(tǒng)協(xié)同驅(qū)動(dòng)企業(yè)數(shù)據(jù)飛輪也是必然的發(fā)展趨勢。AI+BI 需具備更好的開放集成能力,與企業(yè)辦公軟件或場景深度結(jié)合與集成,而不僅僅局限于獨(dú)立的數(shù)據(jù)工具。