Chatbot 不是“萬(wàn)金油”:企業(yè)級(jí)生成式 AI 如何真正創(chuàng)造價(jià)值
許多組織對(duì)生成式 AI 應(yīng)用常常抱有過(guò)高的期望。他們一開(kāi)始對(duì) ChatGPT 或 Microsoft Co-Pilot 這樣的技術(shù)感到興奮,閱讀了一些關(guān)于 AI 如何提升業(yè)務(wù)效率的文章后,便急于在各種場(chǎng)景中部署聊天機(jī)器人。但當(dāng)實(shí)際效果不如預(yù)期時(shí),他們往往會(huì)感到失望。這時(shí),我常聽(tīng)到一些借口,比如“模型不夠完善”或“我們需要提高員工的能力,寫(xiě)出更好的提示詞”。
然而,在大多數(shù)情況(90%)下,這些結(jié)論都是誤判,問(wèn)題在于我們過(guò)分局限于聊天機(jī)器人這個(gè)思維模式。我參與開(kāi)發(fā)了數(shù)十個(gè)生成式 AI 應(yīng)用,服務(wù)過(guò)三個(gè)人的小型團(tuán)隊(duì)和擁有三十多萬(wàn)人的大型跨國(guó)企業(yè),我看到這種模式無(wú)處不在。
市面上有許多公司告訴你,你需要“某種聊天機(jī)器人解決方案”,因?yàn)樗坪踹@已經(jīng)成了標(biāo)配。OpenAI 的 ChatGPT,Microsoft 的 Copilot,Google 的 Gemini 等項(xiàng)目都在努力簡(jiǎn)化聊天機(jī)器人的創(chuàng)建過(guò)程。但我要說(shuō)的是,能夠通過(guò)生成式 AI 解決的難題中,有 75% 并不適合用聊天機(jī)器人來(lái)解決。
我經(jīng)??吹浇?jīng)理、項(xiàng)目主管或其他決策者一開(kāi)始的想法是:“我們有了這個(gè)能構(gòu)建聊天機(jī)器人的 AI 產(chǎn)品,現(xiàn)在要盡可能多地找到應(yīng)用場(chǎng)景?!钡鶕?jù)我的經(jīng)驗(yàn),這種從已構(gòu)建的解決方案出發(fā),再尋找現(xiàn)有問(wèn)題的做法是錯(cuò)誤的。正確的做法應(yīng)該是先識(shí)別問(wèn)題,然后分析并尋找匹配的 AI 解決方案。聊天機(jī)器人確實(shí)適合某些場(chǎng)景,但將其作為萬(wàn)能鑰匙是不恰當(dāng)?shù)摹?/p>
圖片
將解決方案強(qiáng)加于問(wèn)題之上,與從問(wèn)題入手并找到解決方案截然相反。? Marcel Müller 2024
在本文中,我將基于眾多生成式 AI 應(yīng)用構(gòu)建的實(shí)戰(zhàn)經(jīng)驗(yàn),分享我從中獲得的見(jiàn)解和研發(fā)方法。這些應(yīng)用程序目前已上線運(yùn)行,服務(wù)于成千上萬(wàn)的用戶,它們深刻影響了我在構(gòu)建生成式 AI 解決方案時(shí)的思路 —— 不盲目跟風(fēng),也不因效果不佳而感到挫敗。
1.首先關(guān)注流程,其次才是聊天機(jī)器人(或其他界面)
我建議不要一開(kāi)始就圍繞聊天機(jī)器人進(jìn)行思考,那么正確的起點(diǎn)是什么呢?答案清晰明了:企業(yè)的業(yè)務(wù)流程。
企業(yè)內(nèi)發(fā)生的每一件事都是業(yè)務(wù)流程的一部分。業(yè)務(wù)流程是由各種活動(dòng)(即“作業(yè)單元”)、事件(例如,發(fā)生錯(cuò)誤)和節(jié)點(diǎn)(例如,做出決策)串聯(lián)而成的作業(yè)流[1]。有專(zhuān)門(mén)的工具用于繪制業(yè)務(wù)流程圖[2],并且圍繞業(yè)務(wù)流程的分析與優(yōu)化[3][4][5]已經(jīng)形成了一個(gè)完整的研究領(lǐng)域。業(yè)務(wù)流程管理之所以有效,是因?yàn)樗粌H是一種理論,而且已經(jīng)被廣泛應(yīng)用于企業(yè)的各個(gè)角落 —— 盡管許多企業(yè)可能并不知道這一概念的確切名稱。
舉個(gè)例子,假設(shè)您是一家為銀行提供房地產(chǎn)評(píng)估服務(wù)的公司。銀行在發(fā)放抵押貸款前,會(huì)要求房地產(chǎn)評(píng)估師對(duì)房產(chǎn)的價(jià)值進(jìn)行評(píng)估,這樣一旦抵押貸款無(wú)法償還,銀行就能知道房產(chǎn)的實(shí)際價(jià)值。
編寫(xiě)房地產(chǎn)評(píng)估報(bào)告是一項(xiàng)復(fù)雜的業(yè)務(wù)流程,我們可以將其細(xì)分為多個(gè)子流程。通常情況下,評(píng)估師需要親自開(kāi)車(chē)到房產(chǎn)所在地,進(jìn)行拍照,然后坐下來(lái)撰寫(xiě)一份長(zhǎng)達(dá) 20-30 頁(yè)的評(píng)估報(bào)告。但在此,我們不要急于求成,想著“啊,20-30 頁(yè)的報(bào)告,我如果使用 ChatGPT 可能會(huì)更快完成”。請(qǐng)記住:流程先行,解決方案隨后。
我們可以將該流程拆分為更具體的子流程,例如:前往房產(chǎn)所在地、拍照,然后撰寫(xiě)報(bào)告的不同部分,包括房屋的位置描述、各個(gè)房間的狀況和尺寸信息等。當(dāng)我們深入探究單一流程時(shí),會(huì)看到其中涉及的任務(wù)、決策節(jié)點(diǎn)和事件。例如,在撰寫(xiě)位置描述時(shí),評(píng)估師會(huì)在辦公桌前進(jìn)行一些研究,通過(guò) Google Maps 查看周邊商店,檢查城市交通圖,以便評(píng)估房屋的交通便利性和街道狀況。這些都是相關(guān)處理人員需要執(zhí)行的活動(dòng)。如果評(píng)估的是位于偏遠(yuǎn)地區(qū)的孤立農(nóng)場(chǎng),那么公共交通選項(xiàng)可能并不重要,因?yàn)檫@種房子的買(mǎi)家通常都會(huì)依賴私人汽車(chē)。在流程中選擇不同路徑的決策,我們稱之為“決策節(jié)點(diǎn)”。
如在 BPMN 2.0 中的示例過(guò)程所示。? Marcel Müller 2024
我們采用的這種以流程為核心的思想,是在考慮應(yīng)用 AI 之前,先對(duì)現(xiàn)有流程進(jìn)行評(píng)估。
2.流程編排而非聊天式互動(dòng)
在分析了我們的業(yè)務(wù)流程和目標(biāo)后,我們可以著手考慮融入 AI 的流程應(yīng)該是怎樣的。關(guān)鍵在于細(xì)化我們需要執(zhí)行的各個(gè)步驟。如果我們只專(zhuān)注于撰寫(xiě)房屋描述的子流程,它可能包括以下環(huán)節(jié):
- 分析房屋周邊的相關(guān)地點(diǎn)和商業(yè)設(shè)施
- 描述室內(nèi)裝修狀況
- 若非地處偏遠(yuǎn),則查找最近的公共交通站點(diǎn)
- 撰寫(xiě)一頁(yè)內(nèi)容的報(bào)告
確實(shí),我們可以通過(guò)與 AI “對(duì)話伙伴”以互動(dòng)的方式來(lái)完成這些任務(wù),直至完成任務(wù)得到所需輸出。但在企業(yè)環(huán)境中,這種方式存在以下三個(gè)主要問(wèn)題:
- 輸出的一致性:不同人給出的提示詞各不相同,導(dǎo)致輸出結(jié)果因提示詞編寫(xiě)者的技能和經(jīng)驗(yàn)水平而異。在企業(yè)環(huán)境中,我們希望輸出結(jié)果盡可能保持一致。
- 質(zhì)量參差不齊:你可能有過(guò)這樣的經(jīng)歷,在與 ChatGPT 互動(dòng)時(shí)需要多次調(diào)整提示詞,才能達(dá)到期望的質(zhì)量。有時(shí)甚至可能得到完全錯(cuò)誤的答案。在這個(gè)例子中,我們尚未找到一個(gè)能夠在不產(chǎn)生誤導(dǎo)信息的情況下,準(zhǔn)確描述周邊商業(yè)設(shè)施的大語(yǔ)言模型。
- 內(nèi)部知識(shí)與現(xiàn)有系統(tǒng)集成:每家公司都有內(nèi)部知識(shí),他們可能希望在與 AI “對(duì)話伙伴”互動(dòng)中使用這些知識(shí)。盡管可以通過(guò)聊天機(jī)器人實(shí)現(xiàn)檢索增強(qiáng)生成(RAG),但這并非是在所有情況下都能高效產(chǎn)生理想結(jié)果的通用方法。
這些問(wèn)題來(lái)自于聊天機(jī)器人背后的大語(yǔ)言模型的基本原理。
圖片
同聊天機(jī)器人進(jìn)行交互(左)與預(yù)定義流程的協(xié)調(diào)編排(右)。? Marcel Müller 2024
企業(yè)級(jí)應(yīng)用不應(yīng)單純依賴于“提問(wèn)-回答”的互動(dòng)模式,而應(yīng)設(shè)計(jì)為一套協(xié)調(diào)有序的流程步驟,這些步驟部分由 AI 驅(qū)動(dòng),每個(gè)步驟都旨在實(shí)現(xiàn)一個(gè)具體目標(biāo)。例如,用戶可以啟動(dòng)一個(gè)多步驟流程,該流程整合了各種模型和潛在的多模態(tài)輸入,以產(chǎn)出更有效的結(jié)果,并將這些步驟與小型數(shù)據(jù)檢索腳本相結(jié)合,后者在不依賴 AI 的情況下運(yùn)行。通過(guò)整合檢索增強(qiáng)生成技術(shù)(RAG)并盡量減少人工介入,可以構(gòu)建出更加強(qiáng)大和自動(dòng)化的工作流程。
相較于通過(guò)交互界面人工協(xié)調(diào),這種流程編排方式能大幅提升工作效率。此外,流程中的每一步并不都需要完全依賴 AI 模型完成。在上述例子中,我們發(fā)現(xiàn)使用 Google Maps API 來(lái)獲取附近的公交站點(diǎn)和交通站點(diǎn)的信息,在質(zhì)量上遠(yuǎn)勝于詢問(wèn)即便是像 GPT-4o 這樣出色的語(yǔ)言模型,甚至超過(guò)了使用 Perplexity 這樣的網(wǎng)絡(luò)搜索增強(qiáng)生成引擎。
3.通過(guò)流程編排提升效率
想象一下,在沒(méi)有 AI 參與的情況下,我們是如何工作的。手動(dòng)完成任務(wù)不僅耗時(shí),而且效率低下。假設(shè)一個(gè)任務(wù)手動(dòng)完成需要一個(gè)小時(shí),若重復(fù)四次,總耗時(shí)就是四個(gè)小時(shí)。而采用基于生成式 AI 的聊天機(jī)器人解決方案,理論上可以節(jié)省一半的時(shí)間。但是,我們真的只能做到這一步嗎?剩下的時(shí)間其實(shí)被用于構(gòu)思提示詞、等待回復(fù)以及通過(guò)不斷的修正來(lái)保證輸出的質(zhì)量。
如在 BPMN 2.0 中的示例過(guò)程所示。? Marcel Müller 2024
在處理重復(fù)性任務(wù)時(shí),雖然時(shí)間有所節(jié)省,但在那些多個(gè)員工需要執(zhí)行相同流程的企業(yè)中,保持一致性所需的提示詞編寫(xiě)、等待和輸出調(diào)整卻成了一個(gè)棘手的問(wèn)題。此時(shí),流程模板的作用就顯得尤為重要了。
通過(guò)流程模板,我們將流程標(biāo)準(zhǔn)化和參數(shù)化,使其可以多次復(fù)用。高質(zhì)量的流程模板只需創(chuàng)建一次,卻能大幅提升單個(gè)案例處理的效率。這樣一來(lái),用于創(chuàng)建提示詞、保障質(zhì)量和調(diào)整輸出所花費(fèi)的時(shí)間就大幅減少了。這正是基于聊天機(jī)器人的解決方案與依托模板的 AI 流程編排之間的本質(zhì)區(qū)別,而這個(gè)區(qū)別對(duì)保證質(zhì)量和提高可復(fù)現(xiàn)性具有深遠(yuǎn)的影響。
流程模板的實(shí)際效益。? Marcel Müller 2024
此外,我們現(xiàn)在有了一個(gè)明確的測(cè)試領(lǐng)域,可以用來(lái)驗(yàn)證我們的解決方案。在用戶可以自由輸入的聊天機(jī)器人中,想要以可量化的方式測(cè)試并建立信心是頗具挑戰(zhàn)的。我們?cè)绞敲鞔_限定用戶可輸入的參數(shù)和文件范圍,就越能夠精確地驗(yàn)證解決方案的有效性。
在 AI 輔助的流程中使用模板,其實(shí)是對(duì)傳統(tǒng)流程管理中業(yè)務(wù)流程引擎原理的借鑒。每當(dāng)出現(xiàn)新情況時(shí),這些引擎便會(huì)從模板庫(kù)中挑選合適的模板進(jìn)行流程編排。在這個(gè)過(guò)程中,相應(yīng)的輸入?yún)?shù)就會(huì)被填進(jìn)去。
以房地產(chǎn)評(píng)估流程為例,所使用的模板包含了三個(gè)輸入項(xiàng):房產(chǎn)類(lèi)型(如獨(dú)立住宅),室內(nèi)照片集,以及房產(chǎn)地址。
流程模板的結(jié)構(gòu)如下:
- 首先,利用 Google Places API 和提供的地址信息來(lái)搜尋周邊的商店。
- 接著,通過(guò) OpenAI 的視覺(jué) API 來(lái)對(duì)室內(nèi)環(huán)境進(jìn)行描述。
- 然后,再次使用 Google Places API 來(lái)查找附近的交通設(shè)施。
- 將第 1 步和第 3 步輸出的 JSON 數(shù)據(jù)以及交通設(shè)施的描述,配合 GPT-4o 生成一個(gè)文本頁(yè)面,內(nèi)容結(jié)構(gòu)為:先介紹房產(chǎn)、周邊商店和交通情況,隨后是室內(nèi)環(huán)境描述,最后給出一個(gè)包含評(píng)分的綜合結(jié)論。
在我們的實(shí)際應(yīng)用案例中,我們是通過(guò) entAIngine 平臺(tái)內(nèi)置的無(wú)代碼構(gòu)建器來(lái)開(kāi)發(fā)這個(gè)應(yīng)用的。
在這個(gè)流程中,只有四分之一的工作步驟需要借助大語(yǔ)言模型。這其實(shí)是一個(gè)優(yōu)點(diǎn)!因?yàn)?Google Maps API 不會(huì)憑空捏造信息。雖然它可能提供一些過(guò)時(shí)的數(shù)據(jù),但它絕不會(huì)“虛構(gòu)看似真實(shí)的場(chǎng)景?!贝送?,由于我們現(xiàn)在有了可分析的真實(shí)信息源,因此人類(lèi)可以在流程中進(jìn)行有效的審核。
在傳統(tǒng)的流程管理中,模板能夠降低流程的可變性,確保流程的可復(fù)制性,并提升效率和質(zhì)量(這一點(diǎn)在 Six Sigma(譯者注:六西格瑪(6σ)概念于 1986 年由摩托羅拉公司的比爾·史密斯提出,此概念屬于品質(zhì)管理范疇,西格瑪(Σ,σ)是希臘字母,這是統(tǒng)計(jì)學(xué)里的一個(gè)單位,表示與平均值的標(biāo)準(zhǔn)偏差。旨在生產(chǎn)過(guò)程中降低產(chǎn)品及流程的缺陷次數(shù),防止產(chǎn)品變異,提升品質(zhì)。) 等方法論中得到了驗(yàn)證)。我們需要采用同樣的思維方式來(lái)處理這個(gè)問(wèn)題。
4.生成式 AI 應(yīng)用的用戶交互界面
現(xiàn)在,我們已經(jīng)啟動(dòng)了一個(gè)利用大語(yǔ)言模型(LLM)的流程,它解決了很多令人頭疼的問(wèn)題。但用戶如何與之交互呢?
要實(shí)現(xiàn)這樣一個(gè)流程,可以手動(dòng)編寫(xiě)所有代碼,或者利用 entAIngine [6]這類(lèi)無(wú)需編程的 AI 流程引擎來(lái)完成。
在利用流程模板構(gòu)建業(yè)務(wù)流程時(shí),交互可以以各種方式發(fā)生。根據(jù)我過(guò)去兩年的經(jīng)驗(yàn),對(duì)于絕大多數(shù)(90%)生成式 AI 的應(yīng)用場(chǎng)景,基本上是以下幾種界面:
- 知識(shí)檢索界面:功能類(lèi)似于搜索引擎,可以引用和參考來(lái)源。
- 文檔編輯界面:將文本處理能力與模板、模型和流程編排相結(jié)合。
- 聊天界面:適用于進(jìn)行迭代式、交互式的交流。
- 無(wú)需獨(dú)立界面的嵌入式流程編排(RPA):通過(guò) API 接口,與現(xiàn)有界面集成。
歸根結(jié)底,最關(guān)鍵的問(wèn)題是哪種互動(dòng)方式最為高效。確實(shí),對(duì)于一些需要?jiǎng)?chuàng)意或處理非重復(fù)性任務(wù)的場(chǎng)景,聊天界面可能是最佳選擇。但往往并非如此。通常情況下,用戶的核心需求是創(chuàng)建文檔,此時(shí),文檔編輯界面中預(yù)置的模板就能提供極為高效的互動(dòng)體驗(yàn)。有時(shí)候,如果我們想在現(xiàn)有應(yīng)用中嵌入 AI 功能,就沒(méi)有必要再單獨(dú)開(kāi)發(fā)一個(gè)界面。這里的難點(diǎn)在于如何在現(xiàn)有應(yīng)用程序中正確執(zhí)行流程、獲取所需輸入數(shù)據(jù),并在界面的適當(dāng)位置展示輸出結(jié)果。
上述提到的界面,構(gòu)成了我至今遇到的大多數(shù)生成式 AI 應(yīng)用場(chǎng)景的基礎(chǔ),并且同時(shí)還能實(shí)現(xiàn)與企業(yè)環(huán)境的可擴(kuò)展集成。
5.The Bottom Line
企業(yè)需要轉(zhuǎn)變思維,不再只是考慮“如何在各個(gè)場(chǎng)景中使用 AI 聊天機(jī)器人?”,而是思考“哪些業(yè)務(wù)流程包含哪些具體步驟,以及在這些步驟中如何有效地利用生成式 AI?”,這樣的轉(zhuǎn)變?yōu)槠髽I(yè)帶來(lái)了實(shí)現(xiàn) AI 真正價(jià)值的基礎(chǔ)。將 AI 技術(shù)與現(xiàn)有系統(tǒng)融合,并根據(jù)實(shí)際需求選擇合適的用戶界面。采用這種方式,企業(yè)能夠?qū)崿F(xiàn)的效率提升,是那些僅局限于聊天機(jī)器人思維的企業(yè)所無(wú)法想象的。
References
[1] Dumas et al., “Fundamentals of Business Process Management”, 2018
[2] Object Management Group. “Business Process Model and Notation (BPMN) Version 2.0.2.” OMG Specification, Jan. 2014
[3] van der Aalst, “Process Mining: Data Science in Action”, 2016
[4] Luthra, Sunil, et al. “Total Quality Management (TQM): Principles, Methods, and Applications.” 1st ed., CRC Press, 2020.
[5] Panagacos, “The Ultimate Guide to Business Process Management”, 2012
[6] www.entaingine.com
Thanks for reading!
Hope you have enjoyed and learned new things from this blog!
About the authors
Dr. Marcel Müller
Entrepreneur into Process Innovation with Deep Tech. AI. Founder of entAIngine