Chatbot 不是“萬金油”:企業(yè)級生成式 AI 如何真正創(chuàng)造價值 原創(chuàng) 精華
編者按: 企業(yè)在引入生成式 AI 時,是否陷入了盲目追隨聊天機(jī)器人的誤區(qū),如何真正發(fā)揮 AI 的價值潛力?
本文作者提出了一個觀點:企業(yè)應(yīng)該首先關(guān)注業(yè)務(wù)流程,而非簡單地將 AI 聊天機(jī)器人作為萬能解決方案。
作者認(rèn)為企業(yè)需要深入分析現(xiàn)有業(yè)務(wù)流程,識別可以應(yīng)用 AI 的具體環(huán)節(jié),而不是為了使用 AI 而找尋應(yīng)用場景。同時作者基于十余個生成式 AI 應(yīng)用的實戰(zhàn)經(jīng)驗,詳細(xì)闡述了如何通過"流程編排"而非"對話交互",系統(tǒng)性地重塑企業(yè) AI 應(yīng)用。最后,作者指出生成式 AI 應(yīng)用不局限于聊天界面,還可以是知識檢索、文檔編輯、嵌入式流程等多種形式,關(guān)鍵是選擇最高效的交互方式。
作者 | Dr. Marcel Müller
編譯 | 岳揚
Background licensed from ??elements.envato.com??, edit by Marcel Müller 2024
許多組織對生成式 AI 應(yīng)用常常抱有過高的期望。他們一開始對 ChatGPT 或 Microsoft Co-Pilot 這樣的技術(shù)感到興奮,閱讀了一些關(guān)于 AI 如何提升業(yè)務(wù)效率的文章后,便急于在各種場景中部署聊天機(jī)器人。但當(dāng)實際效果不如預(yù)期時,他們往往會感到失望。這時,我常聽到一些借口,比如“模型不夠完善”或“我們需要提高員工的能力,寫出更好的提示詞”。
然而,在大多數(shù)情況(90%)下,這些結(jié)論都是誤判,問題在于我們過分局限于聊天機(jī)器人這個思維模式。 我參與開發(fā)了數(shù)十個生成式 AI 應(yīng)用,服務(wù)過三個人的小型團(tuán)隊和擁有三十多萬人的大型跨國企業(yè),我看到這種模式無處不在。
市面上有許多公司告訴你,你需要“某種聊天機(jī)器人解決方案”,因為似乎這已經(jīng)成了標(biāo)配。OpenAI 的 ChatGPT,Microsoft 的 Copilot,Google 的 Gemini 等項目都在努力簡化聊天機(jī)器人的創(chuàng)建過程。但我要說的是,能夠通過生成式 AI 解決的難題中,有 75% 并不適合用聊天機(jī)器人來解決。
我經(jīng)??吹浇?jīng)理、項目主管或其他決策者一開始的想法是:“我們有了這個能構(gòu)建聊天機(jī)器人的 AI 產(chǎn)品,現(xiàn)在要盡可能多地找到應(yīng)用場景?!?strong>但根據(jù)我的經(jīng)驗,這種從已構(gòu)建的解決方案出發(fā),再尋找現(xiàn)有問題的做法是錯誤的。正確的做法應(yīng)該是先識別問題,然后分析并尋找匹配的 AI 解決方案。聊天機(jī)器人確實適合某些場景,但將其作為萬能鑰匙是不恰當(dāng)?shù)摹?/strong>
將解決方案強(qiáng)加于問題之上,與從問題入手并找到解決方案截然相反。? Marcel Müller 2024
在本文中,我將基于眾多生成式 AI 應(yīng)用構(gòu)建的實戰(zhàn)經(jīng)驗,分享我從中獲得的見解和研發(fā)方法。這些應(yīng)用程序目前已上線運行,服務(wù)于成千上萬的用戶,它們深刻影響了我在構(gòu)建生成式 AI 解決方案時的思路 —— 不盲目跟風(fēng),也不因效果不佳而感到挫敗。
01 首先關(guān)注流程,其次才是聊天機(jī)器人(或其他界面)
我建議不要一開始就圍繞聊天機(jī)器人進(jìn)行思考,那么正確的起點是什么呢?答案清晰明了:企業(yè)的業(yè)務(wù)流程。
企業(yè)內(nèi)發(fā)生的每一件事都是業(yè)務(wù)流程的一部分。業(yè)務(wù)流程是由各種活動(即“作業(yè)單元”)、事件(例如,發(fā)生錯誤)和節(jié)點(例如,做出決策)串聯(lián)而成的作業(yè)流[1]。有專門的工具用于繪制業(yè)務(wù)流程圖[2],并且圍繞業(yè)務(wù)流程的分析與優(yōu)化[3][4][5]已經(jīng)形成了一個完整的研究領(lǐng)域。業(yè)務(wù)流程管理之所以有效,是因為它不僅是一種理論,而且已經(jīng)被廣泛應(yīng)用于企業(yè)的各個角落 —— 盡管許多企業(yè)可能并不知道這一概念的確切名稱。
舉個例子,假設(shè)您是一家為銀行提供房地產(chǎn)評估服務(wù)的公司。銀行在發(fā)放抵押貸款前,會要求房地產(chǎn)評估師對房產(chǎn)的價值進(jìn)行評估,這樣一旦抵押貸款無法償還,銀行就能知道房產(chǎn)的實際價值。
編寫房地產(chǎn)評估報告是一項復(fù)雜的業(yè)務(wù)流程,我們可以將其細(xì)分為多個子流程。通常情況下,評估師需要親自開車到房產(chǎn)所在地,進(jìn)行拍照,然后坐下來撰寫一份長達(dá) 20-30 頁的評估報告。但在此,我們不要急于求成,想著“啊,20-30 頁的報告,我如果使用 ChatGPT 可能會更快完成”。請記?。?strong>流程先行,解決方案隨后。
我們可以將該流程拆分為更具體的子流程,例如:前往房產(chǎn)所在地、拍照,然后撰寫報告的不同部分,包括房屋的位置描述、各個房間的狀況和尺寸信息等。當(dāng)我們深入探究單一流程時,會看到其中涉及的任務(wù)、決策節(jié)點和事件。例如,在撰寫位置描述時,評估師會在辦公桌前進(jìn)行一些研究,通過 Google Maps 查看周邊商店,檢查城市交通圖,以便評估房屋的交通便利性和街道狀況。這些都是相關(guān)處理人員需要執(zhí)行的活動。如果評估的是位于偏遠(yuǎn)地區(qū)的孤立農(nóng)場,那么公共交通選項可能并不重要,因為這種房子的買家通常都會依賴私人汽車。在流程中選擇不同路徑的決策,我們稱之為“決策節(jié)點”。
如在 BPMN 2.0 中的示例過程所示。? Marcel Müller 2024
我們采用的這種以流程為核心的思想,是在考慮應(yīng)用 AI 之前,先對現(xiàn)有流程進(jìn)行評估。
02 流程編排而非聊天式互動
在分析了我們的業(yè)務(wù)流程和目標(biāo)后,我們可以著手考慮融入 AI 的流程應(yīng)該是怎樣的。關(guān)鍵在于細(xì)化我們需要執(zhí)行的各個步驟。如果我們只專注于撰寫房屋描述的子流程,它可能包括以下環(huán)節(jié):
- 分析房屋周邊的相關(guān)地點和商業(yè)設(shè)施
- 描述室內(nèi)裝修狀況
- 若非地處偏遠(yuǎn),則查找最近的公共交通站點
- 撰寫一頁內(nèi)容的報告
確實,我們可以通過與 AI “對話伙伴”以互動的方式來完成這些任務(wù),直至完成任務(wù)得到所需輸出。但在企業(yè)環(huán)境中,這種方式存在以下三個主要問題:
- 輸出的一致性:不同人給出的提示詞各不相同,導(dǎo)致輸出結(jié)果因提示詞編寫者的技能和經(jīng)驗水平而異。在企業(yè)環(huán)境中,我們希望輸出結(jié)果盡可能保持一致。
- 質(zhì)量參差不齊:你可能有過這樣的經(jīng)歷,在與 ChatGPT 互動時需要多次調(diào)整提示詞,才能達(dá)到期望的質(zhì)量。有時甚至可能得到完全錯誤的答案。在這個例子中,我們尚未找到一個能夠在不產(chǎn)生誤導(dǎo)信息的情況下,準(zhǔn)確描述周邊商業(yè)設(shè)施的大語言模型。
- 內(nèi)部知識與現(xiàn)有系統(tǒng)集成:每家公司都有內(nèi)部知識,他們可能希望在與 AI “對話伙伴”互動中使用這些知識。盡管可以通過聊天機(jī)器人實現(xiàn)檢索增強(qiáng)生成(RAG),但這并非是在所有情況下都能高效產(chǎn)生理想結(jié)果的通用方法。
這些問題來自于聊天機(jī)器人背后的大語言模型的基本原理。
同聊天機(jī)器人進(jìn)行交互(左)與預(yù)定義流程的協(xié)調(diào)編排(右)。? Marcel Müller 2024
企業(yè)級應(yīng)用不應(yīng)單純依賴于“提問-回答”的互動模式,而應(yīng)設(shè)計為一套協(xié)調(diào)有序的流程步驟,這些步驟部分由 AI 驅(qū)動,每個步驟都旨在實現(xiàn)一個具體目標(biāo)。 例如,用戶可以啟動一個多步驟流程,該流程整合了各種模型和潛在的多模態(tài)輸入,以產(chǎn)出更有效的結(jié)果,并將這些步驟與小型數(shù)據(jù)檢索腳本相結(jié)合,后者在不依賴 AI 的情況下運行。通過整合檢索增強(qiáng)生成技術(shù)(RAG)并盡量減少人工介入,可以構(gòu)建出更加強(qiáng)大和自動化的工作流程。
相較于通過交互界面人工協(xié)調(diào),這種流程編排方式能大幅提升工作效率。此外,流程中的每一步并不都需要完全依賴 AI 模型完成。在上述例子中,我們發(fā)現(xiàn)使用 Google Maps API 來獲取附近的公交站點和交通站點的信息,在質(zhì)量上遠(yuǎn)勝于詢問即便是像 GPT-4o 這樣出色的語言模型,甚至超過了使用 Perplexity 這樣的網(wǎng)絡(luò)搜索增強(qiáng)生成引擎。
03 通過流程編排提升效率
想象一下,在沒有 AI 參與的情況下,我們是如何工作的。手動完成任務(wù)不僅耗時,而且效率低下。假設(shè)一個任務(wù)手動完成需要一個小時,若重復(fù)四次,總耗時就是四個小時。而采用基于生成式 AI 的聊天機(jī)器人解決方案,理論上可以節(jié)省一半的時間。但是,我們真的只能做到這一步嗎?剩下的時間其實被用于構(gòu)思提示詞、等待回復(fù)以及通過不斷的修正來保證輸出的質(zhì)量。
手動操作與基于聊天機(jī)器人的自動化可節(jié)省的時間對比。? Marcel Müller 2024
在處理重復(fù)性任務(wù)時,雖然時間有所節(jié)省,但在那些多個員工需要執(zhí)行相同流程的企業(yè)中,保持一致性所需的提示詞編寫、等待和輸出調(diào)整卻成了一個棘手的問題。此時,流程模板的作用就顯得尤為重要了。
通過流程模板,我們將流程標(biāo)準(zhǔn)化和參數(shù)化,使其可以多次復(fù)用。高質(zhì)量的流程模板只需創(chuàng)建一次,卻能大幅提升單個案例處理的效率。這樣一來,用于創(chuàng)建提示詞、保障質(zhì)量和調(diào)整輸出所花費的時間就大幅減少了。這正是基于聊天機(jī)器人的解決方案與依托模板的 AI 流程編排之間的本質(zhì)區(qū)別,而這個區(qū)別對保證質(zhì)量和提高可復(fù)現(xiàn)性具有深遠(yuǎn)的影響。
流程模板的實際效益。? Marcel Müller 2024
此外,我們現(xiàn)在有了一個明確的測試領(lǐng)域,可以用來驗證我們的解決方案。在用戶可以自由輸入的聊天機(jī)器人中,想要以可量化的方式測試并建立信心是頗具挑戰(zhàn)的。我們越是明確限定用戶可輸入的參數(shù)和文件范圍,就越能夠精確地驗證解決方案的有效性。
在 AI 輔助的流程中使用模板,其實是對傳統(tǒng)流程管理中業(yè)務(wù)流程引擎原理的借鑒。每當(dāng)出現(xiàn)新情況時,這些引擎便會從模板庫中挑選合適的模板進(jìn)行流程編排。在這個過程中,相應(yīng)的輸入?yún)?shù)就會被填進(jìn)去。
以房地產(chǎn)評估流程為例,所使用的模板包含了三個輸入項:房產(chǎn)類型(如獨立住宅),室內(nèi)照片集,以及房產(chǎn)地址。
流程模板的結(jié)構(gòu)如下:
- 首先,利用 Google Places API 和提供的地址信息來搜尋周邊的商店。
- 接著,通過 OpenAI 的視覺 API 來對室內(nèi)環(huán)境進(jìn)行描述。
- 然后,再次使用 Google Places API 來查找附近的交通設(shè)施。
- 將第 1 步和第 3 步輸出的 JSON 數(shù)據(jù)以及交通設(shè)施的描述,配合 GPT-4o 生成一個文本頁面,內(nèi)容結(jié)構(gòu)為:先介紹房產(chǎn)、周邊商店和交通情況,隨后是室內(nèi)環(huán)境描述,最后給出一個包含評分的綜合結(jié)論。
在我們的實際應(yīng)用案例中,我們是通過 entAIngine 平臺內(nèi)置的無代碼構(gòu)建器來開發(fā)這個應(yīng)用的。
在這個流程中,只有四分之一的工作步驟需要借助大語言模型。這其實是一個優(yōu)點!因為 Google Maps API 不會憑空捏造信息。雖然它可能提供一些過時的數(shù)據(jù),但它絕不會“虛構(gòu)看似真實的場景?!贝送猓捎谖覀儸F(xiàn)在有了可分析的真實信息源,因此人類可以在流程中進(jìn)行有效的審核。
在傳統(tǒng)的流程管理中,模板能夠降低流程的可變性,確保流程的可復(fù)制性,并提升效率和質(zhì)量(這一點在 Six Sigma(譯者注:六西格瑪(6σ)概念于 1986 年由摩托羅拉公司的比爾·史密斯提出,此概念屬于品質(zhì)管理范疇,西格瑪(Σ,σ)是希臘字母,這是統(tǒng)計學(xué)里的一個單位,表示與平均值的標(biāo)準(zhǔn)偏差。旨在生產(chǎn)過程中降低產(chǎn)品及流程的缺陷次數(shù),防止產(chǎn)品變異,提升品質(zhì)。) 等方法論中得到了驗證)。我們需要采用同樣的思維方式來處理這個問題。
04 生成式 AI 應(yīng)用的用戶交互界面
現(xiàn)在,我們已經(jīng)啟動了一個利用大語言模型(LLM)的流程,它解決了很多令人頭疼的問題。但用戶如何與之交互呢?
要實現(xiàn)這樣一個流程,可以手動編寫所有代碼,或者利用 entAIngine [6]這類無需編程的 AI 流程引擎來完成。
在利用流程模板構(gòu)建業(yè)務(wù)流程時,交互可以以各種方式發(fā)生。根據(jù)我過去兩年的經(jīng)驗,對于絕大多數(shù)(90%)生成式 AI 的應(yīng)用場景,基本上是以下幾種界面:
- 知識檢索界面:功能類似于搜索引擎,可以引用和參考來源。
- 文檔編輯界面:將文本處理能力與模板、模型和流程編排相結(jié)合。
- 聊天界面:適用于進(jìn)行迭代式、交互式的交流。
- 無需獨立界面的嵌入式流程編排(RPA):通過 API 接口,與現(xiàn)有界面集成。
歸根結(jié)底,最關(guān)鍵的問題是哪種互動方式最為高效。確實,對于一些需要創(chuàng)意或處理非重復(fù)性任務(wù)的場景,聊天界面可能是最佳選擇。但往往并非如此。通常情況下,用戶的核心需求是創(chuàng)建文檔,此時,文檔編輯界面中預(yù)置的模板就能提供極為高效的互動體驗。有時候,如果我們想在現(xiàn)有應(yīng)用中嵌入 AI 功能,就沒有必要再單獨開發(fā)一個界面。這里的難點在于如何在現(xiàn)有應(yīng)用程序中正確執(zhí)行流程、獲取所需輸入數(shù)據(jù),并在界面的適當(dāng)位置展示輸出結(jié)果。
上述提到的界面,構(gòu)成了我至今遇到的大多數(shù)生成式 AI 應(yīng)用場景的基礎(chǔ),并且同時還能實現(xiàn)與企業(yè)環(huán)境的可擴(kuò)展集成。
05 The Bottom Line
企業(yè)需要轉(zhuǎn)變思維,不再只是考慮“如何在各個場景中使用 AI 聊天機(jī)器人?”,而是思考“哪些業(yè)務(wù)流程包含哪些具體步驟,以及在這些步驟中如何有效地利用生成式 AI?”,這樣的轉(zhuǎn)變?yōu)槠髽I(yè)帶來了實現(xiàn) AI 真正價值的基礎(chǔ)。 將 AI 技術(shù)與現(xiàn)有系統(tǒng)融合,并根據(jù)實際需求選擇合適的用戶界面。采用這種方式,企業(yè)能夠?qū)崿F(xiàn)的效率提升,是那些僅局限于聊天機(jī)器人思維的企業(yè)所無法想象的。
References
[1] Dumas et al., “Fundamentals of Business Process Management”, 2018
[2] Object Management Group. “Business Process Model and Notation (BPMN) Version 2.0.2.” OMG Specification, Jan. 2014
[3] van der Aalst, “Process Mining: Data Science in Action”, 2016
[4] Luthra, Sunil, et al. “Total Quality Management (TQM): Principles, Methods, and Applications.” 1st ed., CRC Press, 2020.
[5] Panagacos, “The Ultimate Guide to Business Process Management”, 2012
[6] ??www.entaingine.com??
Thanks for reading!
Hope you have enjoyed and learned new things from this blog!
About the authors
Dr. Marcel Müller
Entrepreneur into Process Innovation with Deep Tech. AI. Founder of entAIngine
END
本期互動內(nèi)容 ??
?您在實施生成式 AI 項目遇到過哪些落地難點?是否也陷入本文指出的'Chatbot 誤區(qū)'?
原文鏈接:
