深入解讀大模型應(yīng)用中臺:探索AI實(shí)戰(zhàn)應(yīng)用!
寫過很多篇關(guān)于大數(shù)據(jù)的文章,它的核心理念:避免數(shù)據(jù)的重復(fù)計(jì)算,通過數(shù)據(jù)服務(wù)化,提高數(shù)據(jù)的共享能力,賦能數(shù)據(jù)應(yīng)用。有小伙伴就問,既然數(shù)據(jù)中臺作為底座基礎(chǔ)能力,加工價值數(shù)據(jù)賦能應(yīng)用,那么現(xiàn)在最為火爆的AI大模型可以作為底座能力賦能應(yīng)用嗎?
我認(rèn)為AI大模型完全可以作為基礎(chǔ)能力賦能應(yīng)用。因?yàn)閺哪撤N角度來看,AI大模型本身就具備了一種智能化的數(shù)據(jù)處理和分析的能力。它們通過學(xué)習(xí)大量的訓(xùn)練數(shù)據(jù),能夠自行優(yōu)化參數(shù),提升預(yù)測精度,這種自學(xué)習(xí)機(jī)制與數(shù)據(jù)中臺追求的降本增效有著異曲同工之妙。
一、大模型應(yīng)用中臺
大模型應(yīng)用中臺是企業(yè)公司在數(shù)字化轉(zhuǎn)型和智能化升級過程中,為了高效管理和運(yùn)用大模型技術(shù)而構(gòu)建的一套平臺體系。它的核心作用是將大模型的能力與公司的業(yè)務(wù)流程深度融合,提升業(yè)務(wù)效率和服務(wù)質(zhì)量。
圖片
- 大模型集成:
整合不同底層大模型接口,實(shí)現(xiàn)快速接入。
- 數(shù)據(jù)安全匹配:
根據(jù)業(yè)務(wù)場景匹配數(shù)據(jù)安全要求,選擇使用外部模型或私有化模型。
- 智能知識庫分析:
結(jié)合向量數(shù)據(jù)庫,支持多種知識錄入方式,提高答案的召回率和準(zhǔn)確性。
- 任務(wù)可視化編排:
通過圖形化界面實(shí)現(xiàn)復(fù)雜工作流,擴(kuò)展AI智能體的能力。
- 多渠道接入:
支持對話窗口、API等方式,快速集成企業(yè)微信、釘釘?shù)葮I(yè)務(wù)系統(tǒng)。
- 數(shù)據(jù)建設(shè):
補(bǔ)充GPU算力資源,私有化部署開源模型,整合內(nèi)部數(shù)據(jù)和文檔。
【詳細(xì)解說】
它通過整合不同底層大模型的接口差異,實(shí)現(xiàn)各種內(nèi)外部大模型的快速接入。這個平臺能夠靈活地匹配業(yè)務(wù)場景的數(shù)據(jù)安全要求,例如,對于需要分析的研報和資訊,可以對接外部模型,而對于處理內(nèi)部敏感數(shù)據(jù),則可以基于私有化開源模型和專屬向量知識庫進(jìn)行大模型技術(shù)的安全應(yīng)用。
該中臺具備智能知識庫分析能力,通過結(jié)合向量數(shù)據(jù)庫,支持文本向量分段、大模型問答拆分、精準(zhǔn)導(dǎo)入等多種知識錄入方式,并通過“向量+全文+重排”的方式提高答案的召回率和準(zhǔn)確性,適應(yīng)問答、閱讀、生成等不同場景的需求。
此外,大模型應(yīng)用中臺還提供任務(wù)可視化編排功能,允許通過圖形化界面輕松實(shí)現(xiàn)包含知識庫搜索、AI對話、關(guān)鍵詞提取、問題分類、API調(diào)用等模塊的復(fù)雜工作流,從而擴(kuò)展構(gòu)建AI智能體的能力。
為了實(shí)現(xiàn)多渠道快速接入,平臺支持通過對話窗口、API等方式與企業(yè)微信、釘釘以及各業(yè)務(wù)系統(tǒng)快速集成,提供圖片、文檔、音視頻、鏈接等多種形式的信息反饋,為用戶提供全面的知識解答。
在數(shù)據(jù)建設(shè)方面,大模型應(yīng)用中臺積極補(bǔ)充GPU算力資源,完成千億級參數(shù)開源模型的私有化部署,為公司安全開展和使用大模型技術(shù)提供基礎(chǔ)保障。同時,平臺也在不斷加強(qiáng)企業(yè)內(nèi)部多系統(tǒng)間的流程和數(shù)據(jù)互通,對內(nèi)部數(shù)據(jù)和文檔進(jìn)行整合與治理,例如對問答知識的清洗、預(yù)處理和向量化工作,讓大模型理解并使用企業(yè)的工具和數(shù)據(jù),與業(yè)務(wù)流程深度融合。
二、大模型應(yīng)用中臺架構(gòu)
大模型應(yīng)用中臺可以采用不同類型的架構(gòu)風(fēng)格,在此使用5大架構(gòu)風(fēng)格里的調(diào)用/返回風(fēng)格里的層次結(jié)構(gòu)。
各個功能組成一個層次結(jié)構(gòu),每層為上一層提供服務(wù),使用下一層的服務(wù),每一層只能見到與自己鄰接的層。修改某一層,最多影響其相鄰的兩層(通常只能影響上層)。優(yōu)點(diǎn)是可以將一個復(fù)雜問題分解成一個增量步驟序列的實(shí)現(xiàn)。缺點(diǎn)是并不是每個系統(tǒng)都可以很容易的劃分為分層的模式,并且因?yàn)檫M(jìn)行層次調(diào)用,會影響效率。
大模型應(yīng)用中臺的架構(gòu):
圖片
(1)統(tǒng)一大模型接入
可以屏蔽不同底層大模型接口差異,實(shí)現(xiàn)各種內(nèi)外部大模型的快速 接入,與市場上最新技術(shù)保持一致;同時通過靈活的模型切換,可以快速匹配業(yè)務(wù)場景的數(shù)據(jù)安全要求,例如針對一些研報和資訊的分析,可以對接外部模型,而針對內(nèi)部敏感數(shù)據(jù),則可以基于私有化開源模型和專屬向量知識庫進(jìn)行大模型技術(shù)的安全應(yīng)用。
(2)智能知識庫分析
大模型結(jié)合向量數(shù)據(jù)庫的方式為讓其具備領(lǐng)域級知識理解能力提供了可能性,平臺通過靈活的知識庫分析框架,支持文本向量分段、大模型QA拆分、QA精準(zhǔn)導(dǎo)入等多種知識錄入方式;同時通過“向量+全文+重排”的方式進(jìn)一步提高了答案的召回率和準(zhǔn)確性,適應(yīng)問答、閱讀、生成等不同場景。
(3)任務(wù)可視化編排
目前的企業(yè)業(yè)務(wù)需求千差萬別,想讓大模型完全自主地規(guī)劃與完成 任務(wù)是不太現(xiàn)實(shí)的,而通過工作流編排則可以更好地保證大模型執(zhí)行的可控性;同時通過圖形化界面可以輕松實(shí)現(xiàn)包含知識庫搜索、AI對話、關(guān)鍵詞提取、問題分類、API調(diào)用等模塊的復(fù)雜工作流,無限擴(kuò)展構(gòu)建AI智能體。
(4)多渠道快速接入
平臺支持通過對話窗口、API等方式與企業(yè)微信、釘釘以及各業(yè)務(wù)系 統(tǒng)快速集成,方便隨時隨地使用;同時支持提供圖片、文檔、音視頻、鏈接等多種形式的信息反饋,為用戶提供全面的知識解答。
(5)大模型數(shù)據(jù)建設(shè)
公司積極補(bǔ)充GPU算力資源,完成千億級參數(shù)開源模型私有化部署,為公司安全開展和使用大模型技術(shù)提供了基礎(chǔ)保障。同時,大模型與原有系統(tǒng)和傳統(tǒng)AI技術(shù)之間應(yīng)該是強(qiáng)強(qiáng)聯(lián)合,大模型作為解決問題的中樞大腦,可以靈活組合不同工具來完成業(yè)務(wù)目標(biāo)。公司在推進(jìn)大模型落地的同時,也在不斷加強(qiáng)企業(yè)內(nèi)部多系統(tǒng)間的流程和數(shù)據(jù)互通,對內(nèi)部數(shù)據(jù)和文檔進(jìn)行整合與治理,例如對問答知識的清洗、預(yù)處理和向量化工作,進(jìn)一步讓大模型理解并使用企業(yè)的工具和數(shù)據(jù),與業(yè)務(wù)流程深度融合。
三、大模型應(yīng)用中臺案例
- 投資GPT平臺
基于大模型應(yīng)用中臺相關(guān)成果,推出多款辦公助手如多模型體驗(yàn)官、客戶全景洞察、文檔智能問答等,現(xiàn)已在PC和企業(yè)微信上全面開放,員工可隨時隨地使用,大幅提高工作效率。
同時基于大模型強(qiáng)大的自主規(guī)劃能力,不斷構(gòu)建Agent智能體擴(kuò)展大模型能力邊界,完成工商數(shù)據(jù)、新聞輿情、網(wǎng)頁抓取等多智能體集成,可以靈活組合不同工具來完成業(yè)務(wù)目標(biāo),自適應(yīng)進(jìn)行多路由問答。
圖片
員工可實(shí)時體驗(yàn)多個大模型的最新技術(shù),實(shí)現(xiàn)全面客戶洞察,特別是工商、評級等數(shù)據(jù),同時支持文檔問答和全網(wǎng)智能搜索,甚至能進(jìn)行語音克隆與畫圖等多樣化AI應(yīng)用。