自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

大模型應(yīng)用的十種架構(gòu)模式

原創(chuàng) 精選

作者：曹洪偉 2024-09-02 10:07:52

開發(fā) 架構(gòu)

防火墻則保護(hù)模型及其所使用的基礎(chǔ)設(shè)施。盡管我們對(duì)人們?nèi)绾尾倏v模型以揭示其潛在的訓(xùn)練數(shù)據(jù)、潛在功能以及當(dāng)今惡意行為知之甚少，但我們知道這些強(qiáng)大的模型是脆弱的。

在塑造新領(lǐng)域的過程中，我們往往依賴于一些經(jīng)過實(shí)踐驗(yàn)證的策略、方法和模式。這種觀念對(duì)于軟件工程領(lǐng)域的專業(yè)人士來說，已經(jīng)司空見慣，設(shè)計(jì)模式已成為程序員們的重要技能。然而，當(dāng)我們轉(zhuǎn)向大模型應(yīng)用和人工智能領(lǐng)域，情況可能會(huì)有所不同。面對(duì)新興技術(shù)，例如生成式AI，我們尚缺乏成熟的設(shè)計(jì)模式來支撐這些解決方案。

作為一位老碼農(nóng)，我在這里整理總結(jié)了一些針對(duì)大模型應(yīng)用的設(shè)計(jì)方法和架構(gòu)模式，試圖應(yīng)對(duì)和解決大模型應(yīng)用實(shí)現(xiàn)中的一些挑戰(zhàn)，如成本問題、延遲問題以及生成的不準(zhǔn)確性等。

1.路由分發(fā)模式

當(dāng)用戶輸入一個(gè)查詢時(shí)，該查詢會(huì)被發(fā)送到控制中心，而控制中心則扮演著對(duì)輸入進(jìn)行分類的角色。

圖片

如果查詢是可以識(shí)別的，那么它會(huì)被路由到小語言模型進(jìn)行處理，這通常是一個(gè)更準(zhǔn)確、響應(yīng)更快且成本更低的操作。然而，如果查詢無法被識(shí)別，那么它將由大型語言模型來處理。盡管大型語言模型的運(yùn)行成本較高，但它能夠成功返回更多種類型查詢的答案。通過這種方式，人工智能產(chǎn)品可以在成本、性能和用戶體驗(yàn)之間實(shí)現(xiàn)平衡。

2.大模型代理模式

想象一個(gè)生態(tài)系統(tǒng)，其中多個(gè)專門針對(duì)特定任務(wù)的生成式AI模型各自作為其領(lǐng)域內(nèi)的專家，并行工作以處理查詢。這種多路復(fù)用模式能夠生成一系列不同的響應(yīng)，然后將這些響應(yīng)整合在一起，形成一個(gè)全面的答案。

圖片

這樣的設(shè)置非常適合復(fù)雜的問題解決場(chǎng)景，在這種場(chǎng)景中，問題的不同方面需要不同的專業(yè)知識(shí)，就像一個(gè)由專家組成的小組，每個(gè)專家負(fù)責(zé)處理更大問題的一個(gè)方面。

更大的模型（如GPT-4）負(fù)責(zé)理解上下文，并將其分解為特定的任務(wù)或信息請(qǐng)求，這些任務(wù)或信息請(qǐng)求被傳遞給更小的代理。這些代理可能是較小的語言模型，它們已經(jīng)接受過特定任務(wù)的訓(xùn)練，或者是具有特定功能的通用模型，如GPT、Llama、上下文提示和函數(shù)調(diào)用。

3.多任務(wù)微調(diào)模式

在這種架構(gòu)模式中，我們對(duì)大型語言模型進(jìn)行了微調(diào)，使其能夠同時(shí)處理多個(gè)任務(wù)，而非僅僅針對(duì)單個(gè)任務(wù)。這是一種跨領(lǐng)域知識(shí)和技能遷移學(xué)習(xí)的方法，大大增強(qiáng)了模型的多功能性。

圖片

這種多任務(wù)學(xué)習(xí)方法對(duì)于那些需要應(yīng)對(duì)各種復(fù)雜任務(wù)的平臺(tái)來說尤其有用，例如虛擬助理或是人工智能驅(qū)動(dòng)的研究工具。這極大地簡(jiǎn)化了面向復(fù)雜領(lǐng)域的訓(xùn)練和測(cè)試工作流程。

在訓(xùn)練大型語言模型（LLM）時(shí)，我們可以利用一些資源和軟件包，如DeepSpeed，以及Hugging Face的Transformer庫。

4. 面向微調(diào)的分層緩存策略模式

我們將緩存策略和相關(guān)服務(wù)引入到大模型應(yīng)用架構(gòu)中，可以成功地解決成本、數(shù)據(jù)冗余以及訓(xùn)練數(shù)據(jù)等組合問題。

圖片

通過儲(chǔ)存這些初始結(jié)果，系統(tǒng)能夠在后續(xù)查詢中迅速提供答案，從而顯著提高了效率。當(dāng)我們累積了足夠的數(shù)據(jù)后，微調(diào)層級(jí)將啟動(dòng)，利用早期交互的反饋，進(jìn)一步完善一個(gè)更為專業(yè)化的模型。

專有大模型不僅簡(jiǎn)化了操作流程，也使人工智能專業(yè)知識(shí)更好地適應(yīng)特定任務(wù)，使其在需要高度精確性和適應(yīng)性的環(huán)境中，如客戶服務(wù)或個(gè)性化內(nèi)容創(chuàng)建，表現(xiàn)得更為高效。

對(duì)于剛?cè)腴T的用戶，可以選擇使用預(yù)先構(gòu)建的服務(wù)，如 GPTCache，或者使用常見的緩存數(shù)據(jù)庫，如 Redis、Cassandra、Memcached來運(yùn)行自己的服務(wù)。在向混合服務(wù)中添加其他服務(wù)時(shí)，一定要記得監(jiān)控并測(cè)量延遲情況。

5.混合規(guī)則模式

許多現(xiàn)行的商業(yè)系統(tǒng)和企業(yè)應(yīng)用在一定程度上仍然依賴于基于規(guī)則的架構(gòu)。通過將大模型與基于規(guī)則的邏輯結(jié)合，我們能夠融合結(jié)構(gòu)化的精確性，旨在創(chuàng)造出既富有創(chuàng)意又遵循規(guī)范的解決方案。

圖片

對(duì)于那些必須嚴(yán)格遵守標(biāo)準(zhǔn)或法規(guī)的行業(yè)或產(chǎn)品而言，這是一個(gè)非常有效的架構(gòu)模式，它確保了人工智能在保持創(chuàng)新的同時(shí)，仍能遵守既定的理想?yún)?shù)。例如，這種架構(gòu)可以應(yīng)用于生成電話IVR系統(tǒng)或基于規(guī)則的傳統(tǒng)（非LLM）聊天機(jī)器人的意圖和消息流。

6.知識(shí)圖譜模式

將知識(shí)圖譜與生成型人工智能模型結(jié)合，賦予了它們面向事實(shí)的超級(jí)能力，使得輸出不僅具有上下文情境，而且更加符合事實(shí)。

圖片

對(duì)于要求內(nèi)容真實(shí)性和準(zhǔn)確性不容忽視的應(yīng)用來說，這種方法至關(guān)重要，比如在教育內(nèi)容創(chuàng)作、醫(yī)療咨詢或任何誤導(dǎo)可能帶來嚴(yán)重后果的領(lǐng)域。

知識(shí)圖譜及其本體能夠?qū)?fù)雜主題或問題分解成結(jié)構(gòu)化格式，為大型語言模型提供深層上下文基礎(chǔ)。我們甚至可以借助語言模型，以JSON或RDF等格式創(chuàng)建本體。

可用于構(gòu)建知識(shí)圖譜的圖數(shù)據(jù)庫服務(wù)包括ArangoDB、Amazon Neptune、Google Dgraph、Azure Cosmos DB以及Neo4j等。此外，更廣泛的數(shù)據(jù)集和服務(wù)也能用于訪問更全面的知識(shí)圖譜，包括開源的企業(yè)知識(shí)圖譜API、PyKEEN數(shù)據(jù)集以及Wikidata等等。

7. 智能體蜂巢模式

智能體蜂巢架構(gòu)模式運(yùn)用了大量AI Agent，這些代理共同協(xié)作以解決一個(gè)問題，每個(gè)代理都從各自獨(dú)特的視角出發(fā)進(jìn)行貢獻(xiàn)。

圖片

由此產(chǎn)生的綜合結(jié)果展示了一種集體智慧的體現(xiàn)，其效果超越了任何一個(gè)單獨(dú)的AI個(gè)體所能達(dá)到的成果。在需要大量創(chuàng)新解決方案的場(chǎng)景中，或者在處理復(fù)雜的數(shù)據(jù)集時(shí)，這種模式尤其有效。

例如，我們可以利用多個(gè)AI Agent來共同審查一篇研究論文，整合他們的所有數(shù)據(jù)和觀點(diǎn)。對(duì)于處理能力要求較高的蜂巢系統(tǒng)，我們可以考慮部署消息隊(duì)列服務(wù)，比如Apache Kafka，以便更好地處理代理和服務(wù)間的消息傳遞。

8. 智能體組合模式

該架構(gòu)模式強(qiáng)調(diào)了靈活性，通過模塊化的人工智能系統(tǒng)，能自我重新配置以優(yōu)化任務(wù)性能。這就像一個(gè)多功能工具，可以根據(jù)需求選擇和激活不同的功能模塊，對(duì)于需要為各種客戶需求或產(chǎn)品需求定制解決方案的企業(yè)來說，這是非常有效的。

圖片

我們可以通過使用各種自主代理框架和體系結(jié)構(gòu)來開發(fā)每個(gè)Agent及其工具，例如CrewAI、Langchain、LLamaIndex、Microsoft Autogen和superAGI等。

通過組合不同的模塊，例如一個(gè)Agent可以專注于預(yù)測(cè)，另一個(gè)處理預(yù)約查詢，還有一個(gè)專注于生成消息，最后一個(gè)Agent來更新數(shù)據(jù)庫。將來，隨著專業(yè)AI公司提供的特定服務(wù)的增多，我們可以將一個(gè)模塊替換為外部或第三方服務(wù)，以處理特定的任務(wù)或領(lǐng)域的問題。

9.記憶認(rèn)知模式

這種架構(gòu)為人工智能引入了類似于人類記憶的元素，允許模型回憶并基于過去的交互進(jìn)行學(xué)習(xí)，從而產(chǎn)生更細(xì)膩的反應(yīng)。

圖片

這對(duì)于正在進(jìn)行的對(duì)話或?qū)W習(xí)場(chǎng)景非常有用，因?yàn)殡S著時(shí)間的推移，人工智能會(huì)形成更深的理解，就像一個(gè)專業(yè)的個(gè)人助理或者在線機(jī)器學(xué)習(xí)平臺(tái)。隨著時(shí)間推移，記憶認(rèn)知模式能夠?qū)㈥P(guān)鍵事件總結(jié)并儲(chǔ)存到一個(gè)向量數(shù)據(jù)庫中，進(jìn)一步豐富RAG系統(tǒng)。

為了保持匯總計(jì)算量的合理性，我們可以通過使用更小的自然語言處理庫來進(jìn)行匯總和摘要。所使用的是向量數(shù)據(jù)庫，并在提示階段進(jìn)行檢索，以檢查短期記憶，并通過最近鄰搜索來定位關(guān)鍵的“事實(shí)”。有一個(gè)遵循這種模式的開源解決方案是MemGPT。

10. 雙重安全模式

圍繞大型語言模型（LLM）的核心安全性至少包含兩個(gè)關(guān)鍵組件：一是用戶組件，我們將其稱為用戶Proxy代理；二是防火墻，它為模型提供了保護(hù)層。

圖片

用戶proxy代理在查詢發(fā)出和返回的過程中對(duì)用戶的query進(jìn)行攔截。該代理負(fù)責(zé)清除個(gè)人身份信息（pII）和知識(shí)產(chǎn)權(quán)（IP）信息，記錄查詢的內(nèi)容，并優(yōu)化成本。

防火墻則保護(hù)模型及其所使用的基礎(chǔ)設(shè)施。盡管我們對(duì)人們?nèi)绾尾倏v模型以揭示其潛在的訓(xùn)練數(shù)據(jù)、潛在功能以及當(dāng)今惡意行為知之甚少，但我們知道這些強(qiáng)大的模型是脆弱的。

在安全性相關(guān)的技術(shù)棧中，可能還存在其他安全層，但對(duì)于用戶的查詢路徑來說，Proxy代理和防火墻是最關(guān)鍵的。

責(zé)任編輯：武曉燕來源：喔家ArchiSelf

架構(gòu)模式基礎(chǔ)設(shè)施

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營