自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="kfu1o"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？原創(chuàng)

發(fā)布于 2024-5-22 09:55

瀏覽

0收藏

架構(gòu)設(shè)計(jì)模式已成為程序員的重要技能。然而，當(dāng)我們轉(zhuǎn)向大模型應(yīng)用領(lǐng)域，情況可能會(huì)有所不同。面對新興技術(shù)，比如：生成式 AI，我們尚缺乏成熟的設(shè)計(jì)模式來支撐這些解決方案。

根據(jù)多年的架構(gòu)設(shè)計(jì)經(jīng)驗(yàn)，我在這里整理總結(jié)了一些針對大模型應(yīng)用的設(shè)計(jì)方法和架構(gòu)模式，試圖應(yīng)對和解決大模型應(yīng)用實(shí)現(xiàn)中的一些挑戰(zhàn)，比如：成本問題、延遲問題以及生成的幻覺等問題。

1、路由分發(fā)架構(gòu)模式

當(dāng)用戶輸入一個(gè) Prompt 查詢時(shí)，該查詢會(huì)被發(fā)送到路由轉(zhuǎn)發(fā)模塊，而路由轉(zhuǎn)發(fā)模塊則扮演著對輸入 Prompt 進(jìn)行分類的角色。

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？-AI.x社區(qū)

如果 Prompt 查詢是可以識別的，那么它會(huì)被路由到小模型進(jìn)行處理，這通常是一個(gè)更準(zhǔn)確、響應(yīng)更快且成本更低的操作。然而，如果 Prompt 查詢無法被識別，那么它將由大模型來處理。盡管大模型的運(yùn)行成本較高，但它能夠成功返回更多種類型查詢的答案。通過這種方式，大模型應(yīng)用產(chǎn)品可以在成本、性能和用戶體驗(yàn)之間實(shí)現(xiàn)平衡。

2、大模型代理架構(gòu)模式

在任何一個(gè)生態(tài)系統(tǒng)中，都會(huì)有多個(gè)針對特定任務(wù)領(lǐng)域的專家，并行工作以處理特定類型的查詢，然后將這些響應(yīng)整合在一起，形成一個(gè)全面的答案。

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？-AI.x社區(qū)

這樣的架構(gòu)模式非常適合復(fù)雜的問題解決場景，在這種場景中，問題的不同方面需要不同的專業(yè)知識，就像一個(gè)由專家組成的小組，每個(gè)專家負(fù)責(zé)處理更大問題的一個(gè)方面。

更大的模型（比如：GPT-4）負(fù)責(zé)理解上下文，并將其分解為特定的任務(wù)或信息請求，這些任務(wù)或信息請求被傳遞給更小的代理模型。這些代理模型可能是較小模型，它們已經(jīng)接受過特定任務(wù)的訓(xùn)練，或者是具有特定功能的通用模型，比如：BERT、Llama-2、上下文提示和函數(shù)調(diào)用。

3、基于緩存的微調(diào)架構(gòu)模式

我們將緩存和微調(diào)引入到大模型應(yīng)用架構(gòu)中，可以解決成本高、推理速度慢以及幻覺等組合問題。

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？-AI.x社區(qū)

通過緩存初始結(jié)果，能夠在后續(xù)查詢中迅速提供答案，從而顯著提高了效率。

當(dāng)我們累積了足夠的數(shù)據(jù)后，微調(diào)層將啟動(dòng)，利用早期交互的反饋，進(jìn)一步完善一個(gè)更為專業(yè)化的私有大模型。

專有私有大模型不僅簡化了操作流程，也使專業(yè)知識更好地適應(yīng)特定任務(wù)，使其在需要高度精確性和適應(yīng)性的環(huán)境中，比如：客戶服務(wù)或個(gè)性化內(nèi)容創(chuàng)建，表現(xiàn)得更為高效。

對于剛?cè)腴T的用戶，可以選擇使用預(yù)先構(gòu)建的服務(wù)，比如：GPTCache，或者使用常見的緩存數(shù)據(jù)庫：Redis、Cassandra、Memcached 來運(yùn)行自己的服務(wù)。

4、面向目標(biāo)的 Agent 架構(gòu)模式

對于用戶的 Prompt 提示詞，Agent 會(huì)基于大模型先做規(guī)劃（Planning），拆解成若干子任務(wù)，然后對每個(gè)子任務(wù)分別執(zhí)行（Action），同時(shí)對每一步的執(zhí)行結(jié)果進(jìn)行觀測（Observation），如果觀測結(jié)果合格，就直接返回給用戶最終答案，如果觀測結(jié)果不合格或者執(zhí)行出錯(cuò)，會(huì)重新進(jìn)行規(guī)劃（Replanning）。

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？-AI.x社區(qū)

這種面向目標(biāo)的 Agent 架構(gòu)模式非常常見，也是 AGI 大模型時(shí)代，每一個(gè)程序員同學(xué)都需要掌握的架構(gòu)設(shè)計(jì)模式。

5、Agent 智能體組合架構(gòu)模式

該架構(gòu)設(shè)計(jì)模式強(qiáng)調(diào)了靈活性，通過模塊化 AI 系統(tǒng)，能自我重新配置以優(yōu)化任務(wù)性能。這就像一個(gè)多功能工具，可以根據(jù)需求選擇和激活不同的功能模塊，對于需要為各種客戶需求或產(chǎn)品需求定制解決方案的企業(yè)來說，這是非常有效的。

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？-AI.x社區(qū)

我們可以通過使用各種自主代理框架和體系結(jié)構(gòu)來開發(fā)每個(gè) Agent 智能體，比如：CrewAI、Langchain、LLamaIndex、Microsoft Autogen 和 superAGI等。

通過組合不同的模塊，一個(gè) Agent 可以專注于預(yù)測，一個(gè)處理預(yù)約查詢，一個(gè)專注于生成消息，一個(gè) Agent 來更新數(shù)據(jù)庫。將來，隨著專業(yè) AI 公司提供的特定服務(wù)的增多，我們可以將一個(gè)模塊替換為外部或第三方服務(wù)，以處理特定的任務(wù)或領(lǐng)域的問題。

6、雙重安全架構(gòu)設(shè)計(jì)模式

圍繞大模型的核心安全性至少包含兩個(gè)關(guān)鍵組件：一是用戶組件，我們將其稱為用戶 Proxy 代理；二是防火墻，它為大模型提供了保護(hù)層。

大模型應(yīng)用的六種架構(gòu)模式，你知道幾種？-AI.x社區(qū)

用戶 Proxy 代理在查詢發(fā)出和返回的過程中對用戶的 Prompt 查詢進(jìn)行攔截。該代理負(fù)責(zé)清除個(gè)人身份信息和知識產(chǎn)權(quán)信息，記錄查詢的內(nèi)容，并優(yōu)化成本。

防火墻則保護(hù)大模型及其所使用的基礎(chǔ)設(shè)施。盡管我們對人們?nèi)绾尾倏v大模型以揭示其潛在的訓(xùn)練數(shù)據(jù)、潛在功能以及當(dāng)今惡意行為知之甚少，但我們知道這些強(qiáng)大的大模型是脆弱的。

在安全性相關(guān)的技術(shù)棧中，可能還存在其他安全層，但對于用戶的查詢路徑來說，Proxy 代理和防火墻是最關(guān)鍵的。

本文轉(zhuǎn)載自公眾號玄姐聊AGI 作者：玄姐

原文鏈接：??https://mp.weixin.qq.com/s/RfjImOfo2AO5YELJ3Cki7A??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2024-5-22 09:57:27修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

盤點(diǎn)六大Devin替代方案：自動(dòng)化你的編程任務(wù)

51CTO技術(shù)棧 ? 5750瀏覽 ? 0回復(fù)
這六種在智能手機(jī)上運(yùn)行的開源LLM

51CTO內(nèi)容精選 ? 2818瀏覽 ? 0回復(fù)
關(guān)于企業(yè)級人工智能應(yīng)用常用架構(gòu)，如果老板讓你負(fù)責(zé)牽頭引入人工智能技術(shù)，你知道該怎么做嗎？

AI探索時(shí)代 ? 3093瀏覽 ? 0回復(fù)
你知道什么是微調(diào)嗎？大模型為什么要微調(diào)？以及大模型微調(diào)的原理是什么？

AI探索時(shí)代 ? 6025瀏覽 ? 0回復(fù)
生成式AI智能革命至今：人機(jī)協(xié)同的三種模式與未來軟件架構(gòu)范式演進(jìn)

AIGC觀察者 ? 1.0w瀏覽 ? 0回復(fù)
常見幾種大語言模型壓縮技術(shù)分析詳解

AIGC觀察者 ? 2821瀏覽 ? 0回復(fù)
你知道大模型能做哪些事情嗎？——大模型的任務(wù)類型以及應(yīng)用場景

AI探索時(shí)代 ? 3008瀏覽 ? 0回復(fù)
大模型應(yīng)用開發(fā)過程中主流架構(gòu)模式——大模型+多個(gè)小模型

AI探索時(shí)代 ? 3008瀏覽 ? 0回復(fù)
生成式AI人機(jī)協(xié)同有哪幾種模式？

數(shù)字化助推器 ? 5376瀏覽 ? 0回復(fù)
大模型技術(shù)全面解析，從大模型的概念，技術(shù)，應(yīng)用和挑戰(zhàn)多個(gè)方面介紹大模型

AI探索時(shí)代 ? 1.4w瀏覽 ? 0回復(fù)
你知道大模型聊天補(bǔ)全和文本生成的區(qū)別嗎？

AI探索時(shí)代 ? 2832瀏覽 ? 0回復(fù)
RAG 架構(gòu)圖解：從基礎(chǔ)到高級的七種模式

sulu637 ? 6319瀏覽 ? 0回復(fù)
微軟亞洲研究院2025六大預(yù)測：AI Agents 將顛覆傳統(tǒng)工作模式

AIGC新知 ? 1874瀏覽 ? 0回復(fù)
2025年大模型與Transformer架構(gòu)：技術(shù)前沿與未來趨勢報(bào)告

歐米伽未來研究所 ? 6056瀏覽 ? 0回復(fù)
構(gòu)建大模型 Agent 應(yīng)用六個(gè)框架對比剖析

玄姐聊AGI ? 1505瀏覽 ? 0回復(fù)
MCP不是 API，你知道嗎？

鴻煊的學(xué)習(xí)筆記 ? 931瀏覽 ? 0回復(fù)
你了解大模型的生態(tài)體系嗎？大模型從技術(shù)到應(yīng)用的內(nèi)容梳理

AI探索時(shí)代 ? 1014瀏覽 ? 0回復(fù)
這十種方法你一定要知道

Halo咯咯 ? 1197瀏覽 ? 0回復(fù)
AI Agents-6 | AI智能體架構(gòu)大揭秘：從基礎(chǔ)知識到前沿模式

Halo咯咯 ? 1749瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

從 Local MCP Server 到 Remote MCP Server 架構(gòu)設(shè)計(jì)演進(jìn) 10h前發(fā)布
Spring AI 1.0.0 發(fā)布！支持 MCP 很炸裂！! 10h前發(fā)布

熱門推薦

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Java 開發(fā)必看！MCP Server 實(shí)戰(zhàn)全攻略，原來這么簡單 0回復(fù)

暴論：2025年，程序員必學(xué)技能就是 MCP 0回復(fù)

11張圖全面總結(jié) MCP、A2A、Function Calling 架構(gòu)設(shè)計(jì)間關(guān)系 0回復(fù)

MCP 架構(gòu)設(shè)計(jì)演進(jìn)：從 Local MCP Server 到 Remote MCP Server 開源架構(gòu)設(shè)計(jì)實(shí)現(xiàn) 0回復(fù)

下一篇：當(dāng)AI遇上架構(gòu)師：誰將主導(dǎo)未來？

社區(qū)精華內(nèi)容

目錄