自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大模型應(yīng)用的十種架構(gòu)模式

原創(chuàng) 精選
開發(fā) 架構(gòu)
防火墻則保護(hù)模型及其所使用的基礎(chǔ)設(shè)施。盡管我們對(duì)人們?nèi)绾尾倏v模型以揭示其潛在的訓(xùn)練數(shù)據(jù)、潛在功能以及當(dāng)今惡意行為知之甚少,但我們知道這些強(qiáng)大的模型是脆弱的。

在塑造新領(lǐng)域的過程中,我們往往依賴于一些經(jīng)過實(shí)踐驗(yàn)證的策略、方法和模式。這種觀念對(duì)于軟件工程領(lǐng)域的專業(yè)人士來說,已經(jīng)司空見慣,設(shè)計(jì)模式已成為程序員們的重要技能。然而,當(dāng)我們轉(zhuǎn)向大模型應(yīng)用和人工智能領(lǐng)域,情況可能會(huì)有所不同。面對(duì)新興技術(shù),例如生成式AI,我們尚缺乏成熟的設(shè)計(jì)模式來支撐這些解決方案。

作為一位老碼農(nóng),我在這里整理總結(jié)了一些針對(duì)大模型應(yīng)用的設(shè)計(jì)方法和架構(gòu)模式,試圖應(yīng)對(duì)和解決大模型應(yīng)用實(shí)現(xiàn)中的一些挑戰(zhàn),如成本問題、延遲問題以及生成的不準(zhǔn)確性等。

1.路由分發(fā)模式

當(dāng)用戶輸入一個(gè)查詢時(shí),該查詢會(huì)被發(fā)送到控制中心,而控制中心則扮演著對(duì)輸入進(jìn)行分類的角色。

圖片圖片

如果查詢是可以識(shí)別的,那么它會(huì)被路由到小語言模型進(jìn)行處理,這通常是一個(gè)更準(zhǔn)確、響應(yīng)更快且成本更低的操作。然而,如果查詢無法被識(shí)別,那么它將由大型語言模型來處理。盡管大型語言模型的運(yùn)行成本較高,但它能夠成功返回更多種類型查詢的答案。通過這種方式,人工智能產(chǎn)品可以在成本、性能和用戶體驗(yàn)之間實(shí)現(xiàn)平衡。

2.大模型代理模式

想象一個(gè)生態(tài)系統(tǒng),其中多個(gè)專門針對(duì)特定任務(wù)的生成式AI模型各自作為其領(lǐng)域內(nèi)的專家,并行工作以處理查詢。這種多路復(fù)用模式能夠生成一系列不同的響應(yīng),然后將這些響應(yīng)整合在一起,形成一個(gè)全面的答案。

圖片圖片

這樣的設(shè)置非常適合復(fù)雜的問題解決場(chǎng)景,在這種場(chǎng)景中,問題的不同方面需要不同的專業(yè)知識(shí),就像一個(gè)由專家組成的小組,每個(gè)專家負(fù)責(zé)處理更大問題的一個(gè)方面。

更大的模型(如GPT-4)負(fù)責(zé)理解上下文,并將其分解為特定的任務(wù)或信息請(qǐng)求,這些任務(wù)或信息請(qǐng)求被傳遞給更小的代理。這些代理可能是較小的語言模型,它們已經(jīng)接受過特定任務(wù)的訓(xùn)練,或者是具有特定功能的通用模型,如GPT、Llama、上下文提示和函數(shù)調(diào)用。

3.多任務(wù)微調(diào)模式

在這種架構(gòu)模式中,我們對(duì)大型語言模型進(jìn)行了微調(diào),使其能夠同時(shí)處理多個(gè)任務(wù),而非僅僅針對(duì)單個(gè)任務(wù)。這是一種跨領(lǐng)域知識(shí)和技能遷移學(xué)習(xí)的方法,大大增強(qiáng)了模型的多功能性。

圖片圖片

這種多任務(wù)學(xué)習(xí)方法對(duì)于那些需要應(yīng)對(duì)各種復(fù)雜任務(wù)的平臺(tái)來說尤其有用,例如虛擬助理或是人工智能驅(qū)動(dòng)的研究工具。這極大地簡(jiǎn)化了面向復(fù)雜領(lǐng)域的訓(xùn)練和測(cè)試工作流程。

在訓(xùn)練大型語言模型(LLM)時(shí),我們可以利用一些資源和軟件包,如DeepSpeed,以及Hugging Face的Transformer庫。

4. 面向微調(diào)的分層緩存策略模式

我們將緩存策略和相關(guān)服務(wù)引入到大模型應(yīng)用架構(gòu)中,可以成功地解決成本、數(shù)據(jù)冗余以及訓(xùn)練數(shù)據(jù)等組合問題。

圖片圖片

通過儲(chǔ)存這些初始結(jié)果,系統(tǒng)能夠在后續(xù)查詢中迅速提供答案,從而顯著提高了效率。當(dāng)我們累積了足夠的數(shù)據(jù)后,微調(diào)層級(jí)將啟動(dòng),利用早期交互的反饋,進(jìn)一步完善一個(gè)更為專業(yè)化的模型。

專有大模型不僅簡(jiǎn)化了操作流程,也使人工智能專業(yè)知識(shí)更好地適應(yīng)特定任務(wù),使其在需要高度精確性和適應(yīng)性的環(huán)境中,如客戶服務(wù)或個(gè)性化內(nèi)容創(chuàng)建,表現(xiàn)得更為高效。

對(duì)于剛?cè)腴T的用戶,可以選擇使用預(yù)先構(gòu)建的服務(wù),如 GPTCache,或者使用常見的緩存數(shù)據(jù)庫,如 Redis、Cassandra、Memcached來運(yùn)行自己的服務(wù)。在向混合服務(wù)中添加其他服務(wù)時(shí),一定要記得監(jiān)控并測(cè)量延遲情況。

5.混合規(guī)則模式

許多現(xiàn)行的商業(yè)系統(tǒng)和企業(yè)應(yīng)用在一定程度上仍然依賴于基于規(guī)則的架構(gòu)。通過將大模型與基于規(guī)則的邏輯結(jié)合,我們能夠融合結(jié)構(gòu)化的精確性,旨在創(chuàng)造出既富有創(chuàng)意又遵循規(guī)范的解決方案。

圖片圖片

對(duì)于那些必須嚴(yán)格遵守標(biāo)準(zhǔn)或法規(guī)的行業(yè)或產(chǎn)品而言,這是一個(gè)非常有效的架構(gòu)模式,它確保了人工智能在保持創(chuàng)新的同時(shí),仍能遵守既定的理想?yún)?shù)。例如,這種架構(gòu)可以應(yīng)用于生成電話IVR系統(tǒng)或基于規(guī)則的傳統(tǒng)(非LLM)聊天機(jī)器人的意圖和消息流。

6.知識(shí)圖譜模式

將知識(shí)圖譜與生成型人工智能模型結(jié)合,賦予了它們面向事實(shí)的超級(jí)能力,使得輸出不僅具有上下文情境,而且更加符合事實(shí)。

圖片圖片

對(duì)于要求內(nèi)容真實(shí)性和準(zhǔn)確性不容忽視的應(yīng)用來說,這種方法至關(guān)重要,比如在教育內(nèi)容創(chuàng)作、醫(yī)療咨詢或任何誤導(dǎo)可能帶來嚴(yán)重后果的領(lǐng)域。

知識(shí)圖譜及其本體能夠?qū)?fù)雜主題或問題分解成結(jié)構(gòu)化格式,為大型語言模型提供深層上下文基礎(chǔ)。我們甚至可以借助語言模型,以JSON或RDF等格式創(chuàng)建本體。

可用于構(gòu)建知識(shí)圖譜的圖數(shù)據(jù)庫服務(wù)包括ArangoDB、Amazon Neptune、Google Dgraph、Azure Cosmos DB以及Neo4j等。此外,更廣泛的數(shù)據(jù)集和服務(wù)也能用于訪問更全面的知識(shí)圖譜,包括開源的企業(yè)知識(shí)圖譜API、PyKEEN數(shù)據(jù)集以及Wikidata等等。

7. 智能體蜂巢模式

智能體蜂巢架構(gòu)模式運(yùn)用了大量AI Agent,這些代理共同協(xié)作以解決一個(gè)問題,每個(gè)代理都從各自獨(dú)特的視角出發(fā)進(jìn)行貢獻(xiàn)。

圖片圖片

由此產(chǎn)生的綜合結(jié)果展示了一種集體智慧的體現(xiàn),其效果超越了任何一個(gè)單獨(dú)的AI個(gè)體所能達(dá)到的成果。在需要大量創(chuàng)新解決方案的場(chǎng)景中,或者在處理復(fù)雜的數(shù)據(jù)集時(shí),這種模式尤其有效。

例如,我們可以利用多個(gè)AI Agent來共同審查一篇研究論文,整合他們的所有數(shù)據(jù)和觀點(diǎn)。對(duì)于處理能力要求較高的蜂巢系統(tǒng),我們可以考慮部署消息隊(duì)列服務(wù),比如Apache Kafka,以便更好地處理代理和服務(wù)間的消息傳遞。

8. 智能體組合模式

該架構(gòu)模式強(qiáng)調(diào)了靈活性,通過模塊化的人工智能系統(tǒng),能自我重新配置以優(yōu)化任務(wù)性能。這就像一個(gè)多功能工具,可以根據(jù)需求選擇和激活不同的功能模塊,對(duì)于需要為各種客戶需求或產(chǎn)品需求定制解決方案的企業(yè)來說,這是非常有效的。

圖片圖片

我們可以通過使用各種自主代理框架和體系結(jié)構(gòu)來開發(fā)每個(gè)Agent及其工具,例如CrewAI、Langchain、LLamaIndex、Microsoft Autogen和superAGI等。

通過組合不同的模塊,例如一個(gè)Agent可以專注于預(yù)測(cè),另一個(gè)處理預(yù)約查詢,還有一個(gè)專注于生成消息,最后一個(gè)Agent來更新數(shù)據(jù)庫。將來,隨著專業(yè)AI公司提供的特定服務(wù)的增多,我們可以將一個(gè)模塊替換為外部或第三方服務(wù),以處理特定的任務(wù)或領(lǐng)域的問題。

9.記憶認(rèn)知模式

這種架構(gòu)為人工智能引入了類似于人類記憶的元素,允許模型回憶并基于過去的交互進(jìn)行學(xué)習(xí),從而產(chǎn)生更細(xì)膩的反應(yīng)。

圖片圖片

這對(duì)于正在進(jìn)行的對(duì)話或?qū)W習(xí)場(chǎng)景非常有用,因?yàn)殡S著時(shí)間的推移,人工智能會(huì)形成更深的理解,就像一個(gè)專業(yè)的個(gè)人助理或者在線機(jī)器學(xué)習(xí)平臺(tái)。隨著時(shí)間推移,記憶認(rèn)知模式能夠?qū)㈥P(guān)鍵事件總結(jié)并儲(chǔ)存到一個(gè)向量數(shù)據(jù)庫中,進(jìn)一步豐富RAG系統(tǒng)。

為了保持匯總計(jì)算量的合理性,我們可以通過使用更小的自然語言處理庫來進(jìn)行匯總和摘要。所使用的是向量數(shù)據(jù)庫,并在提示階段進(jìn)行檢索,以檢查短期記憶,并通過最近鄰搜索來定位關(guān)鍵的“事實(shí)”。有一個(gè)遵循這種模式的開源解決方案是MemGPT。

10. 雙重安全模式

圍繞大型語言模型(LLM)的核心安全性至少包含兩個(gè)關(guān)鍵組件:一是用戶組件,我們將其稱為用戶Proxy代理;二是防火墻,它為模型提供了保護(hù)層。

圖片圖片

用戶proxy代理在查詢發(fā)出和返回的過程中對(duì)用戶的query進(jìn)行攔截。該代理負(fù)責(zé)清除個(gè)人身份信息(pII)和知識(shí)產(chǎn)權(quán)(IP)信息,記錄查詢的內(nèi)容,并優(yōu)化成本。

防火墻則保護(hù)模型及其所使用的基礎(chǔ)設(shè)施。盡管我們對(duì)人們?nèi)绾尾倏v模型以揭示其潛在的訓(xùn)練數(shù)據(jù)、潛在功能以及當(dāng)今惡意行為知之甚少,但我們知道這些強(qiáng)大的模型是脆弱的。

在安全性相關(guān)的技術(shù)棧中,可能還存在其他安全層,但對(duì)于用戶的查詢路徑來說,Proxy代理和防火墻是最關(guān)鍵的。

責(zé)任編輯:武曉燕 來源: 喔家ArchiSelf
相關(guān)推薦

2024-03-26 13:35:19

模型架構(gòu)框架

2023-05-15 15:29:13

設(shè)計(jì)模式JavaScript

2024-06-04 00:00:04

2025-02-10 08:30:00

JavaScrip開發(fā)設(shè)計(jì)模式

2012-01-13 10:45:56

企業(yè)應(yīng)用架構(gòu)

2022-06-14 11:01:37

架構(gòu)模式開發(fā)

2020-06-28 10:15:39

架構(gòu)模式軟件

2022-09-21 10:05:09

架構(gòu)模式

2017-09-14 09:30:38

軟件架構(gòu)模式

2025-04-24 08:50:00

軟件架構(gòu)架構(gòu)軟件系統(tǒng)

2023-06-18 12:21:42

分布式系統(tǒng)模式架構(gòu)設(shè)計(jì)

2024-09-03 10:40:38

2025-02-03 00:10:00

人工智能DevOpsLLMOps

2024-01-05 13:25:00

架構(gòu)架構(gòu)模式開發(fā)

2022-08-26 16:44:40

智慧城市AI人工智能

2022-07-27 20:37:45

主流企業(yè)架構(gòu)

2024-06-25 13:02:25

2024-11-13 13:20:44

2020-06-22 07:00:00

軟件架構(gòu)架構(gòu)模式

2020-04-01 10:48:28

業(yè)務(wù)設(shè)計(jì)架構(gòu)模型CIO
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)