目錄一、引言二、以「對話為中心」的ChatBot三、以「交付為中心」的多智能體Agent三、什么是智能體Agent1.從Prompt到思維鏈2.ReAct架構(gòu)3.Agent4.Manus:一個Agent典型案例5.大模型上下文協(xié)議(MCP)四、智能體Agent實現(xiàn)的源碼剖析(OpenManus項目)1.準(zhǔn)備2.代碼五、總結(jié)一、引言從2022年12月份OpenAI發(fā)布ChatGPT產(chǎn)品至今已有2年多的時間,當(dāng)大家已經(jīng)習(xí)慣于在對話框中與AI交互,習(xí)慣于通過各種Prompt技巧讓AI更好的理解并回答我...
2025-03-26 00:42:39 2817瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、背景Deepseekr1模型的爆火標(biāo)志著本地部署大模型的需求日益增長。本文主要探討如何優(yōu)化本地部署大模型的性能,并結(jié)合我們的實踐進(jìn)行評測分析,文章最后我們將分享如何在本地高效部署滿血版Deepseekr1大模型。在生產(chǎn)環(huán)境中,我們已部署專用的大模型推理集群,并對其性能進(jìn)行了全面優(yōu)化。對于大模型推理來說,性能優(yōu)化主要聚焦于兩個關(guān)鍵指標(biāo):吞吐量與響應(yīng)時間(RT)。吞吐量傳統(tǒng)上,我們用每秒請求數(shù)(QPS)來衡量吞吐量,即系...
2025-02-20 09:42:58 4156瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、背景得物開放平臺是一個把得物能力進(jìn)行開放,同時提供給開發(fā)者提供公告、應(yīng)用控制臺、權(quán)限包申請、業(yè)務(wù)文檔等功能的平臺。面向商家:通過接入商家自研系統(tǒng)??梢詫崿F(xiàn)自動化庫存、訂單、對賬等管理。面向ISV:接入得物開放平臺,能為其產(chǎn)品提供更完善的全平臺支持。面向內(nèi)部應(yīng)用:提供安全、可控的、快速支持的跨主體通訊。得物開放平臺目前提供了一系列的文檔以及工具去輔助開發(fā)者在實際調(diào)用API之前進(jìn)行基礎(chǔ)的引導(dǎo)和查詢。...
2025-01-21 13:27:59 1554瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、背景得物開放平臺是一個把得物能力進(jìn)行開放,同時提供給開發(fā)者提供公告、應(yīng)用控制臺、權(quán)限包申請、業(yè)務(wù)文檔等功能的平臺。面向商家:通過接入商家自研系統(tǒng)。可以實現(xiàn)自動化庫存、訂單、對賬等管理。面向ISV:接入得物開放平臺,能為其產(chǎn)品提供更完善的全平臺支持。面向內(nèi)部應(yīng)用:提供安全、可控的、快速支持的跨主體通訊。得物開放平臺目前提供了一系列的文檔以及工具去輔助開發(fā)者在實際調(diào)用API之前進(jìn)行基礎(chǔ)的引導(dǎo)和查詢。...
2025-01-10 13:10:24 1718瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
如何把多個大模型合并部署以節(jié)省成本呢?本文將深入探討這一技術(shù)與應(yīng)用場景,利用多Lora合并部署大模型。一、背景近期,我們在大模型集群的部署過程中遇到了一些挑戰(zhàn)。公司有多個業(yè)務(wù)場景,每個場景都基于自身的數(shù)據(jù)進(jìn)行微調(diào),訓(xùn)練出相應(yīng)的大模型并上線。然而,這些場景的調(diào)用量并不高,同時大模型的部署成本較為昂貴,這造成了資源的浪費(fèi)。本文將介紹我們?nèi)绾卫枚郘ora技術(shù),將多個場景合并部署,從而有效解決這一問題。同時...
2024-08-21 09:28:41 2435瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
隨著得物業(yè)務(wù)的快速發(fā)展,積累了大量的時序數(shù)據(jù),這些數(shù)據(jù)對精細(xì)化運(yùn)營,提升效率、降低成本有著重要作用。在得物的時序數(shù)據(jù)挖掘場景中,時序預(yù)測Prophet模型使用頻繁,本文對Prophet的原理和源碼進(jìn)行深入分析,歡迎閱讀和交流。一、引入時間序列是指按照時間先后順序收集或觀測的一系列數(shù)據(jù)點(diǎn),這類數(shù)據(jù)通常都具有一定時間相關(guān)性,基于這種順序性,我們可以對時間序列進(jìn)行多種數(shù)據(jù)挖掘任務(wù),包括分類、聚類、異常檢測和預(yù)測等...
2024-05-31 19:08:53 3109瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、背景最近我們在生產(chǎn)環(huán)境批量部署了大模型專用推理集群,并成功讓包括70B在內(nèi)的大模型推理速度提升50%,大幅縮減部署成本,穩(wěn)定應(yīng)用于生產(chǎn)環(huán)境。本文基于我們在部署大模型推理集群時的一些經(jīng)驗,分享一些有效提升大模型的推理速度方法。最后,我們在結(jié)尾處推薦了幾個經(jīng)過我們評測且表現(xiàn)優(yōu)異的大模型推理框架。希望這些建議能幫助讀者在項目中選擇適合自己的推理框架。OpenAI的科學(xué)家HyungWonChung在2023年的公開演講《LargeL...
2024-05-17 10:21:29 3001瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
一、背景電商供應(yīng)鏈的系統(tǒng)建設(shè)一般偏向于數(shù)據(jù)管理類型,但此類系統(tǒng)建設(shè)有一個很明顯的問題就是前后端開發(fā)的溝通成本較高(相對研發(fā)成本而言),特別是一些簡單加減字段的訴求溝通成本甚至達(dá)到50%以上,如何將這部分溝通成本降低下來,并保證高質(zhì)量的交付成為目前亟待解決的問題。經(jīng)過對需求和系統(tǒng)頁面進(jìn)行分析,我們得出如下數(shù)據(jù):供應(yīng)鏈≤2人日的需求投入工時占接近50%,兩周的迭代周期,一個前端甚至能接到10+需求,時間碎片...
2024-04-29 09:55:30 3497瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
OpenAI發(fā)布的視頻生成模型Sora(https:openai.comsora),能根據(jù)文本生成長達(dá)一分鐘的高質(zhì)量視頻,理論上支持任意分辨率,如1920x1080、1080x1920,生成能力遠(yuǎn)超此前只能生成25幀576x1024圖像的頂尖視頻生成模型StableVideoDiffusion。一起公布的,還有一篇非常簡短的技術(shù)報告,報告大致介紹了Sora的架構(gòu)及應(yīng)用場景,并未對模型的原理做過多的介紹。技術(shù)報告鏈接:https:openai.comresearchvideogenerationmodelsasworldsimulator...
2024-04-01 15:37:39 3414瀏覽 0點(diǎn)贊 0回復(fù) 0收藏