自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="ojrbh"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

Agents需要一個代碼解釋器原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-5-15 10:43

瀏覽

0收藏

作者 | Vasek Mlejnsky

編譯 | 言征

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

構(gòu)建人工智能代理很難。你將與幻覺作斗爭，讓agents智商不掉線，并引導(dǎo)他們使用正確的工具。

不過，方法也不難，其中一種就是賦予代理代碼執(zhí)行能力。

以下是為什么你的人工智能代理應(yīng)該有一個代碼解釋器的一些原因。

一、額外技能

具有代碼解釋器的代理可以獲得諸如對CSV文件執(zhí)行統(tǒng)計(jì)分析或繪制圖表之類的功能。

當(dāng)你向不同的代理請求相同的東西時，很明顯，那些具有底層代碼解釋器的代理有多大的不同。如果不運(yùn)行代碼，幾乎不可能完成以下任務(wù)：

分析NVIDIA的股票并預(yù)測其發(fā)展。
和人一起玩撲克游戲。
訂一張機(jī)票。

我們先來看一下Perplexity（一個沒有代碼解釋器的代理）如何處理數(shù)據(jù)分析任務(wù)。即使提供了數(shù)據(jù)文件，代理也無法完成任務(wù)——它所能做的最好的事情就是提供關(guān)于應(yīng)該運(yùn)行什么代碼的建議。

Agents需要一個代碼解釋器-AI.x社區(qū) 圖片

以下是帶有底層代碼解釋器的ChatGPT將如何處理相同的任務(wù)…

Agents需要一個代碼解釋器-AI.x社區(qū) 圖片

…還包括安裝新軟件包和生成圖表。

Agents需要一個代碼解釋器-AI.x社區(qū) 圖片

請注意，最終用戶不需要意識到應(yīng)用程序在幕后執(zhí)行編碼任務(wù)，因?yàn)橹饕繕?biāo)（如“為我預(yù)訂航班”）通常不圍繞編碼。

二、復(fù)雜推理

大型語言模型（LLM）擅長生成文本，但難以進(jìn)行推理和復(fù)雜思考。

谷歌的團(tuán)隊(duì)對丹尼爾·卡尼曼的名著《思考，快與慢》進(jìn)行了有趣的類比。執(zhí)行代碼的能力使代理具有慢思考（努力、邏輯和計(jì)算）與快思考（直覺和自動）的能力，并通過代理在沒有代碼解釋器的情況下的行為來表示。

在他們的類比中，完全依賴LLM的代理可以被認(rèn)為是在沒有慢思考的情況下操作，即在沒有深入思考的情況下來快速生成文本。下面是一個例子，說明即使是簡單的任務(wù)也可能需要一些系統(tǒng)，而不能憑直覺回答。

Agents需要一個代碼解釋器-AI.x社區(qū) 圖片

三、減少LLM幻覺

最近的一篇論文證實(shí)，即使在給出推理提示的情況下，LLM也會對多步驟任務(wù)產(chǎn)生幻覺。作為論文研究結(jié)果的后續(xù)，一位軟件工程師展示了使用代碼解釋器式LLM引擎如何成功地將幻覺減少一個數(shù)量級。他發(fā)現(xiàn)，代碼解釋器可以將GPT-4幻覺率從<10%降低到<1%。

代碼解釋器可以處理上傳和下載，編寫代碼從源文件中查找數(shù)據(jù)并得出結(jié)論，而不是像更簡單的代理通常那樣自由推理。

對抗LLM幻覺的其他方法包括RAG、微調(diào)和增加LLM上下文窗口的大小。

四、自己測試代碼

另一個巨大的挑戰(zhàn)是LLM代碼的生成。當(dāng)代理不僅可以生成代碼，還可以在運(yùn)行代碼時，它就能夠測試自己輸出的功能并對其進(jìn)行迭代。

五、使用代碼解釋器構(gòu)建

作為圍繞LLM構(gòu)建的新生態(tài)系統(tǒng)的一部分，我們將看到代碼解釋器為更多的人工智能代理和應(yīng)用程序提供動力，在LLM中，代碼解釋器代表了代理大腦的關(guān)鍵部分。有關(guān)構(gòu)建的靈感，不妨參閱流行的開源產(chǎn)品，如Open Interpreter或AutoGen。

Agents需要一個代碼解釋器-AI.x社區(qū) 圖片

當(dāng)然，仍然有一些挑戰(zhàn)需要克服，例如找到一種安全和最佳的方式來運(yùn)行LLM生成的代碼，這可以通過在獨(dú)立的云環(huán)境中執(zhí)行進(jìn)程來解決。

?本文轉(zhuǎn)載自51CTO技術(shù)棧，作者：言征

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

我們 Gemini 時代的下一個篇章

lazihuman ? 2378瀏覽 ? 0回復(fù)
手動實(shí)現(xiàn)一個擴(kuò)散模型DDPM

pangguiyu ? 5713瀏覽 ? 0回復(fù)
AI下一個重大飛躍是理解情感！第一個具有情商的對話型AI來了

duhorse ? 2678瀏覽 ? 0回復(fù)
你還需要一個嗎？

51CTO技術(shù)棧 ? 3349瀏覽 ? 2回復(fù)
生成一個好故事！StoryDiffusion:一致自注意力和語義運(yùn)動預(yù)測器必不可少（南開&字節(jié)）

angel ? 3174瀏覽 ? 0回復(fù)
前特斯拉Optimus科學(xué)家跳槽HF，直接開源了一個機(jī)器人代碼庫

輕薄滴假象 ? 2383瀏覽 ? 0回復(fù)
CVPR 2024｜讓圖像擴(kuò)散模型生成高質(zhì)量360度場景，只需要一個語言模型

輕薄滴假象 ? 2994瀏覽 ? 0回復(fù)
如果老板讓你基于大模型搭建一個系統(tǒng)，怎么選擇一個適合自己任務(wù)的大模型？選擇大模型需要考慮哪些問題？

AI探索時代 ? 2307瀏覽 ? 0回復(fù)
一個更小、更快、更干凈的 GraphRAG！！

玄姐聊AGI ? 3762瀏覽 ? 0回復(fù)
你需要一個語義路由器

51CTO技術(shù)棧 ? 2363瀏覽 ? 0回復(fù)
對連續(xù)概率分布的一個常見誤解

魚蟲子 ? 1890瀏覽 ? 0回復(fù)
Agent遇上4萬個工具？一個Token搞定！

探索AGI ? 1981瀏覽 ? 0回復(fù)
怎么設(shè)計(jì)一個自己的大模型？設(shè)計(jì)一個大模型需要哪些能力？

AI探索時代 ? 3066瀏覽 ? 0回復(fù)
一個輕量級RAG文本切塊項(xiàng)目Chonkie

PaperAgent ? 2454瀏覽 ? 0回復(fù)
快速學(xué)會一個機(jī)器學(xué)習(xí)算法：t-SNE降維

寶寶數(shù)模AI ? 1454瀏覽 ? 0回復(fù)
自己打包一個數(shù)據(jù)集代碼案例——使用Numpy計(jì)算框架自定義一個類似MINST的數(shù)據(jù)集

AI探索時代 ? 1478瀏覽 ? 0回復(fù)
開源一個新的SDK，現(xiàn)場手搓三個Agent！還抖了一個內(nèi)部的料

51CTO技術(shù)棧 ? 2000瀏覽 ? 0回復(fù)
部署一個大模型，到底需要多大機(jī)器？

hm673c38238a021 ? 1078瀏覽 ? 0回復(fù)
ChatDiT：一個用于任務(wù)無關(guān)自由形式聊天的無訓(xùn)練基線擴(kuò)散變換器

AIRoobt ? 181瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 23分鐘前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點(diǎn)贊！真實(shí)跑步水平曝光：2m/s接近天工！ 5h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇： OpenAI模型終于更新！強(qiáng)大視聽能力的GPT-4o將面向所有用戶，其前身正是神秘的gpt2！

下一篇： “全家桶”戰(zhàn)士歸來，谷歌自我革命！

社區(qū)精華內(nèi)容

目錄

^{<thead id="dveta"></thead>}

<blockquote id="dveta"></blockquote>