自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代! 原創(chuàng)

發(fā)布于 2024-10-24 14:02
瀏覽
0收藏

又整新活了!Anthropic 家的大模型都能用電腦了!

在本周二的重磅更新里,我們看到了OpenAI勁敵——Anthropic大招不斷。

全新升級的 Claude 3.5 Sonnet 和新模型 Claude 3.5 Haiku,不僅性能強悍。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Claude 3.5 Sonnet更是達到了在編程界橫著走的水平,不僅各項指標(biāo)都干翻了GPT-4o,連o1都不放過!

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Sonnet在SWE基準(zhǔn)驗證中的得分高于所有可用模型,竟然包括了OpenAI o1-preview等推理模型和專門的代理系統(tǒng)。 

難怪Claude直接表示,編程這一塊就是我們的統(tǒng)治區(qū)了。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

不過,最神奇的功能還是 Claude 操作電腦的能力了。

Claude 不僅會填寫表格、編寫程序、遇到問題知道查查谷歌,還會很搞笑地偷個懶——關(guān)掉了錄屏按鈕,偷偷瀏覽黃石公園照片放空大腦!這是在演誰上班?

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)

一、AI用電腦,都能做些啥事?

AI Chatbot的對話能力越來越難以滿足我們對AI的期待。

對于行動能力的提升逐漸變成了一個主攻方向。

無論是o1開發(fā)者日演示的AI訂茶歇甜點,還是各家AI手機都在卷的AI助手預(yù)定餐廳、幫買咖啡等等,都體現(xiàn)了這個勢頭。

但 Claude 還能通過用電腦狠狠驚艷我們一把,就是因為這個 Agent 似乎更通用,留下的想象空間也更大。

因為所到底,我們在辦公室的大多數(shù)工作時間,都是用電腦完成各種不同的任務(wù)而已。因此,Claude的新功能不是簡單的生活助手,而是有著AGI雛形的強大。

雖然 Claude 和計算機交互的能力才剛剛起步,但我們還是能從一個個小示例里感嘆一句:未來可期!

1.自動填寫表格

填寫表格真的是高頻的工作任務(wù)。

在這個范例里,Claude需要填寫來自Ant Equipment Co.的供應(yīng)商請求表,方法是參考已有的表格或者自行搜索。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

左側(cè)更新了AI的思維鏈情況,Claude發(fā)現(xiàn)在給定的表格中沒有相應(yīng)信息,于是開始調(diào)用搜索。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

在切換到CRM系統(tǒng)中進行了搜索之后,Claude順利填好了表格。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)

2.做個日程攻略

在這個示例里,我們的朋友要來舊金山了,我們想讓AI幫我們做一個到金門大橋看日出的攻略,Claude是否能完成細(xì)節(jié)的要求嗎?

我的朋友要來舊金山,我想明天早上和他一起在金門大橋看日出。我們將從太平洋高地出發(fā)。你能幫我們找到一個絕佳的觀賞地點,查看一下開車時間和日出時間,然后安排一個日歷活動,讓我們有足夠的時間到達那里嗎?

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Claude二話沒說,立即開始通過谷歌搜索,嘗試先找個看日出的最佳地點。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Claude在旅游攻略里成功找到了方案,然后開始著手時間方面的安排。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

既然要考慮開車能否趕得及,Claude立馬開始調(diào)用地圖應(yīng)用,來判斷需要為交通預(yù)留的時間。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

還很聰明地查看了當(dāng)日的日出時間,并且把出發(fā)時間安排在我們的日程表里,真的是執(zhí)行力拉滿。

3.Claude 學(xué)習(xí)電腦之路才剛剛起步

不過,雖然示例看起來很美好,但目前還是留有很多的bug。

首先,Claude執(zhí)行任務(wù)的準(zhǔn)確率不夠,例如編程到一半去看圖了等等,千奇百怪的開小差行為。

其次,Claude學(xué)習(xí)電腦使用的道路還有很長,目前也就掌握了點擊,連滾動、縮放、拖拽這樣小學(xué)計算機第一課的內(nèi)容,AI還存在一些操作障礙。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

最后,Claude的速度還比較慢,而且AI用著電腦的時候,你就得停下來手頭的任務(wù)等著,沒法和它并行工作。

也因此,小紅書AI博主@AI Dance評價說,Anthropic變得雞賊了……也開始和OpenAI一樣給大家發(fā)期貨了。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

不過,Claude將其功能在API上提前上線了。

畢竟,作為AI用戶,大家嘗鮮的時候都不會太苛刻。抓到Claude在編程時偷偷摸魚,和AI花費幾個小時填完一份表格都同樣有趣。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦