自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

首個獲得駕照的AI!Agent擔(dān)任私人助理樣樣精通,還能幫助考試作弊

人工智能
最近,Jim Fan轉(zhuǎn)發(fā)了斯坦福博士生開發(fā)的一款A(yù)I Agent,它在美國加州的駕照考試現(xiàn)場獨(dú)立通過了考試。AI一小步,人類一大步,我們一起來看一下吧。

關(guān)于當(dāng)前基于Transformer的LLM能走多遠(yuǎn)的問題,人們?nèi)栽跔幷摬恍荨?/span>

與此同時,另一邊,能夠幫助人們處理各項(xiàng)工作的AI Agent已經(jīng)悄然走入人們的生活。

以前的ChatGPT等大模型,熱衷于在人類考試中刷分以凸顯自己的實(shí)力,而不久前,又有一位AI Agent通過了美國加州的駕照考試。

——但與之前不同的是,這次的AI Agent是在監(jiān)考員的眼皮底下幫助人類成功作弊,通過考試!

圖片圖片

對此,AI Agent的作者表示,「很高興與大家分享一項(xiàng)不朽的成就,我們的 Web AI 代理剛剛通過在線加州駕駛考試創(chuàng)造了歷史,成為第一個在加州獲得駕駛執(zhí)照的虛擬 AI!」

「這標(biāo)志著一個開創(chuàng)性的時刻:人工智能首次完全自主地完成現(xiàn)實(shí)世界的人類知識任務(wù),這是人工智能的一小步,也是人類的一大步?!?/span>

雖然多少有點(diǎn)夸張,但不得不說,還是挺神奇的。

圖片圖片

從圖中我們可以看到,AI Agent完全靠自己審題、作答、并點(diǎn)擊下一道題。

對于這樣成功的表現(xiàn),Jim Fan也是表達(dá)了祝賀:

圖片圖片

從去年開始,一些加州居民可以在網(wǎng)上參加駕駛考試的筆試部分,免去了他們需要花時間去考試機(jī)構(gòu)所在地的麻煩。

為了防止作弊,官方采取了一些相應(yīng)的措施,要求考生必須允許機(jī)動車輛管理局(DMV)訪問電腦的攝像頭,以記錄考試過程;并在考試期間共享屏幕。

——這樣參加考試的人就無法在考試中途打小抄了。

然而,還是有人在監(jiān)考員的眼皮底下作弊成功,而助手正是我們前面介紹的AI Agent(到底誰是助手也不好說)。

圖片圖片

這個AI Agent來自一家名為 MultiOn 的初創(chuàng)公司,由 Div Garg 創(chuàng)立。

Div Garg是斯坦福大學(xué)的博士輟學(xué)生,他最初創(chuàng)辦 MultiOn 是為了實(shí)現(xiàn)日常任務(wù)的自動化,比如從亞馬遜訂購廁紙或安排日歷約會。

MultiOn 的產(chǎn)品可以控制用戶的瀏覽器,完成諸如在 Uber Eats 上訂餐或進(jìn)行 Resy 預(yù)訂等任務(wù)。

——需要注意的是,這并不是我們平時會見到的瀏覽器腳本,Agent背后依托的是AI的能力。

圖片圖片

這項(xiàng)服務(wù)目前是免費(fèi)的,AI Agent位于瀏覽器的右下角,你可以在這里輸入命令,這與微軟的必應(yīng) ChatGPT 助手完全不同。

這個AI Agent可以作為用戶的私人助理,它提供的大部分功能都很有用,即使不能完全改變生活。

上個月在舊金山的一家咖啡館演示 MultiOn 時,Garg 用它向 Facebook 上的熟人群發(fā)了「生日快樂」信息。

隨后又利用 MultiOn 安排了與記者的下一次會面,目的正是向大眾演示如何利用AI Agent通過車管局的正式駕駛考試。

雖然看上去只不過是AI答對了一些問題,但實(shí)際上要達(dá)成這個目的并不簡單。

一般來說,AI需要一段長長的提示,才能選擇正確答案,然后點(diǎn)擊進(jìn)入下一個問題,而且AI不能有多余的動作,以免被發(fā)現(xiàn)作弊。

平心而論,目前的這個AI Agent仍然需要人的手指隨時待命,以防出錯。根據(jù)設(shè)置,MultiOn 在出錯時會停止運(yùn)行,這時就需要人類測試者自己按下「繼續(xù)」按鈕。

另外,它也無法解析圖像,所以如果遇到了要求識別交通標(biāo)志的問題,都會回答錯誤。

當(dāng)前的AI雖然擁有完善的知識,但通常需要嚴(yán)格的提示才能進(jìn)行下一步。所以,對于這場考試來說,答對有關(guān)正確駕駛規(guī)范的難題是一方面,點(diǎn)擊按鈕進(jìn)入下一個問題更體現(xiàn)出它的能力。

Garg認(rèn)為這依靠了很多運(yùn)氣。這是 MultiOn 第一次參加正式的州立考,最終,MultiOn 在 46 道題中只錯了五六道,正式達(dá)到了通過標(biāo)準(zhǔn)。

當(dāng)然,根據(jù)加州法律,以這種方式使用該技術(shù)可能構(gòu)成偽證罪。因?yàn)樵诳荚囍皶罂忌暶髯约簩⒂H自作答。

加利福尼亞州車管局曾在一份聲明中寫道:「作為一項(xiàng)防欺詐措施,在線考試參與者必須驗(yàn)證自己的身份,并同意在整個考試過程中接受監(jiān)控。隨著技術(shù)的發(fā)展,DMV 將繼續(xù)更新保障措施」。

人工智能助手的未來

MultiOn在通過DMV考試之前,就已經(jīng)引起了OpenAI及其首席執(zhí)行官Sam Altman的注意,Garg 表示正在與OpenAI密切合作。

但就目前而言,MultiOn對部署采取了謹(jǐn)慎的態(tài)度,這次成功的測試與其說是一項(xiàng)關(guān)鍵功能,不如說是一個概念驗(yàn)證。

Garg希望確保對自己產(chǎn)品的控制,從而避免出現(xiàn)惡意使用的情況。他希望人們不要在各種考試中作弊,因此他計劃對普通用戶禁用任何類似的「灰色地帶」功能。

與主要存在于 ChatGPT 沙盒中的 OpenAI GPT 助手不同,MultiOn 助手是作為谷歌 Chrome 瀏覽器的擴(kuò)展程序自主運(yùn)行的。用戶必須授予它有效控制電腦的權(quán)限。

「我們的技術(shù)直接在用戶的電腦上運(yùn)行,它實(shí)際上是在控制,在做事,很多事情都可能出錯」。

目前,大約有 3 萬人注冊試用了該應(yīng)用的測試版。Garg預(yù)計 MultiOn 還會有更多新功能,比如加強(qiáng)版移動語音助手和內(nèi)置 MultiOn 技術(shù)的瀏覽器。

——不過,利用它在 SAT 或 ACT 等考試中作弊的可能性也不大,因?yàn)檫@兩個考試機(jī)構(gòu)都要求學(xué)生到考試中心參加考試。

MultiOn的官網(wǎng)上還向我們展示了產(chǎn)品的一些基本而有趣的用途,比如查詢天氣:

圖片圖片

更實(shí)用一點(diǎn)的是下面這個例子,用戶可以直接告訴Agent幫忙訂一個漢堡,后面的所有事情都完全不用操心了。

圖片圖片

包括選擇店鋪、選擇商品、下訂單和支付等等,Agent一條龍服務(wù),統(tǒng)統(tǒng)幫你搞定——確實(shí)稱得上是私人助理了。

除了這個演示,官網(wǎng)還列出了其他的一些功能:

圖片圖片

圖片圖片

圖片圖片

圖片圖片

比如線上購物、文章摘要、查找并播放音樂和視頻、在線互動等。

有網(wǎng)友使用MultiOn在亞馬遜買了一本書,并表示「太瘋狂了」。

圖片圖片

圖片圖片

而另一位網(wǎng)友使用MultiOn自動搜索并播放想要的視頻,還自動進(jìn)行了評論:

圖片圖片

有了這次成功的駕照考試經(jīng)歷,Garg也是野心勃勃地表示,「明年我們的AI Agent就可以駕駛你的特斯拉了」!

圖片圖片

不知道大家對于未來的AI Agent又抱有怎樣的幻想呢?

參考資料:

https://twitter.com/DivGarg9/status/1728854189873549809

https://sfstandard.com/2023/11/14/multion-ai-assistant-california-driving-test/


責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2024-07-12 12:59:10

2021-05-10 15:03:35

無人機(jī)火災(zāi)技術(shù)

2022-08-23 14:04:20

代碼人工智能

2023-06-13 13:53:00

GPT-4識圖微軟

2024-09-29 10:15:00

2019-06-27 14:00:13

edoraMycroft開源

2022-09-20 07:03:23

黑客安全碰撞測試

2018-05-02 11:18:01

2018-01-18 09:55:32

AI 大事件

2024-04-15 08:20:00

機(jī)器人技能

2011-07-09 15:34:24

復(fù)合一體機(jī)用戶體驗(yàn)

2017-08-21 16:41:29

開發(fā)者故事

2025-03-27 10:04:36

阿里云通義千問多模態(tài)

2023-08-15 15:03:00

AI工具

2009-03-12 10:42:38

RoutingIgnoreRouteASP.NET

2009-04-07 12:40:59

技術(shù)IT就業(yè)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號