自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

索尼AI擊潰頂級(jí)真人賽車手,以1.5秒優(yōu)勢(shì)打敗人類

人工智能
艾米麗·瓊斯是一名多次奪冠的頂級(jí) GT 游戲賽車手,她拍打著她的電子競(jìng)技專用方向盤,眼睛盯著面前的屏幕:“我盡力了,但還是追不上它——它是怎么做到的?”

“這是什么情況?”艾米麗·瓊斯(Emily Jones)不敢相信自己竟然落后了。

艾米麗·瓊斯是一名多次奪冠的頂級(jí) GT 游戲賽車手,她拍打著她的電子競(jìng)技專用方向盤,眼睛盯著面前的屏幕:“我盡力了,但還是追不上它——它是怎么做到的?”

在游戲 GT(Gran Turismo)中,瓊斯以每小時(shí) 120 英里的速度駕駛著她的賽車。為了追上世界上最快的“玩家”,她幾度把車速飆到了每小時(shí) 140、150 英里。

這位“玩家”實(shí)際上是名為 GT Sophy 的人工智能。它是由索尼人工智能研究實(shí)驗(yàn)室在 2020 年發(fā)布的,利用人工智能技術(shù)在 GT 游戲中學(xué)習(xí)如何操控賽車。在 2021 年舉行的一系列閉門活動(dòng)中,索尼安排了該人工智能與頂尖 GT 賽車手同臺(tái)競(jìng)技。

2021 年 7 月,瓊斯作為電競(jìng)戰(zhàn)隊(duì) Trans Tasman Racing 的一員,參與了索尼組織的活動(dòng),但當(dāng)時(shí)的她并不知道會(huì)發(fā)生什么。

“沒人給我提供任何信息。只是跟我說不需要做任何練習(xí),也不要在意圈速?!彼貞浀馈!拔业膽B(tài)度也很單純,保密就保密吧,這肯定不是什么壞事。”

最后,GT Sophy 以 1.5 秒的優(yōu)勢(shì)擊敗了瓊斯的最佳成績(jī)——人類賽車手刷新 GT 紀(jì)錄基本都是以毫秒為單位的,1.5 秒意味著巨大的差距。

但索尼很快了解到,僅憑速度并不足以讓 GT Sophy 成為贏家。它在單人賽道上超越了人類車手,以不可思議的成績(jī)打破了三個(gè)不同賽道的紀(jì)錄。

然而當(dāng)索尼將其與多個(gè)人類車手放在一起比賽時(shí),它卻輸?shù)袅恕嗳烁?jìng)賽不僅需要速度,還需要一定的智慧。GT Sophy 有時(shí)因過于激進(jìn)和魯莽而招來罰分,有時(shí)則過于怯懦,在不需要的時(shí)候讓步。

索尼重新訓(xùn)練了人工智能,并在 2021 年 10 月進(jìn)行了第二輪比賽。這一次,GT Sophy 輕松地贏下了人類玩家。它做出了什么改變?

首先是索尼打造了一個(gè)更大的神經(jīng)網(wǎng)絡(luò),程序的性能更加強(qiáng)大,但本質(zhì)上的不同之處在于 GT Sophy 學(xué)會(huì)了“賽道禮儀”。

美國(guó)負(fù)責(zé)人彼得·沃曼()表示,這種禮儀被人類車手廣泛遵守,其實(shí)質(zhì)是平衡攻擊性和讓步的能力,在時(shí)刻變化的賽場(chǎng)中動(dòng)態(tài)選擇最合適的行為。

這也是使 GT Sophy 超越賽車游戲人工智能的原因。他說,車手在賽道上的互動(dòng)和禮節(jié)是一個(gè)特殊例子,其中展示的動(dòng)態(tài)的、情境感知的行為,正是機(jī)器人在和人互動(dòng)時(shí)應(yīng)該具備的。

認(rèn)識(shí)到何時(shí)冒險(xiǎn)、何時(shí)安全行事,對(duì)于人工智能來說十分有用,無論是在制造車間、家庭機(jī)器人,還是無人駕駛汽車上。

說:“我認(rèn)為我們還沒有學(xué)會(huì)關(guān)于如何處理必須遵循的人類規(guī)范的一般原則。但這是一個(gè)好的開始,希望它能讓我們深入了解這個(gè)問題。”

GT Sophy 只是許多擊敗過人類的人工智能系統(tǒng)中的其中一個(gè),從國(guó)際象棋到星際爭(zhēng)霸和 DOTA2,人工智能都擊敗了世界上最好的人類選手。不過 GT 這個(gè)游戲給索尼提供了一種新的挑戰(zhàn)。

與其他的、特別是那些回合制的游戲不同,GT 要求頂尖玩家在逼近物理極限(超高車速)的情況下實(shí)時(shí)控制車輛。在競(jìng)賽中,所有其他玩家都在做相同的事情。

虛擬賽車以每小時(shí) 100 英里的速度疾馳而過,車身與彎道邊緣的距離只有幾英寸。在這樣的速度下,微小的誤差都會(huì)導(dǎo)致碰撞。

據(jù)悉,GT 游戲以詳盡地捕捉、并復(fù)刻真實(shí)世界的物理學(xué)而聞名,它模擬了賽車的空氣動(dòng)力學(xué)和輪胎在賽道上的摩擦。這一游戲有時(shí)甚至被用來訓(xùn)練和招募真實(shí)世界的賽車手。

瑞士蘇黎世大學(xué)機(jī)器人和感知小組的負(fù)責(zé)人(Davide Scaramuzza)說:“它在真實(shí)程度方面做得很好?!彼]有參與 GT Sophy 項(xiàng)目,但他的團(tuán)隊(duì)曾使用 GT 游戲來訓(xùn)練人工智能駕駛員,目前尚未進(jìn)行過針對(duì)人類的測(cè)試。

GT Sophy 參與游戲的方法與人類玩家不同。它不讀取屏幕上的像素,而是獲取有關(guān)自身在賽道上的位置和周圍汽車的位置的數(shù)據(jù)。它還會(huì)收到關(guān)于影響其車輛的虛擬物理力量的信息。

作為回應(yīng),GT Sophy 控制汽車轉(zhuǎn)彎或剎車。這種 GT Sophy 與游戲之間的交互每一秒進(jìn)行 10 次,及其同事聲稱,這與人類玩家的反應(yīng)時(shí)間相似。

索尼使用了強(qiáng)化學(xué)習(xí),通過試錯(cuò)的方法從零訓(xùn)練 GT Sophy。起初,人工智能只能努力讓汽車保持在路上行駛。

但經(jīng)過在 10 臺(tái) PS4 上的訓(xùn)練后(每臺(tái)運(yùn)行 20 個(gè)程序?qū)嵗?,GT Sophy 在大約 8 小時(shí)內(nèi)提升到了 GT 的內(nèi)置人工智能水平,相當(dāng)于業(yè)余玩家。在 24 小時(shí)內(nèi),它就接近了包含 17700 名人類玩家最佳成績(jī)排行榜的最頂端。

GT Sophy 花了 9 天時(shí)間不斷縮短圈速。最后,它比任何人類玩家都要快。

可以說,索尼的人工智能學(xué)會(huì)了如何在游戲允許的極限下駕駛,完成了人類玩家力所不能及的動(dòng)作。令瓊斯最為印象深刻的是 GT Sophy 的轉(zhuǎn)彎方式,將剎車提前、以實(shí)現(xiàn)用更緊的走線加速出彎。

她說:“GT Sophy 以一種奇怪的方式對(duì)待走線,做了一些我甚至從未想過的事情?!崩?GT Sophy 經(jīng)常把一個(gè)輪胎開到賽道邊緣的草地上,然后滑進(jìn)彎道。一般人不會(huì)那樣做,因?yàn)樘菀追稿e(cuò)了。這就像是你在控制一起碰撞事故。給我一百次機(jī)會(huì),我也許只能成功一次?!?/p>

GT Sophy 很快就掌握了這個(gè)游戲的物理學(xué),不過更大的問題是裁判。在職業(yè)賽場(chǎng)上,GT 比賽由人類裁判監(jiān)督,他們有權(quán)對(duì)危險(xiǎn)駕駛扣分。

累積懲罰是 GT Sophy 在 2021 年 7 月的第一輪比賽中失利的一個(gè)關(guān)鍵原因,盡管它比任何一個(gè)人類車手都要快。在幾個(gè)月后的第二輪比賽中,它學(xué)會(huì)了如何規(guī)避懲罰失分,結(jié)果就大不相同了。

在 GT Sophy 上投入了數(shù)年的精力。他桌子后面的墻上掛著一幅兩輛車爭(zhēng)搶位置的畫?!斑@是 GT Sophy 正在超越 Yamanaka,”他說。

他指的是頂尖 GT 日本車手 Tomoaki Yamanaka,他是 2021 年與 GT Sophy 比賽的四名日本職業(yè)模擬賽車手之一。

他不記得這幅畫是哪一局比賽。如果是 2021 年 10 月的比賽,Yamanaka 很可能會(huì)樂在其中,因?yàn)樗鎸?duì)的是一個(gè)強(qiáng)大但公平的對(duì)手。如果這是 2022 年 7 月份的活動(dòng),他很可能會(huì)咒罵電腦莫名其妙。

Yamanaka 的隊(duì)友 Takuma Miyazono 通過翻譯軟件向我們簡(jiǎn)單描述了 2022 年 7 月份的比賽。他說:“有幾次我們被(GT Sophy)撞出賽道,因?yàn)樗倪^彎方式太過激進(jìn)。這讓我們很生氣,因?yàn)槿祟愅婕視?huì)在轉(zhuǎn)彎時(shí)減速,以避免開出賽道?!?/p>

說,訓(xùn)練人工智能公平競(jìng)技且不失去競(jìng)爭(zhēng)優(yōu)勢(shì)是十分困難的。人類裁判會(huì)做出取決于環(huán)境的主觀判罰,這讓人們很難將它們轉(zhuǎn)化為人工智能可以學(xué)到的東西,比如哪些行為可以做,哪些不可以做。

索尼的研究人員嘗試給人工智能提供許多不同的線索,供其調(diào)用和調(diào)整,希望能找到一種有效的組合。如果它偏離賽道或撞到圍欄上,造成了車輛碰撞或可能被裁判判罰,那么它就會(huì)受到懲罰。

他們對(duì)每種懲罰的力度進(jìn)行了實(shí)驗(yàn)、觀察和調(diào)試,并且檢查了 GT Sophy 的駕駛方式會(huì)如何發(fā)生變化。

索尼還增加了 GT Sophy 在訓(xùn)練中面臨的競(jìng)爭(zhēng)。在此之前,它主要針對(duì)自身的老版本進(jìn)行訓(xùn)練。

在 2021 年 10 月份的重賽之前,索尼每隔一兩周就會(huì)邀請(qǐng)頂級(jí) GT 車手幫助測(cè)試人工智能,再綜合結(jié)果不斷調(diào)整。

“這給了我們所需的反饋,以便在攻擊性和讓步之間找到合適的平衡,”說。

這起到了效果。三個(gè)月后,當(dāng) Miyazono 與 GT Sophy 比賽時(shí),后者的激進(jìn)表現(xiàn)消失了——但它并不是簡(jiǎn)單地退縮?!爱?dāng)兩輛車并排進(jìn)入一個(gè)彎道時(shí),GT Sophy 會(huì)給人類車手留下足夠通過的空間,”他表示,“這讓你感覺是在和另一個(gè)真人比賽?!?/p>

他補(bǔ)充說:“面對(duì)這種反應(yīng),車手會(huì)得到一種不同的激情和樂趣。這真的給我留下了深刻的印象?!?/p>

對(duì)索尼的工作印象深刻。他說:“我們用人類的能力來衡量機(jī)器人技術(shù)的進(jìn)步?!钡?,他的同事埃莉亞·考夫曼(Elia Kaufman)指出,仍然是人類研究人員主導(dǎo)了 GT Sophy 學(xué)習(xí)行為的訓(xùn)練。

“良好的賽道禮儀是由人類教給人工智能的,”他說,“如果這能以自動(dòng)化的方式實(shí)現(xiàn),那將真的很有趣?!边@樣的機(jī)器不僅會(huì)有良好的賽場(chǎng)風(fēng)范,更主要的是可以理解什么是賽場(chǎng)風(fēng)范,并且能夠改變它的行為來適應(yīng)新的設(shè)置。

的團(tuán)隊(duì)現(xiàn)在正在將其 GT 賽車研究,應(yīng)用到現(xiàn)實(shí)世界的無人機(jī)比賽中,使用原始視頻輸入而不是模擬數(shù)據(jù)來訓(xùn)練人工智能飛行。2022 年 6 月,他們邀請(qǐng)了兩名世界冠軍級(jí)別的無人機(jī)飛手對(duì)抗電腦。

他說:“在看到我們的人工智能比賽后,他們的表情說明了一切。他們被震撼到了?!?/p>

他認(rèn)為,對(duì)機(jī)器人技術(shù)的真正進(jìn)步必須要拓展到現(xiàn)實(shí)世界?!霸谀M和現(xiàn)實(shí)世界之間,總是會(huì)有一種不匹配的情況,”他說,“當(dāng)人們談?wù)撊斯ぶ悄苋〉昧肆钊穗y以置信的進(jìn)步時(shí),這一點(diǎn)就被遺忘了。在戰(zhàn)略方面,是的。但就部署到現(xiàn)實(shí)世界而言,我們還差得很遠(yuǎn)?!?/p>

目前,索尼仍堅(jiān)持將技術(shù)僅用在游戲中。它計(jì)劃將 GT Sophy 用于未來版本的 GT 游戲中?!拔覀兿M@能成為產(chǎn)品的一部分,”美國(guó)的執(zhí)行總監(jiān)彼得·斯通()說。“索尼是一家娛樂公司,我們希望這能讓游戲更加有趣?!?/p>

瓊斯認(rèn)為,一旦人們有機(jī)會(huì)觀摩 GT Sophy 的駕駛過程,那么整個(gè)模擬賽車社區(qū)都可以從中學(xué)到很多東西?!霸谠S多賽道上,我們會(huì)發(fā)現(xiàn)很多沿襲了多年的駕駛技巧都是有缺陷的,實(shí)際上存在更快的方法?!?/p>

Miyazono 已經(jīng)在嘗試復(fù)制人工智能在彎道的走線方式,因?yàn)樗呀?jīng)展示了這是可以實(shí)現(xiàn)的。瓊斯說:“如果基準(zhǔn)水平發(fā)生變化,那么每個(gè)人的技術(shù)都會(huì)提升?!?/p>

責(zé)任編輯:未麗燕 來源: DeepTech深科技
相關(guān)推薦

2022-02-10 16:14:06

AI賽車游戲

2018-03-02 10:58:17

人工智能AI律師

2021-09-01 00:02:42

人工智能機(jī)器學(xué)習(xí)技術(shù)

2022-11-03 14:09:26

2012-09-06 09:30:43

工程師靈魂技術(shù)開發(fā)

2011-11-02 14:55:53

移動(dòng)游戲LBS位置識(shí)別

2024-03-27 12:46:36

AI模型

2023-08-31 14:50:18

無人機(jī)Swift

2023-09-14 10:07:38

人工智能數(shù)據(jù)管理

2024-04-08 11:13:27

AIEVI人工智能

2017-03-09 19:25:38

JavaScript代碼編輯器

2012-01-10 16:43:55

索尼Xperia SXperia Ion

2020-08-17 17:31:00

戴爾

2019-05-24 18:17:58

谷歌Android開發(fā)者

2020-06-29 14:29:07

人工智能人類工作

2025-01-26 13:07:50

2021-04-16 15:42:37

AI 數(shù)據(jù)人工智能

2020-03-19 18:08:04

戴爾

2018-10-20 15:20:10

2022-02-12 23:35:29

索尼AI元宇宙
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)