桌面版ChatGPT登臺(tái)演講,能視頻通話還會(huì)實(shí)時(shí)讀屏,GPT-4o demo再次驚艷:“能力還是被低估了”
GPT-4o桌面端最新Demo,與Sora的新作品一同亮相“歐洲AI春晚”VivaTech。
現(xiàn)場(chǎng),OpenAI工作人員不僅展示了觀眾期待已久的“視頻通話”,還試著讓ChatGPT發(fā)表了演講。
在視頻聊天當(dāng)中,即使給它的只有一幅抽象的簡(jiǎn)筆畫(huà),它也能立馬get到這是巴黎地標(biāo)。
然后再給它看一眼地鐵圖,指一指當(dāng)前位置,就能火速設(shè)計(jì)出乘車(chē)路線。
而且,除了能像移動(dòng)端一樣通過(guò)攝像頭感知環(huán)境之外,桌面端的ChatGPT還能夠?qū)ζ聊粌?nèi)容進(jìn)行讀取,結(jié)合代碼現(xiàn)場(chǎng)debug。
一系列震撼的演示效果,讓前線的Tom’s Guide編輯Ryan Morrison感嘆,GPT的語(yǔ)音功能和GPT-4o的潛力,看來(lái)是被低估了。
桌面端“視頻通話”震撼全場(chǎng)
在現(xiàn)場(chǎng)給400多名觀眾演示ChatGPT最新功能的,是OpenAI開(kāi)發(fā)者體驗(yàn)主管Romain Huet。
本來(lái)Huet打算用手機(jī)來(lái)演示,結(jié)果受到現(xiàn)場(chǎng)技術(shù)條件限制無(wú)法展示,于是改用Mac,但也正是如此觀眾們才有機(jī)會(huì)看到它的屏幕讀取能力。
一開(kāi)始,Huet問(wèn)ChatGPT能不能給現(xiàn)場(chǎng)的觀眾講一點(diǎn)什么,然后ChatGPT真就像模像樣地打起了招呼。
不過(guò)Huet覺(jué)得這樣的開(kāi)場(chǎng)白還不夠有氣勢(shì),于是提示它面前是一大群人,它馬上就心領(lǐng)神會(huì),改用了更“燃”的措辭和語(yǔ)氣。
當(dāng)然,Huet沒(méi)有讓ChatGPT一直講下去,而是在做完開(kāi)場(chǎng)白之后改由自己來(lái)介紹其最新功能。
所有對(duì)話,即使跨越語(yǔ)言也能快速響應(yīng),現(xiàn)場(chǎng)Huet就要求ChatGPT把自己說(shuō)的英文翻譯成法語(yǔ),整個(gè)過(guò)程行云流水。
另外,看上去是bug,但也許是feature的一點(diǎn)是,翻譯出的法語(yǔ)還帶著一些美國(guó)口音,不過(guò)Huet表示之后會(huì)進(jìn)行優(yōu)化,讓ChatGPT說(shuō)外(非英)語(yǔ)時(shí)更像當(dāng)?shù)厝恕?/p>
又是一通補(bǔ)充講解之后,人們期待的“視頻通話”功能終于正式登場(chǎng)了。
只見(jiàn)Huet現(xiàn)場(chǎng)用筆畫(huà)出了埃菲爾鐵塔和凱旋門(mén)的草圖,結(jié)果ChatGPT只看了一眼就直接識(shí)破。
Huet自己也打趣地對(duì)它說(shuō),”非常感謝你,我畫(huà)的這么爛你都能看懂?!?/p>
這還沒(méi)完,Huet緊接著又掏出了一張巴黎地鐵圖,用手指了指當(dāng)前的大概位置。
然后,ChatGPT立刻就給出了前往埃菲爾鐵塔的乘車(chē)路線,隨著Huet的一句Thank You,現(xiàn)場(chǎng)爆發(fā)了潮水般的掌聲。
當(dāng)然,最新的ChatGPT不僅能拿來(lái)讀取攝像頭畫(huà)面,也能實(shí)時(shí)讀取屏幕和剪貼板當(dāng)中的內(nèi)容。
作為OpenAI負(fù)責(zé)開(kāi)發(fā)者體驗(yàn)的主管,Huet和ChatGPT一起現(xiàn)場(chǎng)搞起了代碼。
Huet通過(guò)復(fù)制到剪貼板的方式,讓客戶(hù)端讀取了一段React框架編寫(xiě)的網(wǎng)頁(yè)代碼,結(jié)果ChatGPT立馬就把代碼的語(yǔ)言、功能介紹得頭頭是道。
甚至還當(dāng)眾進(jìn)行了Debug,通過(guò)讓ChatGPT讀取屏幕,Huet告訴它目前這個(gè)網(wǎng)頁(yè)存在不能根據(jù)屏幕寬度進(jìn)行適配的問(wèn)題。
通過(guò)幾輪對(duì)話,Huet成功借助ChatGPT的幫助,完美解決了這個(gè)問(wèn)題,再次收獲了觀眾的掌聲。
One More Thing
在現(xiàn)場(chǎng),Huet還播放了一段用Sora為大會(huì)創(chuàng)作的新視頻,由于現(xiàn)場(chǎng)生成時(shí)間較長(zhǎng),觀眾看到的視頻預(yù)先制作好的,這也是活動(dòng)中唯一一個(gè)提前做好的效果。
一同展示的還有聲音克隆引擎Voice Engine,Huet錄制了一段20秒的聲音樣本,并用VE進(jìn)行了完美復(fù)刻,而且只需一個(gè)按鈕,就能從英語(yǔ)切換到法語(yǔ)、日語(yǔ)等其他語(yǔ)言,并在Sora中應(yīng)用。
不過(guò)由于安全問(wèn)題仍未解決,Sora和Voice Engine依舊不能公開(kāi)發(fā)布,想體驗(yàn)的朋友要再等一等了。
另外,說(shuō)到克隆聲音的問(wèn)題,寡姐和OpenAI關(guān)于Sky的爭(zhēng)議剛好也有了新消息。
華盛頓郵報(bào)稱(chēng),根據(jù)其所獲得的文件和錄音顯示,給Sky配音的女演員的確另有其人。
而且,寡姐所稱(chēng)的受到奧特曼邀請(qǐng)發(fā)生在去年9月,而配音演員的招募在5月就已開(kāi)始。
不過(guò),仍然有網(wǎng)友認(rèn)為,就算真的是另找了一名演員,也不能說(shuō)明OpenAI就沒(méi)有模仿寡姐的意圖。
但無(wú)論OpenAI的意圖如何,真正給Sky配音的演員卻是無(wú)辜的,也有表演的權(quán)利。
不少網(wǎng)友發(fā)聲對(duì)她表示同情:
Sky的配音演員同樣有權(quán)利使用她自己的聲音,難道因?yàn)椋ü呀悖┦敲?,所擁有的知識(shí)產(chǎn)權(quán)就比普通人更多嗎?
進(jìn)一步地,我認(rèn)為雖然“OpenAI侵犯了寡姐的‘公開(kāi)權(quán)’”這個(gè)觀點(diǎn)比單純的侵犯知識(shí)產(chǎn)權(quán)的想法好些,但仍然站不住腳。
總之,寡姐拋向OpenAI的子彈仍未落地,我們不妨一邊吃瓜,一邊等待著GPT-4o視頻對(duì)話的正式更新。