自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT-4o手寫板書以假亂真驚呆網(wǎng)友!殺死谷歌翻譯,代碼建模無所不能

人工智能 新聞
GPT-4o到底有多強?只有用過才能知道。這兩天,網(wǎng)友們不僅探索出了很多全新ChatGPT的炫酷用法,也逐漸開始意識到,這標志這OpenAI將逐漸替代谷歌曾經(jīng)的地位,全面接管AGI時代。

GPT-4o到底有多強?只有用過才能知道。這兩天,網(wǎng)友們不僅探索出了很多全新ChatGPT的炫酷用法,也逐漸開始意識到,這標志這OpenAI將逐漸替代谷歌曾經(jīng)的地位,全面接管AGI時代。

隨著越來越多人開始試用GPT-4o,大家發(fā)現(xiàn)發(fā)布會上的demo真的只是冰山一角,官方后續(xù)發(fā)出的用例以及網(wǎng)友們的整活才是更精彩的部分。

生成手寫體文字

OpenAI聯(lián)創(chuàng)Greg Brockman今天po出一張GPT-4o生成的圖片,他興奮地宣布:

「僅用GPT-4o的圖像生成功能就可以探索很多東西。團隊正在努力將這些內(nèi)容推向世界」

可以看到,這張圖片中,黑板上的手寫體達到了以假亂真的程度!

網(wǎng)友表示,看到這張圖片的一瞬間還以為是Greg講座現(xiàn)場的板書呢。

圖片

不知道筆跡專家看到了會作何感想,是否能讀解出這面黑板上「機器書寫」背后的人格特征呢?

看來GPT-4o不僅能模仿人類的語音語調(diào),連字體也開始向人類手寫體接近了。

1分鐘從屏幕截圖生成視頻游戲

推特網(wǎng)友從網(wǎng)上找了一張Breakout游戲的截圖,丟給ChatGPT并問它「你能把這個用Python編碼出來嗎?」

一分鐘之后,ChatGPT就生成了一份沒有bug、可以直接執(zhí)行的Python文件,完全復(fù)刻了截圖的效果。

而且Breakout這個游戲也是大有來頭,是一款1976年雅達利公司發(fā)行的街機視頻游戲,Steve Jobs和Steve Wozniak曾經(jīng)參與設(shè)計和開發(fā)工作。

用文字提示進行3D建模

前幾天,有人曾經(jīng)放出用GPT-4o將平面圖片進行3D重建的之后的效果,已經(jīng)十分驚艷。

圖片

但沒想到,GPT-4o生成3D效果甚至都不需要給它平面圖片,一段文字提示就夠了,比如下面這個用戶讓ChatGPT創(chuàng)建一個STL文件,建模一個有四條腿的桌子,并添加一些隨機特征。

ChatGPT不僅能給你渲染出的3D效果圖,還能馬上出一份原始的STL文件,就不用自己費力從頭開始建模了。

圖片

這一版ChatGPT的更新就是瞄準了個人AI助手的方向,工作狂Sam Altman最近在接受采訪時,也分享了自己使用ChatGPT提高工作效率的方法。

圖片

他說,在電腦上工作時,想搜索一些東西就不得不在頁面之間不斷切換。有了ChatGPT在旁邊,就可以「隨叫隨到」直接問它,讓自己能始終保持在專注的狀態(tài)。

GPT-4o vs. 谷歌翻譯

OpenAI的發(fā)布會展示了GPT-4o的實時翻譯能力,實現(xiàn)了英語和意大利語之間的無縫轉(zhuǎn)換,幾乎沒有響應(yīng)延遲,讓網(wǎng)友再次驚呼「翻譯要失業(yè)了」,這次連同聲傳譯行業(yè)也要一鍋端了。

與此同時,也掀起了一場和谷歌翻譯之間的較量。

有網(wǎng)友表示「谷歌和三星在手機上開發(fā)過類似的功能,但是做得很爛。你必須要說得很慢,而且確保吐字清晰,不然識別出的文本就會一團糟,也得不到正確的翻譯。」

圖片

谷歌翻譯到了要和大家說再見的時候了嗎?隨著OpenAI的語言能力不斷擴展,這并非完全沒有可能。

GPT-4o使用了新的分詞器,不僅英語的效率更高(token減少了1.1倍),而且還提高了許多其他語言的使用效率。

Greg Brockman發(fā)文稱「我們還顯著提高了非英語語言的性能,包括改進分詞器以更好地壓縮其中的許多語言」。

OpenAI現(xiàn)在支持50多種語言,從Greg Brockman放出的圖片中可以看出,包括阿拉伯語、俄語、印地語在內(nèi)的多種語言的token數(shù)量都得到了壓縮。

但是,OpenAI的翻譯功能也并非無懈可擊,有很多網(wǎng)友質(zhì)疑發(fā)布會上ChatGPT生成的意大利語聽起來有點奇怪。

圖片

于是有意大利用戶在線答疑,「其實這不是一種口音,只不過是AI語音在單詞之間插入了間隙。說英語時還好,但在意大利語中,這聽起來非常奇怪和呆板,因為它擾亂了節(jié)奏?!?/span>

更要命的是,GPT-4o分詞器語料庫中,中文數(shù)據(jù)污染非常嚴重。

圖片

面對這種景象,網(wǎng)友不禁感嘆「為什么GPT-4o如此horny?」

既然這樣,還是多用GPT-4o「練習(xí)練習(xí)英語」吧。

圖片

「后瀏覽器世界」:ChatGPT后再無谷歌搜索

OpenAI同時發(fā)布了兩項成果:GPT-4o及其新的ChatGPT桌面應(yīng)用程序。有專家預(yù)測,雖然 GPT-4o因其多模態(tài)而大放異彩,賺足了眼球,但桌面應(yīng)用程序才有可能真正挑戰(zhàn)谷歌主導(dǎo)地位,改變當今互聯(lián)網(wǎng)的形態(tài)。

GPT-4o的主要特點是多模態(tài)和低成本的低延遲,實現(xiàn)了人機之間更自然的對話和交互,而且與GPT-4Turbo相比似乎有了模型能力和智能的增長。

但當我們回顧幾年后的2024年5月13日時,最重要的消息可能是ChatGPT桌面應(yīng)用程序。

ChatGPT桌面應(yīng)用程序?qū)⑾葘acOS適用,隨后推出Windows版本,目前官網(wǎng)已發(fā)布了移動端iOS和安卓系統(tǒng)的下載鏈接。

該應(yīng)用程序可以快速訪問ChatGPT,并且你可以選擇讓它「透視」你的屏幕,實現(xiàn)「看你所看」,還可以像使用ChatGPT一樣,和它實時語音交互。

這完全超出了傳統(tǒng)瀏覽器的功能想象,從瀏覽器進入桌面,OpenAI邁出的這一小步,有可能是人機交互方式向前發(fā)展的一大步,OpenAI希望的,是完成一場「搜索革命」。

圖片

圖片

OpenAI希望擺脫瀏覽器并進入桌面

瀏覽器是舊的互聯(lián)網(wǎng),萬維網(wǎng)的世界是谷歌的主場。

但OpenAI對這種舊的方式say no,它帶來是一種使用計算機和網(wǎng)絡(luò)的新方式——一個可以為用戶完成一切的助手,用戶需要什么,只需大聲說出來。

Sam Altman在他關(guān)于GPT-4o的博客文章中明確表示「對我來說,與計算機對話從來沒有感覺很自然,但現(xiàn)在情況發(fā)生了改變。隨著我們增加(可選的)個性化功能、訪問你的信息、協(xié)助你采取行動,我真的看到了一個令人興奮的未來,我們能夠利用計算機做比以往更多的事情?!?/span>

ChatGPT桌面應(yīng)用程序可以獲取訪問麥克風(fēng)、攝像頭、文件、登錄信息以及用戶屏幕的權(quán)限,是「個人助手」的最佳位置。

有了這個「助手」,即使是智能手機用戶,也很難被谷歌和網(wǎng)絡(luò)所吸引。

在這種與計算機交互的新方式中,萬維網(wǎng)幾乎沒有立足之地。充其量,它充當?shù)氖切畔⒌奶峁┱摺?/span>

事實上,OpenAI將自己定位為聊天機器人生態(tài)系統(tǒng)的看門人,它推出了「出版商優(yōu)選計劃」,正在把選定的媒體機構(gòu)發(fā)展成為合作伙伴,美聯(lián)社、Axel Springer、金融時報、世界報等媒體已加入該計劃。

圖片

如果OpenAI 成功(目前還無法確定),那么它對我們信息生態(tài)系統(tǒng)的市場影響力將遠遠超過今天的谷歌。

責(zé)任編輯:張燕妮 來源: 新智元
點贊
收藏

51CTO技術(shù)棧公眾號