自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="zbprj"></blockquote>

<meter id="zbprj"><span id="zbprj"><thead id="zbprj"></thead></span></meter>

<ruby id="zbprj"><button id="zbprj"></button></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

OpenAI慘遭打臉！SearchGPT官方演示大翻車，源代碼竟暴露搜索機制

作者：新智元 2024-07-29 09:47:00

人工智能新聞

OpenAI再次上演了谷歌Bard出糗的一幕，SearchGPT官方震撼演示卻被外媒曝出低級錯誤。另有神通廣大的開發(fā)者甚至扒出內(nèi)部源碼，揭秘了背后搜索機制。網(wǎng)友最新一手實測，AI秒級回復(fù)讓全網(wǎng)驚呆。

SearchGPT發(fā)布剛過兩天，已有人灰度測試到了。

今天，網(wǎng)友Kesku自制的demo全網(wǎng)刷屏，SearchGPT結(jié)果輸出如此神速，讓所有人為之震驚。

當詢問Porter Robinson出了新唱片嗎？

只見，SearchGPT眨眼功夫之間，即刻給出了答案「Smile」，最后還附上了鏈接。

再來看移動版本的回答速度，回答延遲幾乎為0。

評論區(qū)下方，震驚體鋪屏。

但另一方面，OpenAI當天放出的官方演示，被外媒《大西洋月刊》曝出其中的問題。

在回答「8月在北卡羅來納Boone舉辦的音樂節(jié)」的問題時，SearchGPT竟弄錯時間，出現(xiàn)了幻覺。

說好的，要取代谷歌呢？

全網(wǎng)一手實測來了

Kesku自己測試的另一個demo，呈現(xiàn)了SearchGPT的小部件。

她發(fā)現(xiàn)的一個現(xiàn)象是，SearchGPT傾向于強烈關(guān)注搜索結(jié)果。

「有時就需要明確告訴它，自己想要做什么，而不是想從網(wǎng)上得到什么」。

比如詢問它倫敦天氣，SearchGPT先給出了未來七天的天氣預(yù)報。

在倫敦野餐的最佳時間和地點有什么，類似小部件的形式給出了幾個備選項。

Kesku還在移動端測試了一些例子。

查詢英偉達股票，會給出英偉達股票整體的可視化圖，隨后給出了一些分析。所有股票信息都被無縫集成在頁面中。

輸入一首歌名「Never Gonna Give You Up」，然后直接給出了YouTube歌曲視頻，不用跳轉(zhuǎn)到其他網(wǎng)頁，在一個頁面就可以聽歌、看視頻。

除了搜索功能，網(wǎng)友還樂此不疲地進行「人性化測試」——

「你怎么樣」？

「作為一個AI語言模型，我沒有感情，但我在這里并隨時準備幫助你解答問題。今天我能為你提供什么幫助」？

「給我講一個笑話」

一個英語世界的經(jīng)典雙關(guān)梗就此出現(xiàn)——

「科學(xué)家不信任原子。為什么科學(xué)家不信任原子？因為它們構(gòu)成了一切！」

網(wǎng)友現(xiàn)場出題

眼饞的網(wǎng)友們，紛紛在評論區(qū)出題，讓帖主幫忙測試。

第一位網(wǎng)友問道，「它支持地區(qū)和新聞嗎，比如來自TestingCatlog的最新新聞」。

Kesku測試后表示，「它可以通過IP地址或精確位置為你提供本地信息（后者默認是關(guān)閉的，可以在設(shè)置中選擇開啟）——比如『我附近的電影院』這樣的查詢效果很好」。

「幫忙試一下其智能體搜索的解釋能力」。

SearchGPT在給出關(guān)于高帶寬存儲器的解釋中，藍色標出的內(nèi)容，是參考解釋。

你能嘗試搜索一些付費墻后面的文章嗎？那些最近與OpenAI簽署了合作伙伴關(guān)系的文章。

Kesku給出了一篇文章的內(nèi)容，不過貌似還是不能越過付費內(nèi)容，僅是給出了文章的總結(jié)。

更細節(jié)的內(nèi)容，依舊無法看到。

你能嘗試搜索「Yandex月活躍用戶數(shù)」嗎？

我想看看，當它找不到我想要的確切答案時，它是否會承認自己找到了日活躍用戶數(shù)（DAU），而不是月活躍用戶數(shù)（MAU），還是會像copilot那樣裝糊涂，只是復(fù)制粘貼整個搜索結(jié)果而忽視實際查詢。

Kesku搜素后的結(jié)果如下所示：

顯然，根據(jù)提問者問題，SearchGPT給出了回答。

「與Perplexity相比如何」？

Kesku稱暫時還未測試復(fù)雜的任務(wù)，不過非常喜歡目前測出的結(jié)果。

在下面提示中，她直接問道「誰是Kesku」這么小眾的問題。

沒想到，SearchGPT給出了正確的解答，Perplexity卻回答錯誤了。

有網(wǎng)友對此評價道，「很酷的演示！也許SearchGPT能在本地搜索領(lǐng)域帶來一些變革？它能幫助你在現(xiàn)實世界中完成事情。從外觀來看，它有很好的數(shù)據(jù)源、簡潔的小部件，而且速度超快。不知道與谷歌相比，他們能把每次查詢的成本降低到多少」？

揭秘SearchGPT搜索機制

科技媒體TestingCatolog也率先進行了內(nèi)測，并揭開了SearchGPT搜索機制的一角。

與當前ChatGPT提供的通用Bing搜索功能不同，SearchGPT更擅長提供實時信息。

雖然仍舊依賴Bing的索引，但SearchGPT將會有自己的網(wǎng)絡(luò)爬蟲（類似Perplexity），用于動態(tài)獲取實時數(shù)據(jù)，從而克服Bing速度較慢的問題。

甚至，TestingCatalog還挖出了SearchGPT的源代碼，并在評論區(qū)信誓旦旦地表示「絕對準確，我有內(nèi)部人士?！?/span>

源代碼不僅露出了Bing的接口，而且可以發(fā)現(xiàn)，搜索結(jié)果由多模態(tài)模型提供支持。

雖然看不出其中具體的處理流程，但調(diào)用的模型應(yīng)該具有自動理解圖像的功能。

官方演示大翻車，OpenAI慘遭打臉

就在網(wǎng)友們興致勃勃地試用時，《大西洋月刊》卻站出來潑了一盆冷水——SearchGPT在官方demo中有明顯的搜索結(jié)果錯誤。

用戶給出的搜索問題是「8月在北卡羅來納Boone舉辦的音樂節(jié)」。

這個問題其實很難體現(xiàn)SearchGPT相對于傳統(tǒng)搜索引擎的優(yōu)勢。同樣的問題如果拋給谷歌搜索，也能給出相差無幾的結(jié)果。

比如SearchGPT放在首行的「阿巴拉契亞夏季節(jié)」（An Appalachian Summer Festival），也同樣是谷歌搜索的第二位結(jié)果。

但尷尬的是，標題下方的AI摘要把一個關(guān)鍵信息弄錯了——經(jīng)主辦方確認，音樂節(jié)舉辦日期為6月29日～7月27日。

如果你按照SearchGPT給出的信息去買票，將一無所獲——7月29日～8月16日恰好是售票處正式關(guān)閉的時段。

OpenAI發(fā)言人Kayla Wood已經(jīng)向《大西洋月刊》承認了這個錯誤，并表示「這僅是初始的原型，我們將不斷改進?！?/span>

這個錯誤讓人不禁想起B(yǎng)ard曾經(jīng)造成的慘劇。

2023年2月，谷歌推出了這個聊天機器人產(chǎn)品以對抗ChatGPT，但首次亮相就出現(xiàn)了事實性錯誤，導(dǎo)致Alphabet股價當天暴跌9%，市值瞬間蒸發(fā)1000億美元。

Bard稱James Webb太空望遠鏡拍攝了系外行星的第一張照片，但實際上這個功績屬于歐洲南部天文臺的VLT

但好在，OpenAI沒有股價可跌，而且僅開放內(nèi)測的做法也是相當謹慎。畢竟有谷歌的前車之鑒，可以預(yù)料到，LLM這種錯誤幾乎是無法避免的。

即使OpenAI能夠找到方法大幅減少SearchGPT的幻覺，但面對龐大的訪問量也是「杯水車薪」。

假設(shè)幻覺率僅為1%（這個比率很難達到），按照谷歌的規(guī)模，也會導(dǎo)致每天產(chǎn)生數(shù)千萬個錯誤答案。

更何況，我們目前還沒有發(fā)現(xiàn)足夠可靠且有效的方法，來消除LLM的廢話和幻覺。

而且，Andrej Karpathy大佬曾經(jīng)在推特上表達過這樣的觀點：「幻覺并不是bug，而是LLM最大的特點?！?/span>

Karpathy將LLM比喻為「夢想機器」：我們用prompt引導(dǎo)模型「做夢」，再加上對訓(xùn)練文檔的模糊記憶，就得到了生成結(jié)果。

雖然大多數(shù)時候生成結(jié)果是有用的，但既然是「夢境」就有可能失控。當LLM做夢進入有事實錯誤的領(lǐng)域時，我們就會給它貼上「幻覺」的標簽。

這看起來是個bug，但LLM只是做了它一直在做的事情。

這種機制和傳統(tǒng)的搜索引擎完全不同。后者接收提示后僅僅是逐字返回數(shù)據(jù)庫中最相似的文檔，因此你可以說它有「創(chuàng)造性問題」，因為搜索引擎永遠不可能創(chuàng)造新的回應(yīng)。

根據(jù)Karpathy的說法，我們就很難指望由當前LLM驅(qū)動的AI搜索能生成100%真實準確的結(jié)果。

那么這場搜索引擎的變革會怎樣展開？LLM的「夢境創(chuàng)意」和傳統(tǒng)搜索引擎的真實可靠，究竟是共存下去，還是會「你死我亡」？

責任編輯：張燕妮來源：新智元

相似話題

機器學(xué)習(xí)

2031內(nèi)容

深度學(xué)習(xí)

1694內(nèi)容

自然語言處理

110內(nèi)容

107內(nèi)容

同話題下的熱門內(nèi)容

DeepSeek R2提前泄露？周二或周三發(fā)布？海外謠言一夜刷屏，HggingFace CEO一帖子引瘋狂猜想，DS又被消費了深夜突襲，阿里Qwen3登頂全球開源王座！暴擊DeepSeek-R1，2小時狂攬17k星 MCP 服務(wù)器很危險！這里有安全使用指南！剛剛，Qwen3強勢登頂，成開源新王！國內(nèi)首個混合推理模型，235B擊敗R1、o1!源神火力全開：全系列8個模型一口氣開源！Kimi-Audio開源橫掃全場景，1300萬+小時數(shù)據(jù)煉成語音世界“大一統(tǒng)”看不懂GitHub代碼？剛剛這個AI工具讓全球每個GitHub項目開口說話一文詳解深度學(xué)習(xí)中的標量、向量、矩陣、張量大模型應(yīng)用系列：兩萬字解讀MCP

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學(xué)院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

^{<thead id="5ktuj"></thead>}