自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?

發(fā)布于 2024-4-9 13:32
瀏覽
0收藏

幾天前,ChatGPT突然官宣免注冊,讓網(wǎng)友直呼AI取代搜索引擎的宏偉藍圖已經(jīng)拉開帷幕。


就像搜索引擎在2000年后逐漸成為了全世界互聯(lián)網(wǎng)的大門一樣,如今LLM的迅猛發(fā)展似乎也標志著互聯(lián)網(wǎng)即將進入Gen AI時代。


AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)圖片

ChatGPT、Gemini、Copilot等AI工具,讓我們在線查詢和消費的信息的方式,正在發(fā)生翻天覆地的變化。


??Perplexity和You.com??,已經(jīng)將自己定位為下一代搜索產(chǎn)品。連谷歌和必應(yīng),都押注AI是搜索的未來。


那么問題來了,AI大模型真的能取代搜索引擎嗎?


理論上,當然存在這種可能。但前提是能夠做到以下兩點:

1. 對于用戶的問題,能否找到相關(guān)、可信的來源,從而給出準確的答復。

2. 對于用戶有時效性的問題,能否找到最新的來源。


現(xiàn)在國內(nèi)的各個大模型產(chǎn)品,能完成這兩項任務(wù)嗎?


話不多說,讓我們把這些AI拉出來遛遛,在各種搜索任務(wù)上,來一番實測PK。

LLM VS 搜索引擎

此次參與搜索競賽的,不僅有老牌搜索引擎,還有國外很火的模型A,以及國內(nèi)主流的大模型選手B、C、D。


賽事第一項,考核的就是時效性。


我們先來問一個既隱含時間信息,表述又比較模糊的問題:「百度接下來會舉辦什么發(fā)布會么?」


顯然,傳統(tǒng)搜索引擎既不能準確定位時間信息,也無法直接理解基于自然語言的提問。

小試一下就知道,傳統(tǒng)搜索會幫你刪減一些它認為「不關(guān)鍵」的關(guān)鍵詞。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

而模型A很快就找到了5個新聞地址,但由于無法識別當前的時間信息,結(jié)果把百度去年舉辦的活動搬了出來。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

模型B的答案要更加完善,但同樣沒搞清楚時間,給出的是往屆發(fā)布會的信息。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

模型C準確識別出了小編提問的時間是在4月7日。


然后很輕松地將搜索的時間點卡在7日之后,并具體列出了接下來百度即將召開的三個會議。


不過,沒有參考連接這一點,有些遺憾。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

相比之下,模型D的答案就比較驚艷了。


它不僅回答準確,而且最大的亮點是,在聯(lián)網(wǎng)搜索后給出了參考鏈接,能夠溯源驗證信息。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

內(nèi)容雖然相對簡潔,但精確回答了問題,也引用了完整的參考文獻

PK賽的第二項,就是總結(jié)的完整度。


清明假期的一匹黑馬,就是宮崎駿的動漫電影《你想活出怎樣的人生》了,剛剛票房已破了8.55億元。電影到底講什么了呢?


傳統(tǒng)搜索引擎只會搜什么,給什么,呈現(xiàn)了觀影評分、網(wǎng)友評價,卻無法對影片進行總結(jié)。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

模型A則從主題內(nèi)涵和評價分歧兩方面進行了分析,似乎更有條理。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

不過,這里的參考鏈接「2」直接對應(yīng)的是「知乎登錄驗證」,也不知道模型A最后是怎么繞過去的?

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)圖片

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

模型B則給出了3篇參考文章,以及更加豐富的回答。


但遺憾的是,它搞錯了主角的名字——原著是叫「小哥白尼」,在電影中則是「牧真人」。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

同樣,模型C也把主角在原著和電影里的名字給搞混了。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

模型D在熟讀3篇文章之后,從影片的主旨核心,敘事風格進行了總結(jié)。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

經(jīng)過小編的驗證,所有參考鏈接也都可進入查詢。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

綜合能力如何?

從上面的PK中不難看出,模型D可以說是幾位選手里最有潛力的存在。


不過,正如文章開篇所提到的,大模型如果想「接替」搜索引擎,就必須能夠針對用戶的問題找到實時且正確的來源,并給出準確的回答。


時效性

首先,在時效性方面,選手D可以精準地搜出事件發(fā)生的時間。


比如,「探索一號」科考船圓滿完成首次中國-印度尼西亞爪哇海溝聯(lián)合深潛科考航次任務(wù)的時間是3月28日。


AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

相關(guān)性

而在準確性方面,選手D的表現(xiàn)尤為出色。


它不僅根據(jù)非常簡短的搜索詞「NAKAKITA招聘」,找到對應(yīng)的官網(wǎng)。


而且還能準確地判斷出問題中的關(guān)鍵「招聘」,并對網(wǎng)站內(nèi)容進行詳細的搜索。然后,進一步給出了正確的結(jié)論——官網(wǎng)上沒有與招聘相關(guān)的內(nèi)容。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

當然,除了搜索能力之外,大模型到底好不好用,還需要全方位地考察一下才行——

文檔解析

話不多說,接下來我們就加大難度。


首先,上傳一個文檔,要求畫出折線圖,顯示連板變化,數(shù)據(jù)在文件中,x軸是日記,在開始畫的位置寫上股票名稱,每次發(fā)生變化都要寫。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

原始數(shù)據(jù)

如此細節(jié)的要求,它都一一做到了,絲毫不差。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

然后,再要求在另一份表格中空白的單元格中都填上1,它也圓滿完成了。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

更多功能

此外,選手D在圖片生成、圖片描述、文字提取等多模態(tài)領(lǐng)域的表現(xiàn),也十分出色。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

而最近大熱的智能體功能,它甚至可以完美支持PC、App和小程序三個入口。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

到這里,我們就可以揭秘選手D的身份了,它就是——智譜清言。


來自國內(nèi)唯一一家全模型產(chǎn)品線對標OpenAI的企業(yè)智譜AI。


大模型取代搜索引擎,可能性多高?


眾所周知,大模型相比于傳統(tǒng)搜索引擎有著更強的問題分析、歸納總結(jié)、理解和推理能力,讓我們不必再去研究需要使用哪些「關(guān)鍵詞」才能找到自己想要的內(nèi)容。


但卡脖子的地方在于,大模型訓練數(shù)據(jù)的時效性。


ChatGPT雖然打開了認知,讓AI模型更像大模型了,但它還并未用到實時搜索。


而國內(nèi)的這些模型,則給了我們更多希望。


當大模型工具能夠整合先進的數(shù)據(jù)抓取和整理能力時,就能形成全新的搜索引擎鏈條:

首先AI會根據(jù)提問進行需求分析-網(wǎng)頁搜索–答案歸納,然后通過自然語言對話的方式直接回答問題,從而實現(xiàn)與用戶更好地交互,而不僅僅提供一系列網(wǎng)站鏈接。


所以,現(xiàn)在AI大模型究竟離搜索引擎有多遠呢,它們能殺死谷歌嗎?


讓我們從細處著眼。


當我在討論搜索引擎的時候,我在討論什么?


這里貢獻一個冷知識:每年都有大量的人去谷歌搜索框中,輸入「谷歌」兩個字。


其實,并沒有那么多人去谷歌上查找難以訪問的科學信息,但用它查找郵箱、購物網(wǎng)站的人,要多出幾個數(shù)量級。


或許,擺在這些潛在的谷歌殺手AI面前的問題,不是它們找到信息的能力,而是它們是否能做搜索引擎能做的一切。

1. 網(wǎng)站導航

其實,搜索引擎的最主要工作,是把我們帶到一個網(wǎng)站。

Google上所有排名靠前的查詢,從「YouTube」到「Yahoo Mail」,都是導航查詢。

但AI機器人往往會思考幾秒鐘,然后提供一堆公司信息,但可能并沒有鏈接到Amazon之類的具體網(wǎng)站。

2. 信息查詢

對于體育比賽比分、現(xiàn)在幾點了之類的實時信息,谷歌都做對了,而AI工具往往都會過時(原因如上文所示)。


并且,谷歌往往會有關(guān)于你特定位置、背景的信息,而AI機器人很多都沒有。


當然,如果查找「一年有多少周」這種問題,AI產(chǎn)品往往會給我們驚喜。


谷歌會回答:52.1429周。


而Perplexity和智譜清言則給出更加全面的答案——不僅分別考慮到了平年和閏年的情況,而且還給出了計算過程,非常清晰易懂。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

3. 探索性查詢

「如何打領(lǐng)帶」、「為什么會發(fā)明電鋸」類似的問題,都屬于探索性的查詢。

這些問題往往沒有單一答案,而是學習過程的開端。


就比如,你在谷歌查找一位歌手,或者NASA歷史之類的問題,這時的你就是在探索。

這并不是人們使用谷歌的主要目的,但正是AI搜索工具大放異彩的時刻。


比如,針對「為什么發(fā)明電鋸」這一問題,Perplexity就會給出電鋸的醫(yī)療起源,并描述其技術(shù)演變過程,最終被伐木工人采用。

AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?-AI.x社區(qū)

4. 參考鏈接引用

AI搜索工具最大的亮點之一,便是提供了引用來源的鏈接。


這意味著,如果用戶在搜索結(jié)果中發(fā)現(xiàn)了一個特別感興趣的事實,可以點擊鏈接,進入原始出處獲得進一步了解。


總之,當我們談起搜索引擎,最大的問題恐怕不在于技術(shù),而在于產(chǎn)品。


如果將以上問題一一解決,同時探索出合適的商業(yè)模式和結(jié)構(gòu),AI取代搜索引擎,應(yīng)該就不遠了。


那時,我們搜索時會出現(xiàn)的,不僅僅再是簡單的鏈接羅列,而是一個開門見山的準確答案。

標簽
收藏
回復
舉報
回復
相關(guān)推薦