AI大模型搜索之戰(zhàn)開啟,勝出黑馬竟是ta?
幾天前,ChatGPT突然官宣免注冊,讓網(wǎng)友直呼AI取代搜索引擎的宏偉藍圖已經(jīng)拉開帷幕。
就像搜索引擎在2000年后逐漸成為了全世界互聯(lián)網(wǎng)的大門一樣,如今LLM的迅猛發(fā)展似乎也標志著互聯(lián)網(wǎng)即將進入Gen AI時代。
圖片
ChatGPT、Gemini、Copilot等AI工具,讓我們在線查詢和消費的信息的方式,正在發(fā)生翻天覆地的變化。
??Perplexity和You.com??,已經(jīng)將自己定位為下一代搜索產(chǎn)品。連谷歌和必應(yīng),都押注AI是搜索的未來。
那么問題來了,AI大模型真的能取代搜索引擎嗎?
理論上,當然存在這種可能。但前提是能夠做到以下兩點:
1. 對于用戶的問題,能否找到相關(guān)、可信的來源,從而給出準確的答復。
2. 對于用戶有時效性的問題,能否找到最新的來源。
現(xiàn)在國內(nèi)的各個大模型產(chǎn)品,能完成這兩項任務(wù)嗎?
話不多說,讓我們把這些AI拉出來遛遛,在各種搜索任務(wù)上,來一番實測PK。
LLM VS 搜索引擎
此次參與搜索競賽的,不僅有老牌搜索引擎,還有國外很火的模型A,以及國內(nèi)主流的大模型選手B、C、D。
賽事第一項,考核的就是時效性。
我們先來問一個既隱含時間信息,表述又比較模糊的問題:「百度接下來會舉辦什么發(fā)布會么?」
顯然,傳統(tǒng)搜索引擎既不能準確定位時間信息,也無法直接理解基于自然語言的提問。
小試一下就知道,傳統(tǒng)搜索會幫你刪減一些它認為「不關(guān)鍵」的關(guān)鍵詞。
而模型A很快就找到了5個新聞地址,但由于無法識別當前的時間信息,結(jié)果把百度去年舉辦的活動搬了出來。
模型B的答案要更加完善,但同樣沒搞清楚時間,給出的是往屆發(fā)布會的信息。
模型C準確識別出了小編提問的時間是在4月7日。
然后很輕松地將搜索的時間點卡在7日之后,并具體列出了接下來百度即將召開的三個會議。
不過,沒有參考連接這一點,有些遺憾。
相比之下,模型D的答案就比較驚艷了。
它不僅回答準確,而且最大的亮點是,在聯(lián)網(wǎng)搜索后給出了參考鏈接,能夠溯源驗證信息。
內(nèi)容雖然相對簡潔,但精確回答了問題,也引用了完整的參考文獻
PK賽的第二項,就是總結(jié)的完整度。
清明假期的一匹黑馬,就是宮崎駿的動漫電影《你想活出怎樣的人生》了,剛剛票房已破了8.55億元。電影到底講什么了呢?
傳統(tǒng)搜索引擎只會搜什么,給什么,呈現(xiàn)了觀影評分、網(wǎng)友評價,卻無法對影片進行總結(jié)。
模型A則從主題內(nèi)涵和評價分歧兩方面進行了分析,似乎更有條理。
不過,這里的參考鏈接「2」直接對應(yīng)的是「知乎登錄驗證」,也不知道模型A最后是怎么繞過去的?
圖片
模型B則給出了3篇參考文章,以及更加豐富的回答。
但遺憾的是,它搞錯了主角的名字——原著是叫「小哥白尼」,在電影中則是「牧真人」。
同樣,模型C也把主角在原著和電影里的名字給搞混了。
模型D在熟讀3篇文章之后,從影片的主旨核心,敘事風格進行了總結(jié)。
經(jīng)過小編的驗證,所有參考鏈接也都可進入查詢。
綜合能力如何?
從上面的PK中不難看出,模型D可以說是幾位選手里最有潛力的存在。
不過,正如文章開篇所提到的,大模型如果想「接替」搜索引擎,就必須能夠針對用戶的問題找到實時且正確的來源,并給出準確的回答。
時效性
首先,在時效性方面,選手D可以精準地搜出事件發(fā)生的時間。
比如,「探索一號」科考船圓滿完成首次中國-印度尼西亞爪哇海溝聯(lián)合深潛科考航次任務(wù)的時間是3月28日。
相關(guān)性
而在準確性方面,選手D的表現(xiàn)尤為出色。
它不僅根據(jù)非常簡短的搜索詞「NAKAKITA招聘」,找到對應(yīng)的官網(wǎng)。
而且還能準確地判斷出問題中的關(guān)鍵「招聘」,并對網(wǎng)站內(nèi)容進行詳細的搜索。然后,進一步給出了正確的結(jié)論——官網(wǎng)上沒有與招聘相關(guān)的內(nèi)容。
當然,除了搜索能力之外,大模型到底好不好用,還需要全方位地考察一下才行——
文檔解析
話不多說,接下來我們就加大難度。
首先,上傳一個文檔,要求畫出折線圖,顯示連板變化,數(shù)據(jù)在文件中,x軸是日記,在開始畫的位置寫上股票名稱,每次發(fā)生變化都要寫。
原始數(shù)據(jù)
如此細節(jié)的要求,它都一一做到了,絲毫不差。
然后,再要求在另一份表格中空白的單元格中都填上1,它也圓滿完成了。
更多功能
此外,選手D在圖片生成、圖片描述、文字提取等多模態(tài)領(lǐng)域的表現(xiàn),也十分出色。
而最近大熱的智能體功能,它甚至可以完美支持PC、App和小程序三個入口。
到這里,我們就可以揭秘選手D的身份了,它就是——智譜清言。
來自國內(nèi)唯一一家全模型產(chǎn)品線對標OpenAI的企業(yè)智譜AI。
大模型取代搜索引擎,可能性多高?
眾所周知,大模型相比于傳統(tǒng)搜索引擎有著更強的問題分析、歸納總結(jié)、理解和推理能力,讓我們不必再去研究需要使用哪些「關(guān)鍵詞」才能找到自己想要的內(nèi)容。
但卡脖子的地方在于,大模型訓練數(shù)據(jù)的時效性。
ChatGPT雖然打開了認知,讓AI模型更像大模型了,但它還并未用到實時搜索。
而國內(nèi)的這些模型,則給了我們更多希望。
當大模型工具能夠整合先進的數(shù)據(jù)抓取和整理能力時,就能形成全新的搜索引擎鏈條:
首先AI會根據(jù)提問進行需求分析-網(wǎng)頁搜索–答案歸納,然后通過自然語言對話的方式直接回答問題,從而實現(xiàn)與用戶更好地交互,而不僅僅提供一系列網(wǎng)站鏈接。
所以,現(xiàn)在AI大模型究竟離搜索引擎有多遠呢,它們能殺死谷歌嗎?
讓我們從細處著眼。
當我在討論搜索引擎的時候,我在討論什么?
這里貢獻一個冷知識:每年都有大量的人去谷歌搜索框中,輸入「谷歌」兩個字。
其實,并沒有那么多人去谷歌上查找難以訪問的科學信息,但用它查找郵箱、購物網(wǎng)站的人,要多出幾個數(shù)量級。
或許,擺在這些潛在的谷歌殺手AI面前的問題,不是它們找到信息的能力,而是它們是否能做搜索引擎能做的一切。
1. 網(wǎng)站導航
其實,搜索引擎的最主要工作,是把我們帶到一個網(wǎng)站。
Google上所有排名靠前的查詢,從「YouTube」到「Yahoo Mail」,都是導航查詢。
但AI機器人往往會思考幾秒鐘,然后提供一堆公司信息,但可能并沒有鏈接到Amazon之類的具體網(wǎng)站。
2. 信息查詢
對于體育比賽比分、現(xiàn)在幾點了之類的實時信息,谷歌都做對了,而AI工具往往都會過時(原因如上文所示)。
并且,谷歌往往會有關(guān)于你特定位置、背景的信息,而AI機器人很多都沒有。
當然,如果查找「一年有多少周」這種問題,AI產(chǎn)品往往會給我們驚喜。
谷歌會回答:52.1429周。
而Perplexity和智譜清言則給出更加全面的答案——不僅分別考慮到了平年和閏年的情況,而且還給出了計算過程,非常清晰易懂。
3. 探索性查詢
「如何打領(lǐng)帶」、「為什么會發(fā)明電鋸」類似的問題,都屬于探索性的查詢。
這些問題往往沒有單一答案,而是學習過程的開端。
就比如,你在谷歌查找一位歌手,或者NASA歷史之類的問題,這時的你就是在探索。
這并不是人們使用谷歌的主要目的,但正是AI搜索工具大放異彩的時刻。
比如,針對「為什么發(fā)明電鋸」這一問題,Perplexity就會給出電鋸的醫(yī)療起源,并描述其技術(shù)演變過程,最終被伐木工人采用。
4. 參考鏈接引用
AI搜索工具最大的亮點之一,便是提供了引用來源的鏈接。
這意味著,如果用戶在搜索結(jié)果中發(fā)現(xiàn)了一個特別感興趣的事實,可以點擊鏈接,進入原始出處獲得進一步了解。
總之,當我們談起搜索引擎,最大的問題恐怕不在于技術(shù),而在于產(chǎn)品。
如果將以上問題一一解決,同時探索出合適的商業(yè)模式和結(jié)構(gòu),AI取代搜索引擎,應(yīng)該就不遠了。
那時,我們搜索時會出現(xiàn)的,不僅僅再是簡單的鏈接羅列,而是一個開門見山的準確答案。
