ChatGPT還在2G沖浪?新模型「youChat」:我已能夠解說2022世界杯
ChatGPT 自推出以來就被寄予厚望,一些人認(rèn)為它會(huì)取代搜索引擎,成為「改變游戲規(guī)則的人」。
真的會(huì)有這一天嗎?至少,一部分業(yè)內(nèi)人士已經(jīng)啟動(dòng)了頗具挑戰(zhàn)性的落地試驗(yàn)。
今天,搜索引擎 You.com 公司 CEO Richard Socher 在推特宣布,「youChat」已經(jīng)正式上線。
新的試用功能已經(jīng)發(fā)布在 You.com 搜索引擎的首頁:
「我們非常高興今天推出 youChat v1。這僅僅是個(gè)開始。我們將很快發(fā)布具有更多獨(dú)特功能的改進(jìn)版本?!鼓壳?,youChat 以測(cè)試版的形式發(fā)布。
youChat 具有與 ChatGPT 類似的功能,用戶可以在搜索引擎的「Chat」選項(xiàng)欄進(jìn)行對(duì)話:
如果你問 youChat:誰是這個(gè)世界上最美麗的女人?答案可不是白雪公主。它會(huì)告訴你是 Yael Shelbia,而且還會(huì)解釋為什么是她:
面對(duì)「誰贏得了這屆世界杯」的提問,數(shù)據(jù)庫比較滯后的 ChatGPT 答不上來。但 youChat 答對(duì)了,還解釋了一番:
關(guān)于「梅開二度」,youChat 還能進(jìn)行一次盤點(diǎn):
在移動(dòng)設(shè)備上,用戶也可以通過 [http://you.com/chat] 聊天。當(dāng)前,這個(gè)鏈接也可在桌面上使用,但僅顯示聊天,而沒有任何其他應(yīng)用程序或鏈接。
youChat 怎么用
與一般搜索引擎不同的是,youChat 了解最近發(fā)生的事件,并可以為其答案提供引用。
比如:「誰是推特公司的 CEO?」youChat 給的答案是「馬斯克」,同時(shí)也會(huì)告訴你,近來的推特都發(fā)生了什么。
ChatGPT 的數(shù)據(jù)庫似乎還停留在過去的某一天。對(duì)于同樣的問題,ChatGPT 的答案是:
Richard Socher 表示,通過 youChat,他們希望解決搜索中的兩方面的問題:讓搜索更直觀、更有幫助、更快,以及讓大型語言模型更可靠。
youChat 會(huì)像 AI 助手一樣響應(yīng)用戶的提示,讀取、寫入和匯總信息。這顛覆了用戶從搜索引擎獲取結(jié)果的方式:
首先,通過易于理解的句子獲得信息,而不是鏈接列表:
其次,理解復(fù)雜的概念:
此外,還可以獲取有關(guān)圣誕禮物、論文大綱或編程之類問題的 idea:
用戶測(cè)評(píng):「差點(diǎn)意思」
在發(fā)布的同時(shí) Richard Soche 還表示:「我們將在 2023 年徹底改變?nèi)藗儗?duì)搜索引擎的看法。」不過,youChat 即使比其他大型語言模型更經(jīng)常更新和更真實(shí),也仍然會(huì)出錯(cuò)。
發(fā)布之后,一些用戶立刻指出了 youChat 的不足:「這是我的第一個(gè)問題。它甚至不知道今年是什么?!?/span>
特斯拉今年的最低股價(jià)是多少?
Richard Socher 的回復(fù)是:「對(duì)于此類查詢,我會(huì)使用搜索引擎的主要應(yīng)用程序和結(jié)果,例如參閱中心底部,這將提供準(zhǔn)確的答案。我們很快就會(huì)合并這些類型的應(yīng)用程序?!?/span>
看起來,提問的「措辭」很重要:
另一位用戶則提問:「曼聯(lián)下一場(chǎng)比賽是什么時(shí)候?」youChat 答:「2022 年 1 月 15 日?!?/span>
這位用戶真誠地建議:「是時(shí)候讓它停止產(chǎn)生幻覺了?!?/span>
問答模型爆火之后
ChatGPT 能在 2022 年底成為 AI 界頂流,是因?yàn)樗莆諒V泛的基本知識(shí),特別是在編程方面,甚至有人認(rèn)為 ChatGPT 將取代搜索引擎。
據(jù)外媒 VentureBeat 報(bào)道,在 Forrester 公司分析師 Rowan Curran 看來,生成式 AI 此刻面臨的時(shí)機(jī)至關(guān)重要:「我唯一能夠比較的是 iPhone 的發(fā)布。蘋果公司的 iPhone 不是第一款智能手機(jī),但它以其觸摸屏、易用性和引入的應(yīng)用程序埋葬了競爭對(duì)手,將完整的計(jì)算體驗(yàn)放進(jìn)了人們的口袋?!?/span>
短短幾天就涌入了百萬數(shù)量級(jí)的用戶,的確驗(yàn)證了 ChatGPT 的受歡迎程度。另一方面,ChatGPT 也在改變公眾對(duì)可能性的認(rèn)知。
作為一個(gè)問答語言模型,ChatGPT 首先以出色的回答給人以深刻的印象。比如,它可以和人們就「現(xiàn)代物理學(xué)的發(fā)展史」高談闊論 20 分鐘:
詢問計(jì)算機(jī)相關(guān)的知識(shí),更是對(duì)答如流,例如解釋正則表達(dá)式的含義:
在編程方面,ChatGPT 還能自動(dòng)寫程序,找 bug:
關(guān)于 ChatGPT 是否會(huì)取代現(xiàn)有的搜索引擎,我們需要分析一下 ChatGPT 的能力和短板。盡管作為一個(gè)語言模型,它能夠給出邏輯清晰,又不乏知識(shí)性的回答,但不是所有的回答都是完全正確的。
上線幾天之后,Stack Overflow 就宣布封禁了 ChatGPT,原因是 ChatGPT 生成的答案錯(cuò)誤率很高,并且錯(cuò)誤不容易發(fā)現(xiàn)。這會(huì)給使用 Stack Overflow 查詢編程問題的用戶帶來非常大的困擾。
我們知道,搜索引擎能被廣泛接受和使用,除了它方便快速,更重要的是搜索到的信息正確率是很高的,并且一些百科網(wǎng)站也在不斷完善知識(shí)的覆蓋面和準(zhǔn)確性,這需要大量的人工校對(duì)和專業(yè)知識(shí)。而 ChatGPT 等 AI 語言模型的現(xiàn)狀是生成功能強(qiáng)大,但知識(shí)的準(zhǔn)確性很難有保證。
知識(shí)型模型是近期學(xué)術(shù)界和業(yè)內(nèi)努力探索的一個(gè)方向。人們希望未來的 AI 是掌握大量科學(xué)知識(shí)的,進(jìn)而實(shí)現(xiàn)通用人工智能(AGI)。但從目前的工作看,構(gòu)建知識(shí)型模型還差得很遠(yuǎn)。例如,前段時(shí)間 Meta 的模型 Galactica 上線僅兩天就火速下架,因?yàn)樵撃P蜕傻闹R(shí)性內(nèi)容存在嚴(yán)重錯(cuò)誤。
現(xiàn)在,無論是 OpenAI 強(qiáng)勢(shì)推出的 ChatGPT,還是最新出爐的 youChat,都不滿足知識(shí)準(zhǔn)確無誤這一基本要求。從這個(gè)意義上講,大規(guī)模語言模型和搜索引擎還相距甚遠(yuǎn)。
或許 youChat 和 ChatGPT 有幾分相似,但它們?cè)诨卮鹫_性方面還有很大的提升空間。