開局打爆谷歌,微軟ChatGPT版必應(yīng)親測:強到發(fā)指!
微軟笑拉了!這場互聯(lián)網(wǎng)巨頭神仙打架的大戲才拉開序幕,微軟就已經(jīng)領(lǐng)先谷歌幾個身位。
剛剛結(jié)束的谷歌發(fā)布會,透著一股「趕鴨子上架」的味道。不僅毫無亮點,效果拉跨,Bard還被爆出存在事實性錯誤,發(fā)布會一結(jié)束,谷歌的股價直接一瀉千里,開盤即暴跌8%,市值蒸發(fā)1020億美元。
微軟:嗯,是讓人十分放心的對手了。
這場搜索引擎大戰(zhàn),目前微軟以絕對優(yōu)勢領(lǐng)先。
此前,微軟發(fā)布了由加強版ChatGPT提供支持的全新搜索引擎必應(yīng)Bing和Edge瀏覽器,發(fā)布會上一通操作秀到谷歌沒眼看,市值也在一夜間漲超800億美元。
目前,已經(jīng)有記者親測了一波微軟的「ChatGPT搜索」,體驗就是:棒呆了!
ChatGPT搜索上線:真·有問「必應(yīng)」!
2月8日,微軟在自家Edge瀏覽器中正式發(fā)布新必應(yīng)(new Bing),結(jié)合了ChatGPT和微軟自己的普羅米修斯(Prometheus)模型,將搜索體驗帶上了一個新臺階。
微軟首席執(zhí)行官Satya Nadella甚至在發(fā)布會上激動地表示「這是搜索的新時代」(This is a new day for search)。
不過呢,雖然新必應(yīng)已經(jīng)公開測試,但要是想正式使用,還要先加入waiting list等待一段時間。
如果用戶在個人電腦上設(shè)置微軟的默認搜索,并且在手機上安裝必應(yīng)app,他們可以更快地獲得訪問新必應(yīng)的機會,還帶動了一波app下載熱潮。(有點「不下載app不讓用」那味了...)
至于等待多久,微軟表示,將在「未來幾周內(nèi)」向「數(shù)百萬用戶」開放體驗,甚至后續(xù)還會考慮把新必應(yīng)帶到其他瀏覽器中,不過還沒有具體的時間表。(Chrome:蝦仁還要豬心?。?/span>
有網(wǎng)友吐槽,從來沒想過2023年的to-do-list上竟然還會有「加入新必應(yīng)的等候列表」。
不過新必應(yīng)在發(fā)布會上也開放給了一些外媒進行搶先體驗,TechCrunch的記者最近就他的體驗發(fā)表了一篇報道。
全新的搜索體驗
新版必應(yīng)變化最明顯的就是前端搜索框更大,并且下面還會展示一些ChatGPT的樣例以幫助新用戶熟悉聊天功能。
另一個變化是,搜索引擎的提示文字變成了「請向我提問...」,引導(dǎo)新用戶區(qū)分常見的「關(guān)鍵詞」搜索模式,不過新必應(yīng)也支持普通的搜索模式。
我認為微軟在傳統(tǒng)的、以鏈接為中心的搜索結(jié)果和ChatGPT之間找到了一個合適的平衡點,除了在開放問題中聊天以外,當(dāng)你問它一些需要真實信息的內(nèi)容時,Edge瀏覽器就會在側(cè)邊欄顯示出一些搜索結(jié)果。
不過目前還很難預(yù)測什么樣的問題可以觸發(fā)側(cè)邊欄。
能聯(lián)網(wǎng)的ChatGPT
新版ChatGPT可以進行網(wǎng)上沖浪了,能提升其準(zhǔn)確性嗎?
以前有研究人員在測試過ChatGPT關(guān)于「COVID-19新冠疫苗」的問題,ChatGPT給出了一個錯誤答案,研究人員便把結(jié)果發(fā)布到了網(wǎng)上。
當(dāng)這次再問新必應(yīng)相同的問題時,它的回答和ChatGPT之前的答案相同,并且還把那份錯誤答案的鏈接當(dāng)作了參考。(離譜,我參考我自己的錯誤答案)
還有之前在ChatGPT的研究中發(fā)現(xiàn)的問題,例如讓ChatGPT以希特勒的口吻為大屠殺行為進行辯護等非常邪惡的事,新必應(yīng)也都會照做。
不過在向微軟提交上述故障不久后,這些query及其各種變體都無法再無復(fù)現(xiàn)了,必應(yīng)隨后也開始拒絕其他歷史人物的類似query,作者猜測是微軟在后端添加了一些過濾規(guī)則,以此加強必應(yīng)的安全算法。
道德問題還沒解決
從上面的例子可以看出,盡管微軟談?wù)摿撕芏嚓P(guān)于人工智能的道德問題,以及還為新必應(yīng)設(shè)置了諸多保護措施,但顯然還有一些場景沒有覆蓋到。
微軟的一位發(fā)言人表示,在某些情況下,團隊可能在生成輸出的過程中發(fā)現(xiàn)問題,程序?qū)型就V?。開發(fā)團隊已經(jīng)料到系統(tǒng)可能會在預(yù)覽期間出錯,反饋對于系統(tǒng)的后續(xù)改進是至關(guān)重要的。
還有點bug,會給你推薦自家股
在大多數(shù)情況下,你可以簡單地把新必應(yīng)看作是ChatGPT,但是新必應(yīng)擁有實時更新的數(shù)據(jù)。
比如新必應(yīng)甚至可以瀏覽到今天早上才發(fā)生的事,不過在一些時間類的query中,新必應(yīng)的表現(xiàn)并不好,似乎它并不理解「recently」的概念;但是如果你想問它這周有哪些電影上映,它會給你一個相當(dāng)不錯的返回列表。
另一個很棒的特性是,它會在聊天中提供一些意想不到的web體驗。
比如當(dāng)問它關(guān)于購買微軟股的問題時,它會回答說不會給我財務(wù)建議(因為可能會對你的財務(wù)狀況有害產(chǎn)生負面影響),但它也提到了MSN Money上微軟的股代碼。
和ChatGPT一樣,新必應(yīng)的聊天功能并不總是完全準(zhǔn)確,比如問他一些不存在的實體時,也能得到一本正經(jīng)的回答。
當(dāng)被問及更專業(yè)的話題,比如夜間作為私人飛行員的目視飛行(visual flight)規(guī)則時,返回的內(nèi)容并不清晰,部分原因是模型的調(diào)教傾向就是健談,它的回答和普通問答一樣,但包含了大量無關(guān)的信息。
雖然新必應(yīng)在回答問題時會加上引用源,但其中一些鏈接十分可疑,比如包括一些內(nèi)容剽竊網(wǎng)站,而且有時也會引用自己并鏈接到必應(yīng)網(wǎng)站上的搜索結(jié)果。
但新必應(yīng)能夠引用信息來源已經(jīng)是朝著正確的方向邁出了一步,雖然許多在線出版商擔(dān)心這樣一個工具會降低搜索引擎的點擊率,雖然這個流量對于必應(yīng)來說無關(guān)緊要,但新必應(yīng)仍然提供大量的鏈接。
例如,每個帶有來源的句子都有鏈接(有時,必應(yīng)也會在這些鏈接下面顯示廣告),對于許多與新聞相關(guān)的查詢,它會展示來自Bing News的相關(guān)故事。
除了必應(yīng)之外,微軟還將新開發(fā)的AI copilot引入了Edge瀏覽器,作者認為這項功能的體驗也不錯,在瀏覽器中,必應(yīng)可以使用當(dāng)前瀏覽的網(wǎng)站的上下文來執(zhí)行操作,比如對比價格,告訴你你想買的東西是否有好的評論,甚至是寫一封關(guān)于該網(wǎng)站的電子郵件等。
不過這里有一個奇怪的地方,因為目前還是預(yù)覽版,可能會有一些bug:一開始,必應(yīng)并不知道我在看什么網(wǎng)站,在三四次查詢失敗后,必應(yīng)才能訪問到瀏覽器中的網(wǎng)頁內(nèi)容。
Edge團隊還把這個新側(cè)邊欄拆分為Chat、Compose和Insights,其中compose功能可以輔助寫電子郵件、博客文章和一些簡短的文本片段。
兩種模式的底層模型似乎有些不同,或者說是添加了一些規(guī)則,對相同的輸入有不同的返回內(nèi)容。
但是,在大多數(shù)情況下,側(cè)邊欄只是復(fù)制了chat的體驗,下一步微軟可能會設(shè)計成用戶的入口點,特別是針對那些已經(jīng)在使用 Edge 的老用戶。
前工程師:發(fā)布會就是做做樣子,谷歌根本不care
微軟的新搜索引擎這么拉風(fēng),襯得谷歌的Bard更加拉跨了。
前天谷歌的發(fā)布會結(jié)束后,一度淪為業(yè)內(nèi)的笑柄。
一些評論家這樣評論谷歌的演示——「坦率地說,非常糟糕」,在人工智能軍備競賽日益激烈的情況下是一場「災(zāi)難」。
谷歌前員工Maarten Bosma也忍不住發(fā)推吐槽前東家。
Maarten Bosma是谷歌大腦的前工程師,在一條推文的回復(fù)中,他這樣評價前雇主:「我認為谷歌的演示(正確或錯誤地)表明他們并沒有真正認真對待它」。
他指出了發(fā)布會的眾多「華點」——
1. Bard的演示「不到5分鐘」,還是跟谷歌地圖、谷歌鏡頭這些新工具一起展示的。
2. 發(fā)布會地點「在巴黎而不是總部」,而且「首席執(zhí)行官不在場」。
發(fā)布會上出席的是谷歌副總裁Prabhakar Raghavan
回想這幾個月,微軟憑ChatGPT把谷歌打得節(jié)節(jié)敗退,終于逼得谷歌不得不發(fā)布「紅色代碼」,使用AI聊天機器人來增強谷歌搜索引擎。
而就在谷歌宣布開發(fā)自家AI聊天機器人Bard的消息后,微軟第二天在發(fā)布會上亮相的「ChatGPT新必應(yīng)」的光芒讓人閃瞎了眼。
而谷歌后一天的發(fā)布會,也就更顯得滑稽了。
顯然,Bosma并不是唯一公開批評谷歌這次做法的人。
「坦率地說,這次活動很糟糕,」分析師Ben Thompson在一篇博客文章中這樣評價谷歌的演示。他表示,發(fā)布會上絕大多數(shù)內(nèi)容,是以往已經(jīng)展示內(nèi)容的翻版。
而谷歌Bard廣告中關(guān)于韋伯望遠鏡的錯誤,也讓大家笑掉了大牙,更是瞬間拉低了股價。
不過,也有人對谷歌在輿論上遭受的嘲笑感到困惑。
紐約大學(xué)前神經(jīng)科學(xué)教授、自稱是人工智能懷疑論者的Gary Marcus在博客中表示,自己感到十分疑惑——明明微軟和谷歌的AI工具都處于相似的部署階段,并且都存在缺陷,為什么受到的輿論評價卻如此不同?
微軟的演示「被描述為一場革命」,而谷歌的演示被描述為「一場災(zāi)難」,馬庫斯指出。(莫非,是微軟的一盤大棋?)
然而,這些還都只是前序。等再過幾周,完成更多測試之后,谷歌的Bard會正式向公眾發(fā)布。而微軟的「ChatGPT必應(yīng)」,也在排等候名單了。
到那時,真正的大戰(zhàn)才會開始。