教訓(xùn)慘痛!谷歌如何從AI老大哥一步步跌落神壇?
谷歌腸子都悔青了。
多年來一心一意崇拜的VR,目前看來是個(gè)假神。
現(xiàn)在眼看著對手微軟和OpenAI憑ChatGPT賺足了眼球,谷歌趕忙轉(zhuǎn)換戰(zhàn)略,加速AI的研發(fā)。
諷刺的是,這一切之所以發(fā)生,是因?yàn)楣雀璐饲昂V定地認(rèn)為,自己已經(jīng)壟斷了AI的市場。
谷歌確實(shí)有理由這樣認(rèn)為。
在2017年,谷歌的研究人員發(fā)布了著名的論文「Attention is all you need」,引入了Transformer的概念,并極大地提升了機(jī)器學(xué)習(xí)模型的潛在能力。
要概括Transformer巨大的影響力,只要說這一句話就夠了:它就是GPT中的「T」。
你可能會問:這么好的東西,谷歌會為什么免費(fèi)開源呢?
大型私人研究機(jī)構(gòu)過去常常被批隱瞞自己的工作,不過這幾年,開源已成一種趨勢。
因?yàn)?,這是一場事關(guān)聲望的游戲,也是對研究人員的讓步——他們更希望雇主別把自己的光芒掩蓋起來。
當(dāng)然,這其中也有傲慢的成分:作為這項(xiàng)技術(shù)的發(fā)明者,谷歌怎么可能不是它最好的利用者呢?
后來的故事,我們都知道了。
這股ChatGPT熱,來得猝不及防。
學(xué)會理解和利用一種新工具,都需要時(shí)間?,F(xiàn)在,每家大型科技公司都在探索,AI的新時(shí)代會帶來什么,而它們?yōu)榇诵枰鍪裁础?/span>
而做出ChatGPT基礎(chǔ)架構(gòu)Transformer的谷歌,腸子都悔青了。
可以理解,谷歌不想過早地將搜索與他們現(xiàn)有的半生不熟的通用LLM模型合并,來宰殺金鵝。他們已經(jīng)成為部署高度專業(yè)化的AI任務(wù)模型的專家,這些模型可以完成一兩件事。
但當(dāng)涉及到大動作時(shí),他們舒適的位置讓他們背上了惰性。
所以谷歌垮臺了嗎?當(dāng)然沒有,在不久的將來,它仍將大家默認(rèn)的一家利潤豐厚的大科技公司。只是看起來有點(diǎn)好笑。
不斷改進(jìn)Assistant,有點(diǎn)徒勞
毫無疑問,谷歌為AI領(lǐng)域做出了非凡的貢獻(xiàn)。
這幾年里,它在設(shè)計(jì)AI計(jì)算硬件方面取得了重大進(jìn)展,為開發(fā)人員構(gòu)建了有用的平臺,來測試和開發(fā)機(jī)器學(xué)習(xí)模型,并發(fā)表了大量論文,從模型的微調(diào)到語音合成。
谷歌首席執(zhí)行官 Sundar Pichai于2018年5月8日在Google I/O 2018大會上發(fā)表主題演講
但是,這家公司也存在一個(gè)嚴(yán)重的問題。
不少人都從谷歌員工和其他業(yè)內(nèi)人士那里聽到過這樣的軼事——谷歌的運(yùn)作方式太封建了。這里似乎有一種約定俗成的觀點(diǎn),即讓項(xiàng)目在現(xiàn)有產(chǎn)品(如地圖或助手)的支持下運(yùn)轉(zhuǎn),才是一種可靠的掙錢方式。
因此,盡管公司里已經(jīng)囤積了許多世界上最優(yōu)秀的AI研究人員,但他們的才能似乎只能受困于企業(yè)戰(zhàn)略的軌道。
這樣做的結(jié)果是什么?讓咱們來看看下面這個(gè)時(shí)間表。
2018年,谷歌的成果是改進(jìn)了的Google Assistant flow、Photos(比如為單色圖像著色)、帶有「視覺優(yōu)先版助手」的智能顯示器(有人見過嗎?)、地圖助手、AI輔助的Google新聞和MLKit。
Google Assistant即將登陸Google地圖
2019年,谷歌展示了更出名、尺寸更大的智能顯示器、AR搜索結(jié)果、AR地圖、Google Lens更新、網(wǎng)絡(luò)Duplex(還有人記得Duplex嗎?)、可以在本地完成更多工作的壓縮版Google Assistant、Waze中的助手、駕駛模式中的助手、實(shí)時(shí)字幕、現(xiàn)場轉(zhuǎn)播(語音識別)以及一個(gè)更好地了解語言障礙人士的項(xiàng)目。
當(dāng)然,可以肯定地說,其中某些產(chǎn)品很棒!
然而,它們中的大多數(shù)只是一個(gè)現(xiàn)成的東西,區(qū)別是得到了AI的推動。
谷歌推出ML Kit,這是一個(gè)SDK,可以輕松地將AI添加到iOS和Android應(yīng)用程序
現(xiàn)在再回想起來,很多人都會感覺到,谷歌的確有點(diǎn)畏縮。
像谷歌這樣的大公司,本應(yīng)該是能順應(yīng)趨勢、推動潮流的。
谷歌推出了Duplex,這是一種基于人工智能的客戶服務(wù)工具,旨在幫助小型企業(yè)(如餐館和美發(fā)沙龍)接聽更多電話、回答常見問題并安排預(yù)訂
而在2019年2月,OpenAI有這樣一條新聞:《OpenAI構(gòu)建了一個(gè)非常好的文本生成器,但因?yàn)樘kU(xiǎn),所以不能發(fā)布》。
這條新聞里講的不是GPT-3,不是GPT-3.5……而是GPT-2。
2020年,谷歌制作了一個(gè)由AI驅(qū)動的Pinterest克隆,然后在12月解雇了Timnit Gebru——AI倫理領(lǐng)域的主要發(fā)聲人之一,因?yàn)樗麑懥艘黄撐?,指出了這個(gè)技術(shù)的局限性和危險(xiǎn)。
雖然如今我們看到了ChatGPT的大紅大紫,但其實(shí)當(dāng)初OpenAI的聯(lián)合創(chuàng)始人Sam Altman也曾不得不親自壓制對GPT-3的炒作,因?yàn)樗^了可承受的水平。
而在2021年,谷歌的大語言模型LaMDA首次亮相,但谷歌并沒有真正把它推向市場。據(jù)悉,除了減少Assistant拋出的錯(cuò)誤之外,谷歌仍然在尋找讓它存在的理由。
而OpenAI的2021年是以DALL-E開始的,這個(gè)文本到圖像模型很快變得家喻戶曉。
OpenAI證明了,通過CLIP等系統(tǒng),LLM不僅可以執(zhí)行語言任務(wù),還可以充當(dāng)通用的解釋和生成引擎。
2022年,谷歌干的事情就是對Assistant的更多調(diào)整、更多的智能顯示器、更多的AR 地圖,以及花1億美元收購AI 生成的個(gè)人資料圖片(收購Alter)。
同一年,OpenAI在4月發(fā)布了DALL-E 2 ,在12月發(fā)布了ChatGPT。
或許在2022年初的某一刻,當(dāng)谷歌高管睜開眼睛的時(shí)候,被眼前的東西嚇壞了。
可以想象,疑惑的谷歌高管們急忙發(fā)送電子郵件,詢問為什么一些有活力的初創(chuàng)公司正在圍繞著OpenAI運(yùn)行。
證據(jù)是,Imagen在DALL-E 2發(fā)布一個(gè)月后就退出了,實(shí)際上,退不退出也沒什么區(qū)別,就像谷歌公布的其他AI研究一樣,任何人都無法測試它,更不用說連接到API了。
然后,Meta在9月發(fā)布了Make-A-Video后,谷歌在一周之后就以Imagen Video做出回應(yīng)。然后Riffusion在生成音樂方面掀起了波瀾,一個(gè)月后,MusicLM就出現(xiàn)了(同樣的,我們?nèi)匀徊荒苡盟?/span>
但可以肯定,谷歌這樣對別家亦步亦趨,正是因?yàn)镃hatGPT帶給谷歌領(lǐng)導(dǎo)層的焦慮,讓他們只能全力以赴。
但其實(shí)內(nèi)部人士都知道,ChatGPT與谷歌投資了十年的助理產(chǎn)品截然不同,后者其實(shí)是假裝出來的偽AI(實(shí)際上只是一組API的自然語言前端罷了)。
但谷歌被生存競爭嚇到了。
時(shí)勢造英雄
不過,現(xiàn)在就把必應(yīng)稱為谷歌搜索的「競爭對手」還有些為時(shí)過早,畢竟與Google的92%相比,必應(yīng)在全球的份額僅為3%。
但搜索引擎,成功地將微軟對創(chuàng)新的需求與大規(guī)模語言模型的核心競爭力結(jié)合了起來,進(jìn)而造就了最新的GPT模型與必應(yīng)和Edge的整合。
看到這一點(diǎn)的谷歌顯然是急了,于是搶在微軟發(fā)布ChatGPT的前一天,試圖用一篇空洞的博文來吸引眼球。
但由于發(fā)布得過于匆忙,以至于在兩天后的「搜索和人工智能」活動中,谷歌甚至都沒怎么提到有關(guān)Bard的內(nèi)容。
此外,用來宣傳Bard的圖片里,還包含一個(gè)非同小可的錯(cuò)誤:詹姆斯-韋伯太空望遠(yuǎn)鏡「首次拍攝了太陽系外行星的照片」。顯然,這是錯(cuò)的。
更令人震驚的是,谷歌內(nèi)部竟然沒人發(fā)現(xiàn),甚至沒人關(guān)心這個(gè)問題。
當(dāng)然,ChatGPT也有自己的問題。
但谷歌倉促出手,并在如此明顯地被絆倒。恰恰說明,即使是在有限的、實(shí)驗(yàn)性的水平上,谷歌也缺乏準(zhǔn)備,更不用說像微軟這樣已經(jīng)開始在全球推廣了。
谷歌還是那個(gè)谷歌
那么,這是不是意味著谷歌的衰落?
當(dāng)然不是,在不久的將來,它仍將是我們默認(rèn)的搜索引擎,以及一家利潤豐厚的公司。
但從隨后的股價(jià)大跌上也能看出,投資者的信心已經(jīng)被動搖了。
事實(shí)證明,谷歌在過去幾年里,都沒有進(jìn)行任何有意義的創(chuàng)新。而這可能并不是出于智慧,而是出于自傲。
不過,當(dāng)新的技術(shù)尚未證明自己能夠像所有人想的那樣有價(jià)值時(shí),我們也無法做出過多的預(yù)測。