谷歌打響全面反擊戰(zhàn)!官宣AI重構(gòu)搜索、新模型比肩GPT-4,朝著ChatGPT微軟開炮
萬眾矚目,谷歌的反擊來了。
現(xiàn)在,谷歌搜索終于要加入AI對話功能了,排隊通道已經(jīng)開放。
當(dāng)然這還只是第一步。
大的還在后面:
全新大語言模型PaLM 2正式亮相,谷歌聲稱它在部分任務(wù)超越GPT-4。
Bard能力大更新,不用再排隊等候,并支持新語言。
谷歌版AI辦公助手也一并推出,將在Gmail中搶先亮相。
谷歌云也上線多個基礎(chǔ)大模型,為行業(yè)提供更進(jìn)一步的生成式AI服務(wù)……
在最新一屆I/O開發(fā)者大會上,谷歌的大放送真的太震撼。
有網(wǎng)友直呼:
AI大戰(zhàn)全面開啟。
有人甚至表示:
現(xiàn)在我后悔為ChatGPT付費(fèi)了。
一場發(fā)布會結(jié)束,谷歌股價上漲超4%。
PaLM 2部分任務(wù)超越GPT-4
毫無疑問,PaLM 2是今年I/O大會的重中之重,由皮查伊親自做介紹。
目前的Bard以及谷歌超過25個AI產(chǎn)品和功能,現(xiàn)在都由PaLM 2作為底層技術(shù)支持。
作為谷歌目前最先進(jìn)的大模型,PaLM 2基于Pathways架構(gòu),是PaLM的升級版,通過JAX在TPU v4上構(gòu)建。
據(jù)介紹,PaLM 2接受了100多種語言的訓(xùn)練,這使得它在語言理解、生成和翻譯上的能力更強(qiáng),并且會更加擅長常識推理、數(shù)學(xué)邏輯分析。
谷歌表示,PaLM 2的數(shù)據(jù)集中有海量論文和網(wǎng)頁,其中包含非常多數(shù)學(xué)表達(dá)式。在這些數(shù)據(jù)的訓(xùn)練后,PaLM 2能輕松解決數(shù)學(xué)問題,甚至是制作圖表。
編程方面,PaLM 2現(xiàn)在支持20種編程語言,如Python、JavaScript等常用語言,以及Prolog、Fortran和Verilog等。
這一次谷歌一并推出了四種不同size的PaLM 2。
他們用不同的動物來體現(xiàn)規(guī)模大小。最小的是“壁虎”,最大的是“獨(dú)角獸”。
其中“壁虎”版本是非常輕量級的,能在移動設(shè)備上快速運(yùn)行,包括離線狀態(tài);每秒可處理20個token。
DeepMind副總裁在I/O大會前的新聞發(fā)布會上表示:
我們發(fā)現(xiàn)模型并不總是越大越好,這也是為什么我們決定提供一系列不同規(guī)模的模型。
這意味著微調(diào)PaLM 2會更加方便,由此它也能支持更多產(chǎn)品和應(yīng)用。
在I/O大會上,谷歌就宣布了現(xiàn)在已經(jīng)有超過25個產(chǎn)品和應(yīng)用正在使用PaLM 2的能力。
具體的表現(xiàn)形式,就是Duet AI。
可以將它理解為微軟365 Copilot的對標(biāo)產(chǎn)品,是一個能夠內(nèi)嵌在各種辦公軟件中的AI助手。
谷歌在發(fā)布會現(xiàn)場已經(jīng)展示了Duet AI在Gmail、Google Docs、Google Sheets中的能力。
包括根據(jù)提示補(bǔ)充郵件內(nèi)容、生成PPT、根據(jù)提示生成圖片素材、一鍵生成表格等。
同樣,這個AI助手也能提供編程幫助?;诠雀柙?,它能實(shí)時推薦、糾錯代碼塊,并且以對話方式解答編程問題,目前支持Go、JavaScript、Python和SQL。
另外基于PaLM 2,谷歌還推出了一些專業(yè)領(lǐng)域大模型。
谷歌的健康團(tuán)隊打造了Med-PaLM 2。它能回答各種醫(yī)學(xué)問題,據(jù)稱是首個在美國醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語言模型。
目前谷歌正在嘗試讓它具備多模態(tài)能力,比如自己檢查X光片后給出診斷。在今年夏天晚些時候,這個模型將對一小部分谷歌云用戶開放。
另一個專業(yè)大模型是Sec-PaLM 2。
這是一個面向網(wǎng)絡(luò)安全維護(hù)的大模型,它能分析和解釋潛在的惡意腳本,并檢測腳本的危險性。
那么,在展示了PaLM 2一眾卓越能力后,就該聊聊怎么開放使用了。
谷歌表示,現(xiàn)在可以通過PaLM API接口、Firebase和Colab使用PaLM 2。
Bard全面開放,支持圖片、集成自家地圖等應(yīng)用
對標(biāo)ChatGPT的Bard終于取消排隊試用,在全球180+國家和地區(qū)進(jìn)行全面開放了。
新增黑暗模式,備受程序員好評:(手動狗頭)
除了擴(kuò)大訪問范圍,Bard也在英文之外,新增直接用日語和韓語對話的功能。中文看起來還得再等下一波——谷歌表示,很快就會新增到40種語言版本。
由于從今天起,Bard將全面接入PaLM 2,所以它在編程和推理上面的能力也有了很大的提升,代碼生成、調(diào)試和解釋都更加專業(yè)(獲得程序員認(rèn)可的那種)。
當(dāng)你讓它用python寫一段國際象棋中的“四步殺”(scholar’s mate)招式,里面參考了別的代碼,它會給出相關(guān)鏈接,方便你查看。
你可以就它給出代碼中某個不懂的函數(shù)進(jìn)行進(jìn)一步提問,問它能否再改善一下,或者是要求它將所有內(nèi)容都合并的一個代碼塊中。
不過,最驚喜的當(dāng)屬應(yīng)廣大開發(fā)者要求,加入了一鍵導(dǎo)入功能。
現(xiàn)在,你可以將Bard生成的代碼直接導(dǎo)出到Colab。
除了代碼,你用Bard生成的任何內(nèi)容,比如電子郵件草稿、表格什么的也都可以直接拖到Gmail、Docs和Sheets中。
對了,Bard現(xiàn)在的回答中也支持圖片了。拿來問旅游攻略最方便不過:
除了它能用圖片回答你,你也能直接丟給它圖片,比如上傳一張兩只狗狗的照片,讓它來幫你編點(diǎn)好玩的故事:
這個功能由Google Lens(一款能讓機(jī)器學(xué)會“看圖說話”的AI應(yīng)用)提供支持。
除了Google Lens,Docs、Drive、Gmail、地圖等多個谷歌自家的應(yīng)用能力也整合到了Bard之中。
比如在Bard的回答中直接用谷歌地圖查看幾所大學(xué)的地理位置:
有種現(xiàn)在要用谷歌的各種產(chǎn)品,只用Bard一個入口就夠了的感覺。
除了自家應(yīng)用,Bard這次還把Adobe Firefly給搬了上來,各種有版權(quán)的創(chuàng)意圖像用對話就可以“信手拈來”:
搜索重構(gòu),加入AI對話
千呼萬呼,谷歌搜索終于開啟了AI對話的能力。
“一家?guī)в幸粋€不到3歲孩子和一只狗的家庭來說,去布萊斯峽谷還是拱門國家公園游玩更好?”
對于這個問題,擱以前,你可能需要自己把它拆成各種小問題去搜索引擎整理大量信息,最終才能找到答案。
現(xiàn)在谷歌讓你盡量一步到位。
如圖所示,谷歌搜索沒有簡單地搬運(yùn)搜出來的答案,而是將孩子和狗這兩個因素都考慮進(jìn)去給出整理后的回答,比如它說:
布萊斯峽谷有兩條狗能進(jìn)入的環(huán)路,對嬰兒車也十分友好;拱門國家公園則大部分路段都不允許寵物進(jìn)入;兩個地方都要求寵物拴上皮帶等。
每句話都有具體的依據(jù)鏈接供查看:
除此之外,它還會顯示了來自不同網(wǎng)站網(wǎng)友發(fā)布的攻略鏈接。
最重要的是,你可以對它的回答進(jìn)行進(jìn)一步對話式的提問,點(diǎn)擊“ask for a follow up”按鈕即可。
用新的谷歌搜索進(jìn)行購物也非常有趣,它號稱可以幫你迅速做出理性的購買決定。
比如當(dāng)你想要一輛“適合5英里山地通勤的自行車”,它會先告訴你挑選之前需要考慮的重要因素,比如:
一看設(shè)計:電動自行車、公路自行車和混合動力自行車等適合通勤;
二看電機(jī)和電池,三看減震用的懸架,有山路的通勤需要應(yīng)對裂紋和顛簸帶來的沖擊等。
然后再給你推薦合適的車,推薦時還會給出具體產(chǎn)品說明、最新評價、價格和圖片等全面信息。
你也可以進(jìn)行進(jìn)一步提問,比如只要紅色電動自行車,它會進(jìn)一步優(yōu)化回答。
這個功能由谷歌的購物比價產(chǎn)品Shopping Graph提供支持,它可以搜集并不斷更新來自全世界的產(chǎn)品列表。
值得一提的是,谷歌直言更新后的AI搜索界面照樣會植入廣告,但放心:它只會在專用廣告位中出現(xiàn),不會混進(jìn)你的搜索結(jié)果中。
最后,這個新功能目前還只能在谷歌Search Labs中申請試用,且僅限美國地區(qū)的用戶體驗(yàn)。
三大基礎(chǔ)模型上線谷歌云
今年I/O大會,谷歌云的內(nèi)容也同樣搶眼。
在更新了一大波AI能力后,谷歌為自家云端機(jī)器學(xué)習(xí)平臺Vertex AI,上新了三款大模型:
Codey:text-to-code,幫助程序員寫代碼
Imagen:text-to-image,生成高質(zhì)量圖像
Chirp:speech-to-text,方便溝通
這三種模型的能力其實(shí)在今天的發(fā)布會上都有展示過,比如生成代碼、谷歌照片智能編輯等。
除此之外,在Vertex AI上現(xiàn)在還能使用文本和圖像的嵌入式API。它支持將文本和圖像數(shù)據(jù)轉(zhuǎn)換為多維數(shù)值向量、映射語義關(guān)系,從而允許開發(fā)者創(chuàng)建出更加有意思的應(yīng)用。
另一個重大更新則在RLHF上,谷歌表示他們是首個將此功能作為托管服務(wù)放到端到端機(jī)器學(xué)習(xí)平臺行的。好處是能讓企業(yè)結(jié)合RLHF快速訓(xùn)練獎勵模型,用于微調(diào)基礎(chǔ)模型,這對于大模型在行業(yè)應(yīng)用中的準(zhǔn)確性提升非常關(guān)鍵。
除了模型方面,谷歌云在訓(xùn)練上還推出了下一代A3 GPU超算。通過將A3虛擬機(jī)和Nvidia H100結(jié)合,谷歌云能夠提供更大的計算吞吐量和帶寬,能夠讓企業(yè)更快開發(fā)機(jī)器學(xué)習(xí)模型。
除了這些,谷歌這次還帶來售價1799美元(合人民幣約1萬2)的首款折疊屏手機(jī)等新硬件產(chǎn)品,以及接入AI功能的Android 14系統(tǒng)(比如提供信息回復(fù)建議什么的),這里就不一一展示了。
總的來看,作為第15屆I/O大會,谷歌這次著實(shí)給大家?guī)砹朔浅6嗟母韶洝?/p>
值得一提的是,這次上臺介紹的發(fā)言嘉賓,已不見Jeff Dean的身影,他前幾日剛剛職級變動。
作為從前Google AI最代表性發(fā)言的高管,在AI 2.0浪潮里,將何在?
谷歌是否還能在大模型和AI搜索領(lǐng)域中奮起追上,也值得期待。
你對這次谷歌的反擊,滿意嗎?