自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="weit1"><form id="weit1"></form></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

谷歌CEO皮查伊深度解析谷歌史上最強大模型Gemini及即將到來的人工智能時代

2023-12-07 08:39:43

谷歌最近的風頭逐漸被OpenAI搶走，后者于去年推出的DALL-E和GPT-3.5，以及今年推出的GPT-4，主導了整個人工智能行業(yè)，并引發(fā)了初創(chuàng)公司和科技巨頭之間的激烈競爭。

12月7日消息，美國當?shù)貢r間周三，谷歌發(fā)布了其新一代人工智能模型Gemini。Gemini反映了谷歌內部多年來在首席執(zhí)行官桑達爾·皮查伊（Sundar Pichai）的監(jiān)督和推動下所做的努力。

此前負責Chrome和安卓業(yè)務的皮查伊是出了名的產(chǎn)品迷。2016年，他在擔任首席執(zhí)行官后的首封年度創(chuàng)始人信函中預測：“我們將從移動優(yōu)先轉向人工智能優(yōu)先的世界?！睆哪且院蟮膸啄昀?，皮查伊就開始將人工智能技術逐漸融入到谷歌的所有產(chǎn)品中，從安卓設備一直到云計算。

盡管如此，谷歌最近的風頭逐漸被OpenAI搶走，后者于去年推出的DALL-E和GPT-3.5，以及今年推出的GPT-4，主導了整個人工智能行業(yè)，并引發(fā)了初創(chuàng)公司和科技巨頭之間的激烈競爭。

Gemini現(xiàn)在是這場競爭的最新加入者。該系統(tǒng)由谷歌DeepMind領導，這是一個由德米斯·哈薩比斯（Demis Hassabis）領導的新整合部門?，F(xiàn)在，我們已經(jīng)可以在谷歌聊天機器人Bard中體驗Gemini，它將在2024年整合到谷歌的產(chǎn)品線中。

在Gemini發(fā)布前夕，《麻省理工學院技術評論》雜志在谷歌位于加州山景城的辦公室采訪了皮查伊，討論了該模型對谷歌、其產(chǎn)品、人工智能和整個社會的意義。

以下為專訪內容：

問：為什么Gemini如此令人興奮？你能告訴我你對人工智能的總體看法嗎？它的力量，它的用處，它在你們所有產(chǎn)品中的發(fā)展方向？

皮查伊：Gemini令人興奮的一個特別之處在于，它從一開始就是一個原生的多模式模型。就像人類一樣，它不僅僅是在文本上學習，還可以通過視頻、音頻和代碼學習。因此，這個模型天生就能力更強，我認為這將幫助我們梳理出更新的功能，并為該領域的進步做出貢獻。這太令人興奮了。

另一個讓人覺得興奮的地方是，Gemini在32個主要基準測試中，有30個都是表現(xiàn)最好的，尤其是在多模式基準測試中。在MMLU（大規(guī)模多任務語言理解）測試中，它顯示了更大的進步。我個人認為，作為領先基準之一的MMLU，Gemini突破了90%的門檻，這是一個重大的里程碑。兩年前的水平是30%，隨后是40%。由此可以看出，這個領域取得了多大的進步。在57項測試中，Gemini的表現(xiàn)在89%的時候相當于人類專家。這是第一個跨越這個門檻的模型。

我也感到很興奮，因為Gemini終于進入了我們的產(chǎn)品。它將對開發(fā)者開放。這是一個平臺。人工智能是一個深刻的平臺變革，比網(wǎng)絡或移動變革更大。因此，從那一刻起，這對我們來說代表著邁出了一大步。

問：讓我們從這些基準開始。Gemini似乎在幾乎所有測試方面都領先于GPT-4，但并不是遙遙領先。而GPT-4似乎是一個很大的飛躍。我們是否開始在這些大語言模型技術所能做到的事情上趨于停滯，或者你認為我們將繼續(xù)擁有巨大的增長空間？

皮查伊：首先，展望未來，我們確實看到了很大的增長空間。有些基準已經(jīng)很高了。你必須意識到，當你試圖從85%開始突破的時候，你已經(jīng)處于曲線的邊緣。雖然看起來不是很多，但那的確代表正在取得進展。我們還需要更新的基準測試，這也是我們研究MMLU多模式基準的部分原因。對于其中一些新的基準，目前的技術水平仍然要低得多，未來還有很大進步空間。比例定律仍然有效：當我們把模型做大的時候，就會有更多的進展。當我把它放在整體上看時，我真的覺得我們才剛剛開始。

問：我很感興趣的是你認為Gemini的關鍵突破是什么，以及它們將被如何應用？

皮查伊：人們很難想象將會發(fā)生什么樣的飛躍。我們正在提供應用程序開發(fā)接口（API），人們會以非常深刻的方式去體驗它。我認為多模式基準將大有發(fā)展。隨著我們教會這些模型更多地進行推理，將會有越來越大的突破，而且更深層次的突破還在后頭。

解決這個問題的一種方法是Gemini Pro，它在基準測試中表現(xiàn)非常好。但當我們把它放進Bard時，我可以作為一個用戶感受到這一點。我們一直在測試它，所有類別的好評率都有相當大的提升。為此，我們稱它為我們迄今最大的升級之一。當我們同時進行并行評估時，它確實顯示出了優(yōu)異的表現(xiàn)。所以你讓這些更好的模型在基準上得到改進，它會取得進步。我們會繼續(xù)訓練，然后繼續(xù)學習。

但我迫不及待地想把Gemini應用到我們的產(chǎn)品中。這些模型功能非常強大。在接下來的幾個月里，真正設計產(chǎn)品體驗以利用所有模型所擁有的東西將是令人興奮的。

問：Gemini幾乎在所有方面都勝過GPT-4，但只是領先了一點點？我想知道你們從GPT-4的發(fā)布中學到了什么？你學到了什么？在這段時間內，哪些方法發(fā)生了變化？

皮查伊：至少在我看來，這與零和游戲相去甚遠。想想看，向人工智能的轉變是多么深刻，我們還處于早期階段，前方的世界充滿機遇。

但對于你的具體問題，這是一個我們都在快速進步的領域。我們發(fā)表了很多文章，看看像GPT-4這樣的模型在現(xiàn)實世界中是如何工作的。我們從中吸取了教訓。安全是一個重要的領域。所以在Gemini項目中，我們已經(jīng)學習并改進了一些安全技術，這些技術是基于模型在現(xiàn)實世界中的運作方式改進的。它表明了微調等各種事情的重要性。我們在Med-PaLM 2中展示的一件事是，采用一個像PaLM這樣的模型，對它進行微調，以適應特定的領域，顯示它可以勝過最先進的模型。這就是我們學習微調力量的一種方式。

當我們研究Gemini的時候，這其中的很多經(jīng)驗都被用到了。我們花更多時間研發(fā)Gemini Ultra（更先進的Gemini將于明年上市）的部分原因是為了確保我們對其進行了嚴格的安全測試。但我們也在對它進行微調，以真正梳理它的功能。

問：當你看到這些模型被發(fā)布出來，人們開始在現(xiàn)實世界中測試它們時，發(fā)現(xiàn)它們會產(chǎn)生幻覺，或者會透露某些模型訓練的私人數(shù)據(jù)。我想知道，考慮到其所使用的數(shù)據(jù)，如果這是不可避免的，那么這在技術中有多少是固有的。如果這是不可避免的，你會嘗試做哪些事情來限制它？

皮查伊：你是對的。這些都是活躍的研究領域。事實上，我們剛剛發(fā)表了一篇論文，展示了這些模型如何通過一系列提示來泄漏訓練數(shù)據(jù)?；糜X還不是一個可以解決的問題，但我認為我們都在取得進展，只是還有更多的工作要做。我們需要克服一些基本的限制。舉個例子，如果你用Gemini Ultra，我們正在積極地將這些模型與外部第三方合作，他們是這些方面的專家。

在多模式等領域，我們想要更大膽，我們想要負起責任。我們將更加小心多模式模型的推出，因為錯誤用例的可能性更高。但你是對的，它仍然是一項正在開發(fā)中的技術，它們不會對所有事情都有意義，在搜索中，我們會更加小心地考慮如何使用它，何時使用，在哪里使用，以及何時觸發(fā)它。它們有很多驚人的能力，但也有明顯的缺點。這是擺在我們所有人面前需要解決的艱巨挑戰(zhàn)。

但未來的人工智能系統(tǒng)可能與我們今天擁有的不一樣，這就像有人認為你不可能把電腦裝進口袋一樣。同樣地，看著這些系統(tǒng)，說你無法再設計出更好的系統(tǒng)，我不同意這種觀點。已經(jīng)有許多研究探索正在進行中，思考如何解決這些問題。

問：你認為人工智能將帶來深刻的變革。在最近的一些轉變中，比如向移動設備的轉變，它并不一定會提高生產(chǎn)率，這在很長一段時間內，生產(chǎn)率一直保持未變。還有一種觀點甚至認為，它甚至可能加劇了收入不平等。谷歌正在做什么樣的工作來確保這種轉變對社會更有益?

皮查伊：這是個非常重要的問題。我從幾個層面上思考這個問題。在谷歌，我們一直關注的一件事是：我們如何讓技術盡可能廣泛地使用？我認為，即使是在移動領域，我們利用安卓做了很多工作，但仍有數(shù)億人依然無法使用手機。我們正在努力推出一款價格合理的智能手機，價格可能低于50美元。

所以，讓人工智能對每個人都有幫助是我考慮的重點。你試著讓盡可能多的人接觸到你。我認為這是其中的一部分。

我們正在深入思考如何將人工智能應用到對人們有益的用例中。例如，我們早期做洪水預報的原因是因為我們意識到，我們可以探測到模式，并且做得很好。我們用它來翻譯100種語言。我們現(xiàn)在確實在嘗試用不同的語言提供內容，否則你將無法訪問這些內容。

這并不能解決你說的所有問題。但要慎重考慮，何時何地你將專注于解決什么樣的問題。以AlphaFold這樣的領域為例。我們?yōu)槭澜绺鞯氐牟《咎峁┝艘粋€開放的數(shù)據(jù)庫。但是，誰會最先使用它？人工智能不會神奇地讓某些更困難的問題變得更好，比如不平等，還是它可能會加劇這種情況？

重要的是，你要確保每個人都能使用技術。你在早期開發(fā)它，讓人們接觸到它，參與到對話中，這樣社會就可以幫助測試它，并適應它。

在這項技術上，我們肯定比其他公司參與得更早。你知道，最近我們參加了英國人工智能安全論壇，并在美國與國會和政府合作，我們正在嘗試建立更多的公私合作伙伴關系，更早地吸引非營利機構和學術機構參與進來。至于對就業(yè)等領域的影響，還需要深入研究，但我確實認為會有驚喜。

我可以舉很多例子來說明手機帶來的好處，我認為人工智能技術也是如此。我們已經(jīng)在糖尿病視網(wǎng)膜病變等領域展示了這一點，畢竟世界上許多地方?jīng)]有足夠的醫(yī)生來檢測這種疾病。就像我覺得讓世界各地的人們都能使用谷歌搜索一樣，我認為這是擴大人工智能使用范圍的一種方式。

問：有些事情顯然會幫助人們更有效率。編程就是一個很好的例子。然而，這項技術的普及正在威脅就業(yè)。即使你不能為社會提供所有的答案，一家公司也可以推出一款能夠改變世界并產(chǎn)生深遠影響的產(chǎn)品。

皮查伊：我們從未提供面部識別API，但其他人開發(fā)了API，技術正在向前發(fā)展。因此，它并非掌握在任何一家公司手中。我認為答案要復雜得多。社會也可能被甩在后面。如果你不采用這些技術，它可能會影響你的經(jīng)濟競爭力。你可能會失去更多的工作。

我認為正確的答案是負責任地部署技術，并取得進步，思考它可能造成更嚴重傷害的領域，并努力減輕它。同時，也將會出現(xiàn)新的工作類型。如果你看一下過去的五六十年，麻省理工學院的經(jīng)濟學家們的研究表明，大多數(shù)新創(chuàng)造的就業(yè)機會都是在自那以后出現(xiàn)的新領域。

將會有新的工作機會出現(xiàn)，會有更好的工作，人們將會被從一些重復性的工作中解放出來，你可以更有創(chuàng)造性地表達自己。你可以是醫(yī)生，可以是放射科醫(yī)生，也可以是程序員。你花在日常任務上的時間與深度思考的時間，所有這些都可以改變，讓工作變得更有意義。還有些工作崗位可能會被取代。那么，作為一個社會，你如何再培訓，重新培訓人們，創(chuàng)造機會？

問：去年，人們在看待人工智能的方式上出現(xiàn)了哲學分歧。你可以支持安全第一，或者商業(yè)用例優(yōu)先，你可以支持加速論者，也可以是末日論者。你所處的位置是，你必須把所有這些哲學聯(lián)系起來，把它們結合起來。我想知道，你個人是如何看待谷歌把這些興趣聯(lián)系起來的，畢竟谷歌將成為這個領域的領導者，進入一個新世界。

皮查伊：我是一個技術樂觀主義者?；谖业膫€人生活，我一直對人和人性抱有信念。所以，總的來說，我認為人類將利用技術為自己造福。所以我一直是個樂觀主義者。你說得對，像人工智能這樣強大的技術有二元性。

這意味著，有時我們會大膽地向前邁進，因為我認為我們可以推動最先進的技術。例如，如果人工智能可以幫助我們解決癌癥或氣候變化等問題，你會想盡一切辦法讓它快速發(fā)展。但你肯定需要社會制定框架來適應，無論是深度造假還是取代工作等等。這將成為一個前沿領域，與氣候變化沒有什么不同。這將是我們所有人在未來十年努力解決的最大問題之一。

問：另一個懸而未決的問題是圍繞人工智能的法律法規(guī)。有關于合理使用的問題，有關于能否保護版權的問題。對于知識產(chǎn)權來說，這似乎將是一件大事。你如何告訴那些使用你產(chǎn)品的人，讓他們有一種安全感，他們所做的事情不會讓他們被起訴?

皮查伊：并不是所有的問題都有簡單的答案。在人工智能出現(xiàn)之前，當我們開發(fā)搜索、YouTube等產(chǎn)品時，我們一直在努力實現(xiàn)正確的價值交換。人工智能也是如此。我們肯定會專注于確保我們可以根據(jù)法律允許的數(shù)據(jù)進行培訓，讓人們有機會選擇退出。還有一個層面是關于什么是合理使用。為原創(chuàng)內容的創(chuàng)造者創(chuàng)造價值是很重要的，這些都是重要的領域?；ヂ?lián)網(wǎng)就是一個例子，或者當電子商務開始時：你如何在電子商務和常規(guī)商務之間劃清界限？

隨著時間的推移，會有新的法律框架出現(xiàn)，這就是我對這個領域發(fā)展的看法。但與此同時，我們將努力遵守法律，并確保我們今天也與許多內容提供商保持深厚的關系。有一些領域存在爭議，但我們正在努力解決這些問題。我們必須創(chuàng)造一個雙贏的生態(tài)系統(tǒng)，讓所有這些都能長期發(fā)揮作用。

問：當下人們對網(wǎng)絡的擔憂很多集中于搜索的未來。當你有一種技術可以根據(jù)網(wǎng)絡上的信息為你回答問題時，有人就會擔心人們可能不再需要訪問這些網(wǎng)站了。這似乎也會對谷歌產(chǎn)生影響。我想知道你是否在考慮你自己的生意？

皮查伊：我們在搜索方面的一個獨特價值主張是，我們幫助用戶發(fā)現(xiàn)和學習新事物，并找到答案，但始終著眼于與他們分享網(wǎng)絡上存在的豐富、多樣性觀點。這也是我們開發(fā)產(chǎn)品的一個重要原則。我不認為人們在搜索時總會說：“幫我回答就好了?！币苍S有一兩個問題是你想要的，但即使你回來了，你會學到更多，甚至在這個過程中，你會走得更深入。我們總是想要確保我們做的是正確的，我認為這一點不會改變。重要的是我們要保持平衡。

同樣，如果你深入地傳遞價值，你所傳遞的東西就會有商業(yè)價值。從臺式機到移動設備，我們都有類似的問題，這對我們來說并不新鮮?；谖覀兯吹降囊磺幸约坝脩魧Ω哔|量廣告的反應，我感到很放心。YouTube就是一個很好的例子，我們開發(fā)了訂閱模式。這也很有效。

問：當這些產(chǎn)品開始真正進入市場并開始互動時，你認為明年人們的體驗會發(fā)生怎樣的變化？

皮查伊：我想從現(xiàn)在開始的未來一年，任何開始使用Google Docs的人都會期待一些不同的東西。如果你把它給他們，然后把它們放回到我們在2022年擁有的Google Docs版本中，他們會發(fā)現(xiàn)其已經(jīng)過時了。這就像，對我的孩子來說，如果Google Docs沒有拼寫檢查，他們基本上會認為它出問題了。我們可能還記得在拼寫檢查之前使用這些產(chǎn)品是什么感覺。但與其他公司相比，我們在搜索中融入了如此多的人工智能，人們已經(jīng)認為這些自動功能是理所當然的。這是我多年來學到的一件事，讓他們認為這是理所當然的。

就人們可以做的事情而言，隨著我們開發(fā)多模式能力，人們將能夠以一種他們以前無法做到的方式完成更復雜的任務。而且將會有真正的用例，它們的功能要強大得多。

責任編輯：姜華來源：網(wǎng)易科技

人工智能大模型

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sub id="cszsm"></sub>

<style id="cszsm"></style>