自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

首超人類專家!OpenAI“混亂”之際,谷歌多模態(tài)大模型Gemini“大殺四方”

人工智能
就在昨日晚間,Google 和 Alphabet CEO Sundar宣布Gemini上線,并稱之為“我們規(guī)模最大、能力最強(qiáng)的 AI 模型”,語驚四座。

在OpenAI“混亂”之際,Google準(zhǔn)備“大殺四方”。

就在昨日晚間,Google 和 Alphabet CEO Sundar宣布Gemini上線,并稱之為“我們規(guī)模最大、能力最強(qiáng)的 AI 模型”,語驚四座。

Gemini的關(guān)鍵詞是“多模態(tài)”,Google針對(duì)三種不同的尺寸對(duì)第一代 Gemini 1.0進(jìn)行了優(yōu)化:Gemini Ultra —規(guī)模最大且功能最強(qiáng)大的模型,適用于高度復(fù)雜的任務(wù);Gemini Pro — 適用于各種任務(wù)的最佳模型;Gemini Nano — 我們端側(cè)設(shè)備上最高效的模型。

Sundar高喊業(yè)界,Gemini 是我們迄今為止最靈活的模型,從數(shù)據(jù)中心到移動(dòng)設(shè)備,它能夠在所有設(shè)備上高效運(yùn)行。

他解釋道,Gemini令人興奮的一個(gè)特別之處在于,它從一開始就是一個(gè)原生的多模式模型。就像人類一樣,它不僅僅是在文本上學(xué)習(xí),還可以通過視頻、音頻和代碼學(xué)習(xí)。因此,這個(gè)模型天生就能力更強(qiáng),我認(rèn)為這將幫助我們梳理出更新的功能,這太令人興奮了。

言外之意,OpenAI你怕不怕?

Gemini的最強(qiáng)性能從何而來?

據(jù)Google DeepMind CEO 和聯(lián)合創(chuàng)始人,Gemini 是我們迄今為止最強(qiáng)大、最通用的模型,它在許多領(lǐng)先的基準(zhǔn)測(cè)試中都展現(xiàn)出了最先進(jìn)的性能。我們的第一個(gè)版本 Gemini 1.0針對(duì)不同尺寸進(jìn)行了優(yōu)化,分別是:Ultra、Pro 和 Nano。這些是進(jìn)入 Gemini 時(shí)代的第一個(gè)模型,也是我們今年早些時(shí)候成立 Google DeepMind 時(shí)的愿景的首次實(shí)現(xiàn)。

他還對(duì)未來以及 Gemini 將為全世界的人們帶來的機(jī)遇感到由衷的興奮。具體來講,Gemini 是包括 Google Research 在內(nèi)的 Google 各團(tuán)隊(duì)間進(jìn)行廣泛合作的成果。它從一開始就被創(chuàng)建為多模態(tài)的模型,這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。

在性能方面, Google對(duì) Gemini 模型進(jìn)行了嚴(yán)格的測(cè)試,從自然圖像、音頻和視頻理解到數(shù)學(xué)推理,在被大型語言模型(LLM)研究和開發(fā)中廣泛使用的32項(xiàng)學(xué)術(shù)基準(zhǔn)中,Gemini Ultra 的性能有30項(xiàng)都超過了目前最先進(jìn)的水平。

(圖注:在一系列多模態(tài)基準(zhǔn)測(cè)試中,Gemini 的性能超越了當(dāng)前最先進(jìn)的水平。)

與此同時(shí),Gemini Ultra 的得分率為90.0%,是第一個(gè)在 MMLU(大規(guī)模多任務(wù)語言理解)測(cè)試中超過人類專家的模型,MMLU 綜合使用了數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等57個(gè)科目,用于測(cè)試世界知識(shí)和解決問題的能力。

針對(duì) MMLU, Google新的基準(zhǔn)測(cè)試方法讓 Gemini 能夠利用其推理能力在回答困難問題之前更加仔細(xì)地思考,從而比僅憑第一印象就直接回答問題有顯著的改善。

在新的 MMMU 基準(zhǔn)測(cè)試中,Gemini Ultra 也取得了得分率為59.4% 的成績(jī),該基準(zhǔn)測(cè)試由橫跨不同領(lǐng)域、需要仔細(xì)推理的多模態(tài)任務(wù)組成。

在 Google的圖像基準(zhǔn)測(cè)試中,Gemini Ultra 在不使用對(duì)象字符識(shí)別 (OCR) 系統(tǒng)來提取圖像中的文本進(jìn)行下一步處理的情況下,表現(xiàn)優(yōu)于以前最好的模型。

AI應(yīng)用大爆發(fā)前夜真正來臨?

不同于一般通用大模型主打的窗口對(duì)話,業(yè)界的共識(shí)是,多模態(tài)大模型才是未來。

在推理方面,Gemini 1.0具有復(fù)雜的多模態(tài)推理能力,可幫助理解復(fù)雜的書面和視覺信息。這使得它具有獨(dú)特的技能,可以在海量的數(shù)據(jù)中發(fā)掘難以辨別的知識(shí)內(nèi)容。它擁有通過閱讀、過濾以及理解信息,從數(shù)十萬份文件中提取見解的卓越能力,將有助于在從科學(xué)到金融等多個(gè)領(lǐng)域以數(shù)字化速度實(shí)現(xiàn)新的突破。

與此同時(shí),Gemini 1.0經(jīng)過訓(xùn)練,可以同時(shí)識(shí)別并理解文本、圖像、音頻等,因此它能更好地理解具有細(xì)微差別的信息,回答與復(fù)雜主題相關(guān)的問題。這就讓它尤其擅長(zhǎng)解釋數(shù)學(xué)和物理等復(fù)雜科目中的推理。

在高級(jí)編碼能力方面,Gemini 還可用作更高級(jí)編碼系統(tǒng)的引擎。兩年前,Google展示了 AlphaCode,它是第一個(gè)在編程競(jìng)賽中性能達(dá)到競(jìng)賽水平的 AI 代碼生成系統(tǒng)?,F(xiàn)在,Google利用一個(gè)專門版本的 Gemini,創(chuàng)建了更先進(jìn)的代碼生成系統(tǒng) AlphaCode 2,該系統(tǒng)擅長(zhǎng)解決那些不僅需要編碼能力而且也需要復(fù)雜數(shù)學(xué)和理論計(jì)算機(jī)科學(xué)知識(shí)的競(jìng)賽性編程問題。

更為重要的是,Google還發(fā)布了迄今為止功能最強(qiáng)大、效率最高且可擴(kuò)展性最強(qiáng)的 TPU 系統(tǒng) Cloud TPU v5p,旨在為訓(xùn)練前沿 AI 模型提供支持。新一代 TPU 將加速 Gemini 的開發(fā),幫助開發(fā)者和企業(yè)客戶更快地訓(xùn)練大規(guī)模生成式 AI 模型,從而更快推出新產(chǎn)品和新功能。

這使得Gemini更可靠、可擴(kuò)展和高效。

安全為核心,“讓 Gemini 普及全球”

據(jù)介紹,在 Google,致力于在所有工作中以大膽而負(fù)責(zé)任的方式推進(jìn) AI。Google方面表示,在開發(fā)的每一個(gè)階段,我們都會(huì)考慮潛在的風(fēng)險(xiǎn),并努力進(jìn)行測(cè)試和降低這些風(fēng)險(xiǎn)。

具體在Gemini 層面,據(jù)了解,Gemini 擁有迄今為止 Google 所有 AI 模型中最全面的安全評(píng)估,包括偏見和毒性評(píng)估?!拔覀儗?duì)網(wǎng)絡(luò)攻擊、說服力和自主性等潛在風(fēng)險(xiǎn)領(lǐng)域進(jìn)行了創(chuàng)新性的研究,并應(yīng)用了 Google Research 一流的對(duì)抗性測(cè)試技術(shù),幫助我們?cè)诓渴?Gemini 之前檢測(cè)關(guān)鍵的安全問題?!?/p>

為了減少傷害,Google構(gòu)建了專門的安全分類器來識(shí)別、標(biāo)記和篩選涉及暴力或負(fù)面刻板印象等方面的內(nèi)容。結(jié)合強(qiáng)大的過濾器,這種分層方法旨在讓 Gemini 對(duì)每個(gè)人都更加安全和包容。此外,Google正繼續(xù)解決模型面臨的已知挑戰(zhàn),例如事實(shí)性、基礎(chǔ)、歸因性以及協(xié)作性。

Google承諾,在安全的基礎(chǔ)上,將通過 Google 的產(chǎn)品將 Gemini 帶給數(shù)十億人。

首先,從今天開始,Bard 將使用 Gemini Pro 的微調(diào)版本來進(jìn)行更高級(jí)的推理、規(guī)劃和理解等。這是 Bard 自推出以來最大的升級(jí)。它將在170多個(gè)國(guó)家和地區(qū)提供英語服務(wù),并且我們計(jì)劃在未來幾個(gè)月內(nèi)擴(kuò)展不同的模態(tài),并支持新的語言和地區(qū)。

其次,Google還將在 Pixel 上使用 Gemini。Pixel 8 Pro 是首款搭載 Gemini Nano 的智能手機(jī),它可以支持錄音應(yīng)用中的“總結(jié)”等新功能,并在 Gboard 中推出“智能回復(fù)”功能,從 WhatsApp 開始,明年還將推出更多信息應(yīng)用。

最后,未來幾個(gè)月,Gemini 將應(yīng)用于我們更多的產(chǎn)品和服務(wù),如 Search、Ads、Chrome 和 Duet AI。Google已經(jīng)開始在 Search 中試驗(yàn) Gemini,它能夠?yàn)橛脩籼峁└斓乃阉魃审w驗(yàn)(SGE),用戶在美國(guó)的英語搜索延遲降低了40%,同時(shí)在質(zhì)量方面也有所提高。

而對(duì)于開發(fā)者,從12月13日開始,開發(fā)者和企業(yè)客戶可以通過 Google AI Studio 或 Google Cloud Vertex AI 中的 Gemini API 獲取 Gemini Pro。

毫無疑問,這是 AI 發(fā)展過程中的一座重要里程碑,也標(biāo)志著 Google 在大模型方面不再接受被人壓著打!

他們的目標(biāo)也非常明確“改變?nèi)驍?shù)十億人的生活和工作方式”。我們拭目以待。

責(zé)任編輯:姜華 來源: 網(wǎng)易科技
相關(guān)推薦

2023-12-07 06:50:07

AI谷歌

2025-01-08 08:21:16

2024-12-12 08:18:50

2023-07-25 08:12:16

AMD撕裂者PRO

2024-12-30 08:33:54

大型模型GeminiLLM

2023-12-09 14:30:50

2024-12-30 00:01:00

多模態(tài)大模型Python

2023-09-19 12:45:36

2023-09-20 08:55:00

模型工具

2023-09-19 20:47:59

谷歌人工智能

2023-09-19 13:48:31

AI數(shù)據(jù)

2018-09-05 17:02:39

戴爾

2025-02-13 09:40:00

2024-09-25 14:53:00

2024-11-13 09:39:13

2024-12-18 18:57:58

2024-03-04 08:10:00

2023-03-06 15:24:54

谷歌人才

2023-12-12 10:57:05

AI谷歌
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)