Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升級(jí)來(lái)了
Gemini AI平臺(tái)又雙叒升級(jí)了。
這次,谷歌直接給配上了Gems助手,還有最新圖像生成模型Imagen 3!
圖片
這當(dāng)中,最讓人興奮的便是,Imagen 3可以人人用上了。
網(wǎng)友們?cè)缫鸭辈豢赡?,紛紛上手開(kāi)啟了測(cè)試。
圖片
Imagen 3支持人物生成了
5月的I/O開(kāi)發(fā)者大會(huì)上,谷歌首次對(duì)外亮相了Imagen 3圖像生成的能力。
圖片
此后幾個(gè)月時(shí)間,這個(gè)AI生圖工具一直在測(cè)試中。
正如當(dāng)時(shí)博文所述,Imagen 3可以根據(jù)文本提示,創(chuàng)建出更高質(zhì)量的圖像。
圖片
另外,Imagen 3設(shè)定了圖像質(zhì)量的新標(biāo)準(zhǔn),只需幾個(gè)單詞就能生成圖像。
你甚至可以要求Gemini 創(chuàng)作各種風(fēng)格的圖像,比如照片上的寫實(shí)風(fēng)景畫、紋理油畫,或者是異想天開(kāi)的泥土場(chǎng)景。
圖片
值得注意的是,谷歌再次引入了生成人類圖像的照片。此前,因AI生圖人物帶上了有色眼鏡,谷歌便被全網(wǎng)攻擊。
為了解決人們對(duì)深度造假、錯(cuò)誤信息的擔(dān)憂,谷歌已采取了安全措施,比如水印SynthID。
圖片
升級(jí)后的模型,外媒Ars測(cè)試后發(fā)現(xiàn),當(dāng)讓AI生成拜登打籃球的圖像時(shí),會(huì)被拒絕請(qǐng)求。
而當(dāng)你請(qǐng)求「美國(guó)總統(tǒng)打籃球」,便可以得到更多的請(qǐng)求選擇。
另外,在一些快速測(cè)試中,Imagen 3還避免了生成「歷史上不準(zhǔn)確」的種族陷阱。
比如,讓它生成一副英國(guó)國(guó)王肖像,AI會(huì)生成穿著一襲紅色長(zhǎng)袍,留著胡須的白人,而不是以往種族多元化戰(zhàn)士的組合。
如下是生成教皇的照片,可以看出整體非常穩(wěn)定。
圖片
以往的生圖效果是下面這樣的,左右性別不一致,而且樣貌多樣。
圖片
現(xiàn)在,當(dāng)你再讓Imagen 3去描繪歷史場(chǎng)景,便會(huì)違反谷歌的人工智能的規(guī)則。
然而,谷歌Gemini此前毫不避諱地生成出了,穿著納粹風(fēng)格衣服的亞洲人、黑人。
有人測(cè)試后,感覺(jué)Imagen 3整體效果不錯(cuò),不過(guò)仍有很長(zhǎng)的路要走。
圖片
定制AI助手Gems
專門化的人工智能助手Gems支持Gemini Advanced,企業(yè)、以及商業(yè)用戶,面向150多個(gè)國(guó)家。
現(xiàn)在,任何一個(gè)人可以通過(guò)Gems,為特定任務(wù)訓(xùn)練一個(gè)「數(shù)字專家」。
圖片
它可以是編碼導(dǎo)師,也可以是營(yíng)銷策略師等等。
谷歌希望,這類面向定特任務(wù)的AI助手,能夠解決像GPT-4o這樣通用語(yǔ)言模型的局限性。
因?yàn)橥ㄟ^(guò)專門數(shù)據(jù)訓(xùn)練/定制的專業(yè)助手,能夠提供更加實(shí)用、更高效的解決方案。
圖片
AI巨頭激戰(zhàn)正酣,谷歌毫不示弱
過(guò)去一年里,包括OpenAI、微軟、Meta、Anthropic、HuggingFace等在內(nèi)的公司,都推出了可定制的AI聊天機(jī)器人平臺(tái)。
這標(biāo)志著整個(gè)行業(yè),向個(gè)性化AI體驗(yàn)轉(zhuǎn)變。
OpenAI的GPT Store于1月推出之后,開(kāi)發(fā)者們可以創(chuàng)建和分享ChatGPT的定制版本。
微軟的Copilot Studio,可以讓企業(yè)能夠開(kāi)發(fā)定制的AI助手,而Meta的AI Studio是為了創(chuàng)建定制聊天機(jī)器人。
Anthropic展示了Claude自動(dòng)化任務(wù)的能力,HuggingFace為定制GPT提供了一個(gè)開(kāi)源的解決方案。
此時(shí),Gems和Imagen 3的發(fā)布,似乎是谷歌試圖追趕,甚至趕超競(jìng)爭(zhēng)對(duì)手的一次嘗試。
一直以來(lái),谷歌是AI研究領(lǐng)域的先驅(qū),但在面向消費(fèi)者的AI產(chǎn)品推向市場(chǎng)方面,有時(shí)會(huì)落后于對(duì)手。
特別是,在別家早已發(fā)布自定義助手之后,谷歌才有所行動(dòng)。
從科幻到現(xiàn)實(shí):AI重塑世界
話又說(shuō)回來(lái),不論是誰(shuí)家發(fā)布,這一新功能可能會(huì)對(duì)整個(gè)行業(yè),產(chǎn)生深遠(yuǎn)的影響。
在教育領(lǐng)域,AI導(dǎo)師可能會(huì)提供個(gè)性化學(xué)習(xí)體驗(yàn);在醫(yī)療保健中,專門的AI助手能診斷和治療規(guī)劃。
在企業(yè)中,可以使用定制AI工具簡(jiǎn)化運(yùn)營(yíng)。
另一方面,AI的進(jìn)步也引發(fā)了關(guān)于數(shù)據(jù)隱私、工作替代、潛在濫用的問(wèn)題。
盡管谷歌采取了一些強(qiáng)有力的安保措施,但AI發(fā)展的步伐已經(jīng)超過(guò)了監(jiān)管框架。
隨著AI繼續(xù)深入日常生活,谷歌Gemini AI可能會(huì)激發(fā)出這項(xiàng)技術(shù)的變革潛力。
參考資料:
https://venturebeat.com/ai/googles-gemini-ai-gets-major-upgrade-with-gems-assistants-and-imagen-3/
https://blog.google/products/gemini/google-gemini-update-august-2024/