自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="djq30"></style>

<cite id="djq30"></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨精華

發(fā)布于 2025-3-26 10:54

瀏覽

0收藏

今天凌晨2點(diǎn)，OpenAI進(jìn)行了技術(shù)直播，對(duì)GPT-4o和Sora進(jìn)行了重大更新，提供了全新文生圖模型。

除了文生圖之外，該模型還支持自定義操作、連續(xù)發(fā)問、風(fēng)格轉(zhuǎn)換、圖像PPT等超實(shí)用功能，例如，更改圖片的寬高比、圖像物體中的角度，用十六進(jìn)制代碼指定精確顏色等。

尤其是生成圖像的逼真度，肉眼幾乎看不出任何破綻，在精細(xì)度、細(xì)節(jié)和文本遵循方面非常出色，可以媲美甚至在某些功能超過該領(lǐng)域的頭部平臺(tái)Midjourney。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

新圖像模型功能展示

話不多說，「AIGC開放社區(qū)」就用免費(fèi)版為大家展示一下實(shí)際的生成案例。

我們先測試一下模型的文本還原和細(xì)節(jié)表現(xiàn)，來個(gè)復(fù)雜點(diǎn)的提示詞。

提示詞：一個(gè)由甜品組成的奇幻世界，地面是柔軟的奶油草坪，樹木是用巧克力棒和糖果制作的，樹葉是五彩繽紛的果凍。天空中漂浮著巨大的棉花糖云，遠(yuǎn)處有一個(gè)冰淇淋火山正在噴涌彩色的糖漿。

場景中還有一座用蛋糕堆砌的小屋，屋頂是草莓醬，窗戶是糖玻璃，細(xì)節(jié)包括散落的糖粒、路上的巧克力碎片，以及跳躍的小糖果精靈。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

構(gòu)圖、文本還原能力非常棒！一次就完成，生成時(shí)間大約在15秒左右。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

再試一下它的新功能，其實(shí)OpenAI官方說這是一個(gè)“世界知識(shí)”功能，但是使用之后感覺更像是一個(gè)圖像PPT功能，對(duì)于教育、金融、醫(yī)療等領(lǐng)域幫助非常大。

例如，幫我用圖像介紹牛頓第一定律。就能直接生成詳細(xì)介紹牛頓定律的圖像，感覺和PPT差不多吧。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

提示詞：用一張圖片介紹人體各個(gè)結(jié)構(gòu)。

這個(gè)人體介紹圖片就豐滿很多，放在醫(yī)療介紹或PPT里應(yīng)該不錯(cuò)吧。以后做各種宣傳資料不愁找不到量身定制的圖片了。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

如果不滿意，可以基于該圖片繼續(xù)發(fā)問，例如，我們想看上面人體介紹的骨骼。提示詞：可以詳細(xì)展示骨骼介紹嗎？

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

我們放大手部骨骼，繼續(xù)提問：來一張手部骨骼的特寫。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

需要注意的是，圖像的文字介紹可能比較模糊或混亂，這是因?yàn)橹形奶崾镜脑?，如果使用英文?huì)好很多。

那我們就用英文提示詞來試一下，In a study filled with a retro atmosphere, on the corkboard beside the wooden desk, magnetic word - spelling cards fixed with colorful pushpins form a unique poem:

Line 1: "A melody"

Line 2: "Can wake up"

Line 3: "The slumbering memories,"

Line 4: "However, occasionally" (There is a large gap here)

Line 5: "On a silent night"

Line 6: "Will deepen"

Line 7: "That longing."

文字的嵌入和排列順序還是相當(dāng)不錯(cuò)的。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

這個(gè)提示詞的大意是，在一間充滿復(fù)古氛圍的書房里，木質(zhì)書桌旁的軟木板上，掛著用彩色圖釘固定的磁性拼詞卡片，組成一首獨(dú)特的詩：第一行：“一段旋律” 第二行：“能喚醒” 第三行：“沉睡的記憶，” 第四行：“然而偶爾” （此處有較大間隔）第五行：“在寂靜的夜晚” 第六行：“會(huì)加深” 第七行：“那份思念?！?/p>

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

上面只是一些非常簡單、基礎(chǔ)的玩法，有興趣小伙伴可以體驗(yàn)一下非常棒。

對(duì)于新的文生圖模型，OpenAI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sam Altman也給出了非常高的評(píng)價(jià)。

這是一項(xiàng)令人難以置信的產(chǎn)品。我還記得看到這個(gè)模型最初生成的一些圖像時(shí)，很難相信它們真的是由人工智能創(chuàng)作的。我們認(rèn)為大家會(huì)喜歡它，并且很期待看到由此激發(fā)的創(chuàng)造力。

這代表著我們在給予創(chuàng)作自由方面達(dá)到了一個(gè)新的高度。人們將會(huì)創(chuàng)作出一些非常了不起的作品，也會(huì)有一些可能冒犯他人的內(nèi)容；我們的目標(biāo)是，除非用戶有此需求，否則該工具不會(huì)生成冒犯性內(nèi)容，即便有此需求，生成的內(nèi)容也需在合理范圍內(nèi)。

正如我們在模型規(guī)格說明中提到的，我們認(rèn)為將這種知識(shí)創(chuàng)作自由和控制權(quán)交到用戶手中是正確的做法，但我們也會(huì)觀察其發(fā)展情況并傾聽社會(huì)的聲音。

我們認(rèn)為，尊重社會(huì)最終為人工智能設(shè)定的廣泛界限是正確的做法，而且隨著我們離通用人工智能越來越近，這一點(diǎn)也變得越來越重要。在此過程中，感謝大家的理解。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

新圖像模型簡單介紹

根據(jù)直播介紹，非自回歸生成是OpenAI新圖像模型的核心之一，是提升圖片質(zhì)量、生成效率的關(guān)鍵技術(shù)。

傳統(tǒng)的圖像生成方法，尤其是基于自回歸模型的技術(shù)，通常是通過逐步生成圖像的每個(gè)像素或部分來構(gòu)建最終的圖像。這種方法雖然在某些情況下能夠生成高質(zhì)量的圖像，但其生成過程往往較為緩慢，并且容易在生成過程中出現(xiàn)累積錯(cuò)誤，導(dǎo)致最終圖像的質(zhì)量下降。

此外，自回歸生成方法在處理復(fù)雜的圖像結(jié)構(gòu)時(shí)也存在一定局限性，因?yàn)樗鼈冃枰诿恳徊缴蛇^程中都依賴于之前生成的內(nèi)容，這使得模型難以全局性地理解和優(yōu)化圖像的整體結(jié)構(gòu)。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

相比之下，非自回歸生成模塊采用了一種全新的思路。不再依賴于逐像素的生成過程，而是直接生成整個(gè)圖像。這一過程的關(guān)鍵在于模型能夠一次性地理解和處理圖像的整體結(jié)構(gòu)和細(xì)節(jié)。非自回歸生成模塊通過一種特殊的編碼器-解碼器架構(gòu)來實(shí)現(xiàn)這一目標(biāo)。

編碼器負(fù)責(zé)將輸入的文本描述或其他模態(tài)信息轉(zhuǎn)化為一種中間表示，包含了生成圖像所需的所有關(guān)鍵信息。然后，解碼器利用這種中間表示直接生成完整的圖像，而無需逐像素地構(gòu)建圖像。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

這種直接生成完整圖像的方式帶來了很多優(yōu)勢。首先，非自回歸生成模塊的生成速度遠(yuǎn)遠(yuǎn)超過了傳統(tǒng)的自回歸方法。由于無需逐像素生成，模型能夠在短時(shí)間內(nèi)生成高質(zhì)量的圖像，這對(duì)于實(shí)時(shí)應(yīng)用和大規(guī)模圖像生成任務(wù)具有重要意義。例如，在需要快速生成大量圖像的設(shè)計(jì)場景或教育場景中，非自回歸生成模塊能夠顯著提高工作效率。

此外，非自回歸生成模塊在生成圖像的質(zhì)量上也表現(xiàn)出色。由于模型能夠一次性地理解和處理圖像的整體結(jié)構(gòu)，生成的圖像在細(xì)節(jié)和一致性方面都得到了顯著提升。

例如，在生成復(fù)雜場景的圖像時(shí)，非自回歸生成模塊能夠更好地處理圖像中的多個(gè)對(duì)象及其相互關(guān)系，生成的圖像更加自然和逼真。此外，非自回歸生成模塊還能夠更好地處理文本指令中的復(fù)雜語義信息，生成與文本描述高度一致的圖像。

剛剛，OpenAI發(fā)布新文生圖模型，免費(fèi)、逼真到難以分辨-AI.x社區(qū)

非自回歸生成模塊的另一個(gè)重要特點(diǎn)是其在多模態(tài)融合中的應(yīng)用。在ChatGPT 4.0模型中，非自回歸生成模塊不僅能夠根據(jù)文本描述生成圖像，還能夠結(jié)合其他模態(tài)的信息，如音頻或已有的圖像，生成更加豐富和多樣化的圖像內(nèi)容。

這種多模態(tài)融合的能力使得模型能夠更好地理解和滿足用戶的需求。例如，用戶可以提供一段音頻描述和一張參考圖像，非自回歸生成模塊能夠結(jié)合這些信息生成一張符合音頻描述且風(fēng)格與參考圖像一致的新圖像。

從今天開始，新的文生圖模型在ChatGPT和Sora中開始向所有Plus、Pro、Team和免費(fèi)用戶推出。面向企業(yè)版、教育版和API即將到來。

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/4Udogb78laXq1NI7C1XgAA??

標(biāo)簽

已于2025-3-26 12:02:26修改

贊

收藏

回復(fù)

舉報(bào)

社區(qū)頭條

熱門內(nèi)容榜 ? 最近上榜

回復(fù)

相關(guān)推薦

剛剛發(fā)布！一鍵生成動(dòng)漫風(fēng)格圖片的開源模型

開發(fā)者阿橙 ? 4304瀏覽 ? 0回復(fù)
谷歌發(fā)布文生圖模型Imagen 3，寫實(shí)效果超強(qiáng)！

Aceryt ? 3636瀏覽 ? 0回復(fù)
如何不爬梯免費(fèi)使用AI文生圖？

數(shù)字化助推器 ? 3321瀏覽 ? 0回復(fù)
媲美Sora，免費(fèi)使用！帶物理模擬的，文生視頻模型

Aceryt ? 3278瀏覽 ? 0回復(fù)
比肩Sora，免費(fèi)試用！國外驚訝，中國文生視頻模型超高質(zhì)量！

Aceryt ? 2934瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布史上最強(qiáng)模型-o1，推理能力超人類博士！

Aceryt ? 2276瀏覽 ? 0回復(fù)
騰訊&新加坡國立發(fā)布IFAdapter：即插即用，提升文生圖模型實(shí)例特征和位置生成準(zhǔn)確性

angel ? 2531瀏覽 ? 0回復(fù)
“左腳踩右腳”提升文生圖模型綜合能力！清北牛津普林斯頓聯(lián)合發(fā)布IterComp

angel ? 2617瀏覽 ? 0回復(fù)
Scaling laws在視覺自回歸模型上失效了？谷歌聯(lián)合MIT發(fā)布Fluid：文生圖質(zhì)量刷新紀(jì)錄！

angel ? 2816瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布sCM提升50倍效率，擴(kuò)散模型重大技術(shù)突破！

玄姐聊AGI ? 1853瀏覽 ? 0回復(fù)
剛剛，OpenAI開源SimpleQA！輕松檢測、校準(zhǔn)大模型能力

Aceryt ? 2570瀏覽 ? 0回復(fù)
NeurIPS 2024 | 全面提升文生圖SOTA方法！ToMe:基于token合并的免訓(xùn)練文生圖語義綁定

angel ? 2481瀏覽 ? 0回復(fù)
Runway全面開放新文生圖模型Frames

Aceryt ? 1692瀏覽 ? 0回復(fù)
為什么大語言模型難以處理長上下文？從 Transformer 到 Mamba

Baihai_IDP ? 2569瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布NextGenAI，徹底顛覆傳統(tǒng)教育

Aceryt ? 1720瀏覽 ? 0回復(fù)
【模型部署】在Dify中接入ComfyUI+Flux實(shí)現(xiàn)文生圖

一起AI技術(shù) ? 2965瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布GPT-4.1，性能暴漲、100萬上下文

Aceryt ? 607瀏覽 ? 0回復(fù)
剛剛，o4-mini發(fā)布！OpenAI史上最強(qiáng)、最智能模型

Aceryt ? 1198瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來啦

Aceryt ? 758瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來啦 6天前發(fā)布
字節(jié)跳動(dòng)開源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：突發(fā)！DeepSeek開源新版V3，再次震驚國外

下一篇：別讓大模型想太多了，過度思考會(huì)影響性能

社區(qū)精華內(nèi)容

目錄

<legend id="harbv"><track id="harbv"></track></legend>

<style id="harbv"></style>

<legend id="harbv"><track id="harbv"></track></legend>

<sub id="harbv"></sub>^{<blockquote id="harbv"></blockquote>}

<sub id="harbv"><p id="harbv"></p></sub>