自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="jl9f0"></cite>

<bdo id="jl9f0"></bdo>

^{<thead id="jl9f0"></thead>}<cite id="jl9f0"><rp id="jl9f0"><form id="jl9f0"></form></rp></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

創(chuàng)新突破！字節(jié)跳動(dòng)首創(chuàng)無需數(shù)據(jù)，1.58位超低量化自監(jiān)督生成

發(fā)布于 2025-1-2 13:58

瀏覽

0收藏

Midjourney、DALLE 3、SD3等模型的出現(xiàn)，使得文生圖像賽道實(shí)現(xiàn)了快速發(fā)展。但這些模型的參數(shù)非常大，在推理、生成的過程中占用了大量?jī)?nèi)存，極大限制了使用場(chǎng)景和設(shè)備。

為了解決這一難題，字節(jié)跳動(dòng)的研究人員發(fā)布了創(chuàng)新的量化方法，不需要訪問任何實(shí)際的圖像數(shù)據(jù)，僅依賴模型自身的自監(jiān)督信號(hào)即可。研究人員在著名開源文生圖像模型FLUX進(jìn)行了實(shí)驗(yàn)。結(jié)果顯示，成功將FLUX的模型量化到1.58位權(quán)重，僅用{-1, 0, +1}三種值就能表示而不是更高精度的浮點(diǎn)數(shù)。

盡管模型被量化到如此低的位數(shù)，但在生成 1024 x 1024 分辨率圖像時(shí)，性能仍與未量化的模型基本一致。為了支持1.58位的運(yùn)算，還開發(fā)了一個(gè)專用的計(jì)算內(nèi)核，存儲(chǔ)減少了 7.7 倍，推理內(nèi)存減少了5.1倍，極大降低了對(duì)存儲(chǔ)、內(nèi)存的需求。

創(chuàng)新突破！字節(jié)跳動(dòng)首創(chuàng)無需數(shù)據(jù)，1.58位超低量化自監(jiān)督生成-AI.x社區(qū)

先為大家簡(jiǎn)單介紹一下什么是量化技術(shù)。量化是一種模型壓縮技術(shù)，主要通過減少模型權(quán)重的精度來降低模型的大小和計(jì)算需求。在傳統(tǒng)的深度學(xué)習(xí)模型中，權(quán)重通常以32 位浮點(diǎn)數(shù)存儲(chǔ)，這占用了大量的內(nèi)存空間。

量化技術(shù)通過將這些權(quán)重映射到更少的位表示，比如8 位或更低，從而顯著減少了模型的存儲(chǔ)需求。量化還可以減少模型在推理時(shí)的計(jì)算量，因?yàn)檎麛?shù)運(yùn)算比浮點(diǎn)運(yùn)算更快、更高效。

在1.58-位FLUX的研究中，量化的應(yīng)用達(dá)到了一個(gè)新的巔峰，研究人員沒使用常見的8 位或更低的精度，而是將FLUX模型中的權(quán)重量化到了1.58 位，僅用三個(gè)數(shù)值就能表示。雖然高性能量化方式極大地壓縮了模型的大小，但也有一個(gè)很大難題，如何在低精度下保持模型的性能。

創(chuàng)新突破！字節(jié)跳動(dòng)首創(chuàng)無需數(shù)據(jù)，1.58位超低量化自監(jiān)督生成-AI.x社區(qū)

為了實(shí)現(xiàn)這一目標(biāo)，研究團(tuán)隊(duì)采用了一種后訓(xùn)練量化（PTQ）的方法。傳統(tǒng)的 QAT 方法通常需要在模型訓(xùn)練過程中引入額外的量化操作，并對(duì)模型進(jìn)行微調(diào)。這一過程往往涉及到復(fù)雜的訓(xùn)練機(jī)制調(diào)整和大量額外的計(jì)算資源投入。模型需要在訓(xùn)練過程中不斷適應(yīng)量化帶來的精度損失，通過反向傳播等技術(shù)手段來調(diào)整模型參數(shù)，以盡量減少量化對(duì)模型性能的影響。

而PTQ無需在訓(xùn)練過程中對(duì)模型進(jìn)行繁瑣的微調(diào)操作，直接聚焦于預(yù)訓(xùn)練好的模型進(jìn)行量化處理，可以充分利用已經(jīng)訓(xùn)練完成的 FLUX.1 - dev 模型所包含的豐富訓(xùn)練數(shù)據(jù)和強(qiáng)大能力，避免了重新訓(xùn)練所帶來的巨大計(jì)算開銷和時(shí)間消耗。

為了進(jìn)一步確保 1.58 位 FLUX模型在推理過程中的高效性，研究團(tuán)隊(duì)在 PTQ 方法的基礎(chǔ)上，還開發(fā)了專門針對(duì) 1.58 位操作優(yōu)化的自定義內(nèi)核。這個(gè)內(nèi)核在模型推理過程中發(fā)揮著至關(guān)重要的作用。通過優(yōu)化數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)和訪問模式，使得模型在運(yùn)行時(shí)能夠以更低的內(nèi)存占用實(shí)現(xiàn)高效計(jì)算。

創(chuàng)新突破！字節(jié)跳動(dòng)首創(chuàng)無需數(shù)據(jù)，1.58位超低量化自監(jiān)督生成-AI.x社區(qū)

在不同類型的 GPU 上進(jìn)行測(cè)試時(shí)，1.58 位FLUX 借助該自定義內(nèi)核實(shí)現(xiàn)了推理內(nèi)存使用量的大幅減少，減少倍數(shù)超過 5.1 倍。在推理過程中，模型能夠更加有效地利用內(nèi)存資源，降低了內(nèi)存溢出的風(fēng)險(xiǎn)，提高了系統(tǒng)的整體穩(wěn)定性和運(yùn)行效率。

此外，自定義內(nèi)核還通過優(yōu)化計(jì)算流程，減少了不必要的計(jì)算步驟和數(shù)據(jù)傳輸，顯著提高了模型的推理速度，降低了推理延遲。例如，在處理復(fù)雜圖像生成任務(wù)時(shí)，1.58 位 FLUX 能夠更快地響應(yīng)用戶請(qǐng)求，生成高質(zhì)量的圖像結(jié)果提供更好的使用體驗(yàn)。

在性能評(píng)估方面，研究人員在GenEval數(shù)據(jù)集和T2I CompBench驗(yàn)證分割上評(píng)估了FLUX和1.58-位 FLUX。評(píng)估方法遵循官方的圖像生成流程，生成的圖像分辨率為1024×1024。結(jié)果顯示，1.58 位 FLUX在多個(gè)指標(biāo)上與FLUX相當(dāng)，這證明了量化后的模型在保持性能方面的優(yōu)勢(shì)。

創(chuàng)新突破！字節(jié)跳動(dòng)首創(chuàng)無需數(shù)據(jù)，1.58位超低量化自監(jiān)督生成-AI.x社區(qū)

在效率方面，1.58-位 FLUX在模型存儲(chǔ)和推理內(nèi)存方面都顯示出顯著的效率提升。例如，與FLUX相比，1.58-位 FLUX將檢查點(diǎn)存儲(chǔ)減少了7.7倍。這一成果是通過將1.58位權(quán)重存儲(chǔ)為2位有符號(hào)整數(shù)實(shí)現(xiàn)的，從而將它們從16位精度壓縮。

在推理延遲方面，1.58-位 FLUX在不同GPU上的表現(xiàn)也有所提升。尤其是在性能較低但適合部署的GPU上，例如，L20和A10，1.58-位 FLUX的推理延遲得到了顯著改善。

研究人員表示，這個(gè)量化方法很快就會(huì)開源，幫助更多受算力、內(nèi)存限制的人員來實(shí)現(xiàn)更高效的模型推理。

即將開源：https://github.com/Chenglin-Yang/1.58bit.flux

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/7rp3wLmTwi0jU9PvZMdfbQ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

AI生成存儲(chǔ)基座：自研超大規(guī)模向量數(shù)據(jù)庫 Dolphin VectorDB

jordana ? 3128瀏覽 ? 0回復(fù)
重大突破！IDAdapter：首個(gè)無需微調(diào)，單張圖像生成多樣和個(gè)性化頭像方案(北大&格靈深瞳）

angel ? 5275瀏覽 ? 0回復(fù)
圖像生成里程碑！VAR:自回歸模型首超Diffusion Transformer?。ū贝?amp;字節(jié)）

angel ? 1.1w瀏覽 ? 0回復(fù)
字節(jié)開源大模型量化新思路，2-bit量化模型精度齊平fp16

輕薄滴假象 ? 3111瀏覽 ? 0回復(fù)
量化大模型退化嚴(yán)重？ETH北航字節(jié)推出LoRA新范式 | ICML 2024

Crystalcxt ? 2256瀏覽 ? 0回復(fù)
【創(chuàng)新一夏學(xué)習(xí)季】熱浪升溫，創(chuàng)新一夏，釋放開發(fā)潛能

AI.x社區(qū)官方賬號(hào) ? 52.8w瀏覽 ? 39回復(fù)
字節(jié)跳動(dòng)發(fā)布統(tǒng)一多模態(tài)大模型 Show-o!

AI論文解讀 ? 3819瀏覽 ? 0回復(fù)
【活動(dòng)結(jié)果公布】AIGC創(chuàng)新先鋒者征文大賽懸賞召集?

AI.x社區(qū)官方賬號(hào) ? 6198瀏覽 ? 0回復(fù)
快手自研Spark向量化引擎正式發(fā)布，性能提升200%

快手技術(shù) ? 2104瀏覽 ? 0回復(fù)
突破個(gè)性化圖像生成局限！MagicTailor：組件可控個(gè)性化圖像生成創(chuàng)新框架！

angel ? 2565瀏覽 ? 0回復(fù)
首次超越擴(kuò)散模型和非自回歸Transformer模型！字節(jié)開源RAR：自回歸生成最新SOTA！

angel ? 2114瀏覽 ? 0回復(fù)
機(jī)器學(xué)習(xí)四大范式：監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和自監(jiān)督學(xué)習(xí)

智駐未來 ? 1.2w瀏覽 ? 0回復(fù)
字節(jié)跳動(dòng)等發(fā)布首個(gè)1.58-bit FLUX量化模型

angel ? 2478瀏覽 ? 0回復(fù)
Bert重大創(chuàng)新，RAG突破512長(zhǎng)度限制

CourseAI ? 1932瀏覽 ? 0回復(fù)
即插即用，無痛增強(qiáng)模型生成美感！字節(jié)跳動(dòng)提出VMix:細(xì)粒度美學(xué)控制，光影、色彩全搞定

angel ? 1721瀏覽 ? 0回復(fù)
字節(jié)跳動(dòng)開源

angel ? 1800瀏覽 ? 0回復(fù)
突破性創(chuàng)新：Genius框架實(shí)現(xiàn)大語言模型無監(jiān)督自我進(jìn)化

頓數(shù)AI ? 614瀏覽 ? 0回復(fù)
ControlNet作者：視頻生成論文Frameback，超低顯存生成高質(zhì)量視頻，ComfyUI必備組件！

石映飛云 ? 463瀏覽 ? 0回復(fù)
字節(jié)跳動(dòng)開源多模態(tài)AI Agent—UI-TARS-1.5

Aceryt ? 970瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來啦 6天前發(fā)布
字節(jié)跳動(dòng)開源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：普華永道發(fā)布2025年AI預(yù)測(cè)：AI Agents將勞動(dòng)力提升1倍

下一篇：突破算力限制！Meta開源“記憶層”，重塑Transformer架構(gòu)大模型

社區(qū)精華內(nèi)容

目錄

<cite id="e6yz3"><track id="e6yz3"></track></cite>

<sub id="e6yz3"><rt id="e6yz3"></rt></sub>

<em id="e6yz3"><p id="e6yz3"></p></em>