自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大模型之視頻圖像生成之工作流——ComfyUI和AI煉丹師 原創(chuàng)

發(fā)布于 2024-9-27 17:41
瀏覽
0收藏

“ 工作流既是對大模型技術(shù)的補(bǔ)充,又是大模型市場化的一個重要方向 ”

作為學(xué)習(xí)人工智能技術(shù)的人來說,工作流應(yīng)該是一個耳熟能詳?shù)募夹g(shù),由于大模型的短板原因(邏輯推理,幻覺,知識不足等問題),導(dǎo)致大模型在實(shí)際應(yīng)用中存在很多問題。

而又為了讓大模型能夠解決現(xiàn)實(shí)中工作與生活中的問題,技術(shù)人員就想了一個辦法,利用工作流結(jié)合大模型來完成任務(wù),比如字節(jié)旗下的coze扣子平臺。

而今天我們要介紹的是基于SD(Stable Diffusion)擴(kuò)散模型開發(fā)的工作流組件,與其對應(yīng)的還有WebUI。

什么是ComfyUI,它有什么用?

ComfyUI 是一個開源項(xiàng)目,主要用于構(gòu)建和可視化機(jī)器學(xué)習(xí)工作流程,特別是在圖像生成領(lǐng)域中非常受歡迎。它為用戶提供了一個基于節(jié)點(diǎn)的界面,使用戶能夠通過連接不同的功能節(jié)點(diǎn)來創(chuàng)建復(fù)雜的圖像生成任務(wù)。這些節(jié)點(diǎn)代表了圖像處理的不同步驟,比如文本到圖像的轉(zhuǎn)換、圖像到圖像的變換等。

在傳統(tǒng)的AIGC領(lǐng)域中,AIGC通常被用來生成文字,圖片和視頻,在之前的文章中也講到過關(guān)于AIGC方面的內(nèi)容。

而AIGC面臨主要面臨的是什么問題?

AIGC面臨的主要問題其實(shí)是小眾領(lǐng)域,比如大模型在一些公眾領(lǐng)域表現(xiàn)良好,比如二次元,古風(fēng)這些知名度比較高的領(lǐng)域;但如果讓AIGC生成一個抓泥鰍的視頻可能就沒那么好了。

原因是什么?

原因就是之前說的,大模型在垂直領(lǐng)域表現(xiàn)不佳,不論是AIGC,還是知識庫亦或者是Agent都面臨著這樣的問題。

怎么解決這種問題?

解決這種問題最好的方式就是重新設(shè)計與訓(xùn)練一個垂直領(lǐng)域的大模型,但這種情況成本太高;而退而求其次,就是對大模型進(jìn)行微調(diào),但同樣的微調(diào)對很多小微企業(yè)也是不可接受的,不論是從成本角度還是從技術(shù)角度。

那么為什么要用工作流呢?

在當(dāng)今訓(xùn)練和微調(diào)大模型成本高居不下的情況下,訓(xùn)練和微調(diào)一個大模型的成本實(shí)在是太高了,對絕大部分企業(yè)來說都得不償失。

而工作流的出現(xiàn),在某些方面替代了大模型的微調(diào)功能;所謂的工作流,就是把任務(wù)拆分成一個一個的字節(jié)點(diǎn),通過多個節(jié)點(diǎn)的配合達(dá)到最終目的。

而工作流在其中扮演著什么角色呢?

比如說讓大模型幫我生成一個美女跳舞的視頻,然后有多種風(fēng)格可以選擇;而大模型直接輸出的結(jié)果可能不盡人意。

這時工作流的作用就體現(xiàn)了,比如說工作流由多個節(jié)點(diǎn)組成,第一個節(jié)點(diǎn)幫我生成一個美女跳舞的視頻;第二個節(jié)點(diǎn),幫我在之前視頻的基礎(chǔ)上,生成一個古風(fēng)的跳舞視頻;亦或者生成一個二次元的視頻。

大模型之視頻圖像生成之工作流——ComfyUI和AI煉丹師-AI.x社區(qū)

這時通過工作流的方式,就可以把一個任務(wù)拆分成多個任務(wù),這時就相當(dāng)于給了大模型“思考”的時間,這時大模型的表現(xiàn)自然就會更好。

從事這種設(shè)計工作流輔助大模型進(jìn)行任務(wù)處理的人員,就叫做AI煉丹師;它們的任務(wù)就是根據(jù)需求,設(shè)計不同的工作流,讓大模型用更小的成本,處理更復(fù)雜的任務(wù)。


本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/kqdiDYuY8rmdFsFml5t6Uw??




?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2024-9-27 17:49:37修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦