自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="hcf3a"><p id="hcf3a"></p></sub>

<cite id="hcf3a"></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

開(kāi)源音頻模型Stable Audio Open，文本生成47秒高清音效

發(fā)布于 2024-6-7 10:57

瀏覽

0收藏

6月6日，著名開(kāi)源大模型平臺(tái)Stability.ai在官網(wǎng)宣布，開(kāi)源最新文生音頻模型Stable Audio Open。

用戶通過(guò)文本就能生成最多47秒，鋼琴、笛子、鼓點(diǎn)、模擬人聲等不同類型的44.1kHz音效。

值得一提的是，Stable Audio Open支持?jǐn)?shù)據(jù)微調(diào)，歌手、音樂(lè)人可以讓其生成基于自己的音樂(lè)數(shù)據(jù)，例如，架子鼓手可以根據(jù)自己的鼓點(diǎn)來(lái)進(jìn)行微調(diào)。

開(kāi)源地址：https://huggingface.co/stabilityai/stable-audio-open-1.0

在線demo：https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero

開(kāi)源音頻模型Stable Audio Open，文本生成47秒高清音效-AI.x社區(qū)

根據(jù)Stability.ai介紹，Stable Audio Open使用了486,492個(gè)錄音訓(xùn)練數(shù)據(jù)，其中 472,618 個(gè)來(lái)自Freesound，13874個(gè)來(lái)自免費(fèi)音樂(lè)檔案館，并且所有音頻文件均根據(jù) CC0、CC BY或CC Sampling+獲得了商業(yè)許可。

就是說(shuō)通過(guò)Stable Audio Open生成的音效無(wú)需擔(dān)心商業(yè)化問(wèn)題，不會(huì)受到法律方面的追究。

「AIGC開(kāi)放社區(qū)」根據(jù)其提供的在線demo體驗(yàn)了一下，在文本語(yǔ)義理解、生成音效等方面還是相當(dāng)優(yōu)秀。

需要注意的是，目前只支持英文提示詞，其他任何語(yǔ)言都不行，即便你使用了識(shí)別效果也是相當(dāng)?shù)牟睢?/p>

在生成的過(guò)程中，用戶可以對(duì)時(shí)間、擴(kuò)散步數(shù)和CFG進(jìn)行詳細(xì)控制，以達(dá)到更好的效果。例如，一首非常舒適抒情的鋼琴曲。

開(kāi)源音頻模型Stable Audio Open，文本生成47秒高清音效-AI.x社區(qū)

本文轉(zhuǎn)自 AIGC開(kāi)放社區(qū)，作者：AIGC開(kāi)放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/bz0rtEwNyUWdlz8_3b40LQ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

超10秒高分辨率，北大Open Sora視頻生成更強(qiáng)了，還支持華為芯片

輕薄滴假象 ? 2415瀏覽 ? 0回復(fù)
TAVGBench: 文本生成語(yǔ)音-視頻最新基準(zhǔn)

angel ? 2801瀏覽 ? 0回復(fù)
騰訊AI新研究打破長(zhǎng)文本生成模型限制，序列并行技術(shù)再突破

AI論文解讀 ? 5436瀏覽 ? 0回復(fù)
Stability AI開(kāi)源47秒音頻生成模型，蟲鳴鳥叫、搖滾、鼓點(diǎn)都能生成

輕薄滴假象 ? 2551瀏覽 ? 0回復(fù)
浙大、螞蟻集團(tuán)推出MaPa：文本生成超真實(shí)3D模型

Aceryt ? 2883瀏覽 ? 0回復(fù)
Stable Diffusion 3中型版模型開(kāi)源！

AIGC最前線 ? 2363瀏覽 ? 0回復(fù)
上科大、影眸聯(lián)合提出DressCode：從文本生成3D服裝板片

輕薄滴假象 ? 3225瀏覽 ? 0回復(fù)
僅需1分鐘，文本生成高質(zhì)量3D模型—Meta 3D-Gen

Aceryt ? 2926瀏覽 ? 0回復(fù)
Midjourney大更新，細(xì)節(jié)最強(qiáng)文本生圖片模型來(lái)啦！

Aceryt ? 2463瀏覽 ? 0回復(fù)
大模型技術(shù)細(xì)節(jié)——大模型之文本生成與文檔總結(jié)

AI探索時(shí)代 ? 5623瀏覽 ? 0回復(fù)
綜述 | 大模型的可控文本生成

NLP工作站 ? 3385瀏覽 ? 0回復(fù)
Stable Diffusion這樣的文本-圖像生成模型有記憶嗎？

angel ? 2052瀏覽 ? 0回復(fù)
RAG新范式MemLong：用于長(zhǎng)文本生成的記憶增強(qiáng)檢索

PaperAgent ? 2557瀏覽 ? 0回復(fù)
快手、北大開(kāi)源，超高清10秒、24幀視頻模型

Aceryt ? 1892瀏覽 ? 0回復(fù)
你知道大模型聊天補(bǔ)全和文本生成的區(qū)別嗎？

AI探索時(shí)代 ? 2838瀏覽 ? 0回復(fù)
關(guān)于兩次大模型文本生成的嘗試，以及由此帶來(lái)的思考

AI探索時(shí)代 ? 1743瀏覽 ? 0回復(fù)
NVIDIA AI 推出 Fugatto：一個(gè) 25 億參數(shù)的音頻模型，可從文本和音頻輸入生成音樂(lè)、語(yǔ)音和聲音

Halo咯咯 ? 2103瀏覽 ? 0回復(fù)
文本生成無(wú)限長(zhǎng)視頻，無(wú)需任何訓(xùn)練

Aceryt ? 1808瀏覽 ? 0回復(fù)
AI音頻核爆！Kimi開(kāi)源「六邊形戰(zhàn)神」Kimi-Audio，音頻界ChatGPT來(lái)了？

算家計(jì)算 ? 526瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 6天前發(fā)布
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開(kāi)源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲神器 0回復(fù)

上一篇： OpenAI首次公開(kāi)前沿大模型安全：基礎(chǔ)架構(gòu)、保護(hù)措施等

下一篇： OpenAI開(kāi)源GPT-4 SAE，提供1600萬(wàn)個(gè)解釋模式

社區(qū)精華內(nèi)容

目錄

^{<sub id="7kclm"></sub>}