微軟推出人工智能模型 CoDi,可互動(dòng)和生成多模態(tài)內(nèi)容
7 月 11 日消息,微軟近日發(fā)布新聞稿,推出了名為可組合擴(kuò)散模型(CoDi),這是一種獨(dú)特的、基于可組合擴(kuò)散的人工智能模型,其設(shè)計(jì)目標(biāo)是互動(dòng)和生成多模態(tài)內(nèi)容。
微軟設(shè)計(jì) CoDi 的目標(biāo),旨在解決傳統(tǒng)單一模態(tài) AI 模型的局限性。以同步視頻和音頻為例,獨(dú)立生成的信息流拼接在一起時(shí)可能存在不一致和對齊的問題。
CoDi 采用了獨(dú)特的可組合生成策略,在擴(kuò)散過程中對齊多模態(tài),從而生成相互交織的模式,更重要的是,CoDi 能夠處理任意輸入模式并生成任意模態(tài)的內(nèi)容。
CoDi 由 Microsoft Azure 認(rèn)知服務(wù)研究團(tuán)隊(duì)與北卡羅來納大學(xué)教堂山分校合作開發(fā),也是 Microsoft 項(xiàng)目 i-Code 的一部分,該項(xiàng)目使用人工智能來增強(qiáng)人機(jī)交互。
IT之家在此附上 CoDi 項(xiàng)目官方介紹鏈接,感興趣的用戶可以深入閱讀。