斯坦福AI視頻生成工具免費開放!30秒時長,馬斯克看了效果會沉默
將音頻、圖像、視頻整合進同一工作流,這個由斯坦福初創(chuàng)公司發(fā)布的視頻工具火了!
預覽版支持生成30S逼真視頻,網友們直呼不輸Luma。
搶先看性轉版馬斯克激情說唱:
與Luma一樣,目前這個名為Hedra的工具可以免費試用。
在給大家?guī)硪皇謱崪y前,再來看一波新鮮整活兒~
讓面值10德國馬克上的“數(shù)學王子”高斯自我介紹:
讓石像說話、眨眼、擺動頭部:
生成虛擬土豆人角色:
讓僵尸管家變換表情:
好了,鑒于近期翻車事件過多,讓我們直接啟動實測。
Hedra究竟如何?
Hedra目前可在桌面和移動設備使用,這里我們直接訪問官網。
Hedra的目標是建立一個人人都可訪問的多模式創(chuàng)作工作室,因此將音頻、圖像、視頻都結合在了一起。
在音頻部分,官方預置了6種音色,可以文字轉音頻,也可以直接上傳音頻文件。
然后輸入你的角色描述,中間可以直接生成圖像,當然也支持上傳圖像。
最后一鍵生成視頻,以下為實測結果(約50秒時間生成了2秒視頻):
順便一提,一開始本來想傳Sam Altman的圖片,結果被官方識別為“名人”予以拒絕了。
除了以上小編實測,已經體驗了Hedra的網友們也反饋了一大波實測結果。
而且官方挨個在線回應了,接下來一起瞅瞅~
有網友細心捕捉到了Hedra視頻中的動漫人臉畸變情況。
不過在鏡頭拉近,類似特寫時這種情況有所改善。
官方坦言,目前Hedra確實還在與非人類角色作斗爭。
但是對于人獸混合的情況,官方表示效果還行,比如有網友生成了如下視頻:
此外,也有網友提到了Hedra審核過嚴的問題。
網友想用以上3張及其他圖像試著生成類似電影的片段,結果被系統(tǒng)判定為“名人”而拒絕生成。
該網友表示:
這些是AI生成的,不是名人。雖然安全很重要,但誤判過多。
對此,官方多次回應后續(xù)會看情況調整。
以上為網友提及率最高的兩個問題,官方也在更多回復中透露了其他情況。
- 無限時長(開放預覽為30秒)
- 每60秒生成90秒(如果官方H100供應充足)
- 模型目前提供音頻到視頻,但正在擴展其他輸入形式
- 即將推出16:9的視頻尺寸
- 模型主要測試了中文和英文輸入,且中文表現(xiàn)還不錯
- 模型目前提供API,可加入官方Discord
誰造出了Hedra?
Hedra此次發(fā)布的基礎模型Character-1由前斯坦福大學頂尖研究團隊領導。
首席執(zhí)行官Michael Lingelbach,斯坦福大學前博士生,從事空間智能研究。
另一負責人Alex Bergman,同樣來自斯坦福大學,研究領域包括計算成像、計算機視覺、計算機圖形學和機器學習。
在谷歌學術頁面,Alex Bergman發(fā)表或參與發(fā)表了數(shù)量頗豐的論文。
除了Hedra,最近幾天視頻生成工具正在迎來爆發(fā)期。
有網友也借機整合了Hedra、Luma、elevenlabsio等,不到1分鐘制作了一個短片。
工具地址:https://www.hedra.com/
Discord:https://discord.com/invite/KXeUUa6cXD