自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="nmf11"><track id="nmf11"></track></cite>

^{<blockquote id="nmf11"><i id="nmf11"></i></blockquote>}

<legend id="nmf11"><track id="nmf11"></track></legend>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

讓魯迅說(shuō)繞口令、赫本玩嘻哈，又一視頻模型火了，斯坦福華人博士創(chuàng)立

作者：機(jī)器之心 2024-06-17 08:42:00

人工智能新聞

團(tuán)隊(duì)成員均來(lái)自斯坦福大學(xué)，CTO還是泰勒·斯威夫特的鐵桿粉絲。

AI視頻領(lǐng)域卷瘋了。

Luma引發(fā)的狂歡還沒(méi)結(jié)束，AI視頻圈又來(lái)了個(gè)挑戰(zhàn)者——

斯坦福大學(xué)團(tuán)隊(duì)出品的Proteus。

據(jù)介紹，Proteus 是一款低延遲基礎(chǔ)模型，可以生成高度真實(shí)且富有表現(xiàn)力的人物形象。

例如，讓世界名畫中的主角——蒙娜麗莎或者帶珍珠耳環(huán)的女孩——肆無(wú)忌憚地大笑，面部表情自然流暢：

讓奧黛麗·赫本一改往日淑女形象，玩起嘻哈說(shuō)唱：

還讓《哈利·波特》中的斯內(nèi)普教授唱《Despacito》：

Proteus剛發(fā)布，一眾大佬發(fā)來(lái)「賀信」：

AI科學(xué)家賈揚(yáng)清稱贊，實(shí)時(shí)人工智能頭像質(zhì)量出奇得好。

英偉達(dá)科學(xué)家Jim Fan則表示，這一項(xiàng)目令人印象深刻。

早期投資人Brian Zhan發(fā)文稱，現(xiàn)有AI視頻工具，比如Runway和Pika，最大的問(wèn)題就是會(huì)產(chǎn)生幻覺(jué)，尤其是在生成含有人類的視頻時(shí)。而Apparate Labs通過(guò)解決時(shí)間連貫性和對(duì)象恒定性等問(wèn)題，使AI視頻生成步入下一個(gè)階段。

離譜！魯迅說(shuō)起了繞口令

Proteus是新一代的基礎(chǔ)模型，用于人類的實(shí)時(shí)表情生成。

要知道，目前即便是最先進(jìn)和最強(qiáng)大的生成模型，也無(wú)法完全實(shí)現(xiàn)人類表情的實(shí)時(shí)生成。

現(xiàn)有的模型運(yùn)行速度緩慢，無(wú)法提供對(duì)生成人物的復(fù)雜面部表情和身體動(dòng)作的直觀控制，而且它們?cè)诒普娑群捅憩F(xiàn)力方面仍有所欠缺。

而Proteus采用了最先進(jìn)的transformer 架構(gòu)的潛在擴(kuò)散模型，其創(chuàng)新性的潛在空間設(shè)計(jì)確保了實(shí)時(shí)的高效率，并且隨著架構(gòu)和算法的持續(xù)優(yōu)化，Proteus能夠?qū)崿F(xiàn)每秒100幀以上（100+ FPS）的視頻流。

換句話說(shuō)，只需一張簡(jiǎn)單的照片，Proteus不僅能夠模仿人類的笑聲、說(shuō)唱、歌唱、眨眼、微笑和對(duì)話，還能執(zhí)行更多生動(dòng)的表情和動(dòng)作。

比如說(shuō)，一向嚴(yán)肅的魯迅說(shuō)起了繞口令：

或者讓居里夫人清唱《Le Festin》：

抑或是給科學(xué)家們開個(gè)圓桌會(huì)議：

據(jù)Proteus研發(fā)團(tuán)隊(duì)介紹，他們期望Proteus可以成為一個(gè)聲音可控的視覺(jué)化身，為人工智能對(duì)話實(shí)體提供一個(gè)直觀的交互界面，同時(shí)能夠與眾多多模態(tài)大語(yǔ)言模型無(wú)縫兼容，為各種不同的應(yīng)用場(chǎng)景提供定制化服務(wù)。

對(duì)此，不少網(wǎng)友腦洞大開——

「只需要用愛因斯坦的數(shù)據(jù)對(duì)大語(yǔ)言模型進(jìn)行微調(diào)，再配上他生動(dòng)的面部表情，就能讓偉大的愛因斯坦化身教學(xué)助手，來(lái)親自教授物理課，青少年再也不用愁學(xué)不好科學(xué)了。」

還有網(wǎng)友表示，我愛死它了，今年絕對(duì)是AI視頻之年。

起底背后團(tuán)隊(duì)

這款被大佬力捧、小而美的模型，背后是個(gè)怎樣的團(tuán)隊(duì)？

據(jù)官網(wǎng)介紹，這是由斯坦福大學(xué)的Apparate Labs研發(fā)出來(lái)的。

目前該團(tuán)隊(duì)僅6人，從名字和照片來(lái)看，有3人為華人。

首席執(zhí)行官兼聯(lián)合創(chuàng)始人沈博魁（William Shen）博士就讀于斯坦福大學(xué)計(jì)算機(jī)科學(xué)系，由知名教授Silvio Savarese和Leonidas J. Guibas共同指導(dǎo)。

他的研究涵蓋人工智能多個(gè)領(lǐng)域，包括計(jì)算機(jī)視覺(jué)、機(jī)器人學(xué)、圖形學(xué)、生成模型和具身智能。其論文多次獲獎(jiǎng)，例如在IEEE-CVPR獲得了最佳論文獎(jiǎng)，還在RSS上入圍了最佳學(xué)生論文獎(jiǎng)的決賽。

此前，他還以GPA4.0的優(yōu)異成績(jī)獲得斯坦福大學(xué)計(jì)算機(jī)科學(xué)學(xué)士學(xué)位。

首席技術(shù)官兼聯(lián)合創(chuàng)始人Connor Lin也是個(gè)學(xué)霸。

他本碩就讀于卡內(nèi)基·梅隆大學(xué)，師從Keenan Crane教授。2020年前往斯坦福大學(xué)攻讀計(jì)算機(jī)博士。目前他是一名四年級(jí)在讀博士生，由Leonidas Guibas和Gordon Wetzstein兩位教授共同指導(dǎo)。

Connor Lin的研究聚焦于3D先驗(yàn)知識(shí)和神經(jīng)表示，用于3D重建、生成和編輯，曾獲得David Cheriton斯坦福研究生獎(jiǎng)學(xué)金的支持。

在攻讀博士期間，他在谷歌研究、英偉達(dá)研究和Adobe研究實(shí)習(xí)。此前，還在谷歌擔(dān)任軟件工程師，負(fù)責(zé)Pixel手機(jī)的人像模式開發(fā)。

此外，這小哥興趣廣泛，喜歡旅行和體育，喜歡烹飪、羽毛球、游泳、桌游和音樂(lè)，還是泰勒·斯威夫特的鐵桿粉絲

和Connor Lin一樣，首席科學(xué)家Linqi (Alex) Zhou也是斯坦福大學(xué)的一名博士生，由Stefano Ermon教授指導(dǎo)。

此前，Linqi Zhou在加州大學(xué)洛杉磯分校獲得了計(jì)算機(jī)科學(xué)和應(yīng)用數(shù)學(xué)的學(xué)士學(xué)位，由Song-Chun Zhu教授和Ying-Nian Wu教授指導(dǎo)。

他主要在計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)領(lǐng)域進(jìn)行研究，并致力于構(gòu)建能夠以結(jié)構(gòu)化和概率性方式理解世界的模型。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

斯坦福模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)