于科技發(fā)展史而言,20世紀(jì)60年代前后是一段非常神奇的歲月。
彼時(shí),世界第一顆人造衛(wèi)星進(jìn)入太空;第一臺(tái)工業(yè)機(jī)器人尤尼梅特誕生于世;人類完成登月第一步;微電子學(xué)和自動(dòng)化技術(shù)開始躍升……在此背景下,主流科幻小說對(duì)人性本質(zhì)的探索有了更深刻的立意。
科幻鬼才菲利普?迪克的作品《仿生人會(huì)夢(mèng)見電子羊嗎?》就出版于這一時(shí)期。這本書提出了這樣一個(gè)問題:當(dāng)仿生人在外表和心智上無限逼近人類,甚至表面上已經(jīng)超越人類時(shí),人究竟何以為“人”?這個(gè)看上去更像是哲學(xué)層面的議題,在半個(gè)多世紀(jì)過去以后,卻開始無限地逼近現(xiàn)實(shí)。
圖源:豆瓣
伴隨著元宇宙概念的走紅,虛擬數(shù)字人來到了聚光燈下。從去年至今,各行各業(yè)的虛擬數(shù)字人不斷涌現(xiàn),在不同的場(chǎng)景中頻頻亮相。形形色色的虛擬主播、虛擬偶像、虛擬員工都開始屢見不鮮,它們?cè)诖嫒祟悘氖履承┕ぷ鞯耐瑫r(shí)也引發(fā)了一些爭(zhēng)議和隱憂。
捫心自問,在可預(yù)見的未來,你是會(huì)更期待自己在賽博空間的“復(fù)制體”呢,還是會(huì)更擔(dān)心數(shù)字人動(dòng)了“真人”的奶酪?
數(shù)字人:如何變得更像一個(gè)“人”
雖然元宇宙推動(dòng)數(shù)字人走向了大眾,但數(shù)字人本身卻并非新鮮事物。
早在上世紀(jì)80年代,數(shù)字人就有跡可循。這一時(shí)期的數(shù)字人擬人化程度較低,主要由手繪制成,制作周期長(zhǎng)、成本高,而且僅僅在外形上實(shí)現(xiàn)了對(duì)人的模仿。
2000年以后,隨著CG、動(dòng)捕、語(yǔ)音合成等技術(shù)的發(fā)展,以初音未來、洛天依為代表的二次元歌姬出現(xiàn)于公眾視野,并迅速獲得年輕一代的的青睞。但此時(shí)的數(shù)字人還缺少了點(diǎn)“靈魂”,因?yàn)樗麄冞€無法實(shí)現(xiàn)“與人交互”。
初音未來 圖源:堆糖
之后,深度學(xué)習(xí)算法、自然語(yǔ)言處理等AI技術(shù)的突破為數(shù)字人的發(fā)展提供了革新的基石。通常來說,數(shù)字人的核心制作流程包括建模、驅(qū)動(dòng)和渲染三大環(huán)節(jié)。AI技術(shù)發(fā)展起來后,需求方可以直接利用AI參與或部分參與這些環(huán)節(jié)。
一方面能縮短制作周期、降低制作成本;另一方面,也有利于不斷提高擬人化程度,賦予數(shù)字人更逼真的類人外觀、感知和交互能力,為推動(dòng)數(shù)字人在文娛、電商、金融等領(lǐng)域的落地應(yīng)用達(dá)成先決條件。
近年來,產(chǎn)業(yè)界對(duì)數(shù)字人的探索開始向超寫實(shí)的人類形象發(fā)展。具體而言,真正的MetaHuman要達(dá)成三個(gè)層面的需求:高保真、智能化、工具化。
高保真:視覺上,從外形、表情到動(dòng)作,都要做出1:1還原真人的高保真虛擬人;
智能化:運(yùn)用人工智能,使虛擬人初具智能和情感表達(dá);
工具化:開發(fā)更輕量、便捷的工具,讓普通用戶都能快速生產(chǎn)高品質(zhì)的虛擬資產(chǎn)或自己的數(shù)字孿生體。
要實(shí)現(xiàn)這些需求,除了基礎(chǔ)學(xué)科的支撐外,更需要一系列精密硬件、技術(shù)、算法和軟件的相互配合,還有產(chǎn)業(yè)鏈上下游的共同發(fā)展。
當(dāng)前數(shù)字人產(chǎn)業(yè)鏈主要分為三層:基礎(chǔ)層、平臺(tái)層、應(yīng)用層。
基礎(chǔ)層:主要為數(shù)字人的制作提供必要的基礎(chǔ)軟硬件支撐。硬件包括芯片、傳感器、光學(xué)器件及顯示設(shè)備等,軟件包括建模軟件及渲染引擎。
平臺(tái)層:主要提供軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務(wù)平臺(tái)和AI能力平臺(tái)。生產(chǎn)技術(shù)服務(wù)平臺(tái)主要提供整體的數(shù)字人解決方案。AI能力平臺(tái)主要是基于自身人工智能技術(shù),賦予數(shù)字人進(jìn)行智能感知與交互的能力。
應(yīng)用層:主要指數(shù)字人與各行業(yè)場(chǎng)景結(jié)合形成的具體的應(yīng)用解決方案。當(dāng)前,文娛、傳媒、金融等是數(shù)字人應(yīng)用滲透率較高、技術(shù)較為成熟的領(lǐng)域。
大廠:爭(zhēng)做“女媧”,各顯神通
從產(chǎn)業(yè)鏈的構(gòu)成,就可以窺見數(shù)字人巨大的商業(yè)潛力。盡管距離規(guī)模化普及時(shí)日尚早,大廠們也開始紛紛加碼,探索屬于自身的“造人”之路。
1、百度:基于平臺(tái)打造完整的生態(tài)鏈服務(wù)
在百度Create 2021(百度AI開發(fā)者大會(huì))上,智能數(shù)字人平臺(tái)“百度智能云曦靈”正式發(fā)布。這一平臺(tái)集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體,充分展示了百度在數(shù)字人領(lǐng)域的野心。
在國(guó)內(nèi)的幾家大廠中,百度第一個(gè)明確了全場(chǎng)景、大生態(tài)的定位。針對(duì)當(dāng)下國(guó)內(nèi)數(shù)字人發(fā)展存在著產(chǎn)業(yè)鏈效率較低、上下游生態(tài)未完全打通的痛點(diǎn),百度希望借助產(chǎn)業(yè)鏈協(xié)同,降低數(shù)字人開發(fā)成本,實(shí)現(xiàn)規(guī)?;a(chǎn),讓“人手一個(gè)數(shù)字人”的愿景不再遙遠(yuǎn)。
可以看到,百度數(shù)字人的身影活躍在各行各業(yè)。為浦發(fā)銀行打造的理財(cái)專員“小浦”、為中國(guó)航天局打造的“火星車數(shù)字人祝融號(hào)”、與2022年冬奧會(huì)合作的AI手語(yǔ)主播等等。
此外,百度還陸續(xù)推出了自己的虛擬IP,比如“龔俊數(shù)字人”、“希加加”、“度曉曉”。除了借助IP探索品牌營(yíng)銷的新路徑之外,這些IP也成為了百度對(duì)外展示自己技術(shù)底蘊(yùn)的窗口?!岸葧詴浴睉?yīng)戰(zhàn)高考作文的新聞一度引起熱議。
最近,百度智能云即將推出數(shù)字人直播平臺(tái)的消息再次引發(fā)關(guān)注。據(jù)公開資料,這一平臺(tái)可以提供行業(yè)頂配精度的超寫實(shí)數(shù)字人形象、實(shí)時(shí)互動(dòng)的超智能對(duì)話問答系統(tǒng)以及預(yù)設(shè)豐富場(chǎng)景及動(dòng)作模板的開播效果,助力商家實(shí)現(xiàn)AI驅(qū)動(dòng)24小時(shí)不停播。這一平臺(tái)的推出對(duì)電商直播行業(yè)來說到底會(huì)產(chǎn)生怎樣的效應(yīng),我們且保持觀望。
百度數(shù)字人直播平臺(tái)宣傳視頻截圖 圖源:百度智能云
2、騰訊:聚焦服務(wù)屬性+孵化游戲IP
騰訊同樣于去年推出了自己的數(shù)字人平臺(tái)——騰訊云小微數(shù)智人平臺(tái)。與百度主張的“全鏈路、全場(chǎng)景”不同的是,這一平臺(tái)更突出其智能交互體驗(yàn),價(jià)值理念也更聚焦于其服務(wù)屬性,即“為用戶提供更有溫度的服務(wù),為企業(yè)創(chuàng)造價(jià)值”。
在生活服務(wù)場(chǎng)景,為用戶創(chuàng)造更好的交互智能體驗(yàn),降低數(shù)字化服務(wù)使用門檻,比如在智能車載、智能交通、智能家居等場(chǎng)景,數(shù)字人可以通過與智能設(shè)備結(jié)合,為用戶提供智能化服務(wù);
在企業(yè)服務(wù)場(chǎng)景,助力企業(yè)降本增效,提升企業(yè)服務(wù)效率和品牌形象,比如在金融、文旅、傳媒、公共服務(wù)、醫(yī)療、零售等行業(yè)場(chǎng)景中,可擔(dān)任客服、理財(cái)顧問、播報(bào)主持、導(dǎo)游導(dǎo)覽角色。
盡管理念有所差異,但騰訊和百度的數(shù)字人在落地場(chǎng)景上重合率較高。不過,基于本身的業(yè)務(wù)基因,騰訊在游戲虛擬偶像的賽道上天然優(yōu)勢(shì)明顯。無數(shù)的游戲IP為騰訊提供了孵化基礎(chǔ),比如“QQ炫舞”的星瞳,作為該系列的虛擬代言人,在去年6月就開始以虛擬UP主身份在B站進(jìn)行直播活動(dòng)。
3、阿里:專注打造電商虛擬KOL矩陣
在2020年4月阿里舉辦的內(nèi)部會(huì)議“淘寶直播MCN機(jī)構(gòu)大會(huì)”上,淘寶宣布對(duì)虛擬主播進(jìn)行重點(diǎn)扶持。在得到淘寶更多的政策和流量?jī)A斜之后,虛擬主播成為了直播的新出口。
阿里數(shù)字人的布局正是基于直播帶貨場(chǎng)景,從品牌營(yíng)銷切入,專注打造自己的虛擬KOL矩陣?!癆YAYI”的出現(xiàn)就是典型。
AYAYI在小紅書亮相1個(gè)月后,就相繼與嬌蘭、保時(shí)捷等國(guó)際大牌達(dá)成了合作。2021年9月,AYAYI又成為阿里巴巴首個(gè)數(shù)字人員工,擔(dān)任天貓超級(jí)品牌日的數(shù)字主理人。2022 年 5 月,繼 AYAYI 之后,阿里媽媽又正式推出超寫實(shí)數(shù)字人男性偶像“锘亞 Noah”。
對(duì)于阿里而言,虛擬KOL不僅是超乎期待的品牌代理人,而且有助于其在更廣闊的營(yíng)銷版圖上觸達(dá)更多的用戶群。今年618,AYAYI 和Noah 共同參與演繹了以“莫比烏斯”為主題的元宇宙數(shù)字大秀。
在電商直播進(jìn)入下半場(chǎng)之際,單純的流量玩法很難再玩轉(zhuǎn)全場(chǎng),而虛擬KOL的出現(xiàn),在營(yíng)銷矩陣“人、貨、場(chǎng)”中,既是“人”又是“場(chǎng)”,不僅為直播生態(tài)注入了新的活力,也讓品牌跟消費(fèi)者交互的延展性變得更有想象力。
4、字節(jié):虛擬偶像女團(tuán)A-SOUL的“紅與黑”
相較其他大廠來說,字節(jié)跳動(dòng)在數(shù)字人領(lǐng)域的落子就顯得比較隱晦。
盡管也提供數(shù)字人定制方面的服務(wù),但在一眾聲名鵲起的數(shù)字人中,字節(jié)數(shù)字人給人的印象就較為稀薄。其中最為出名的應(yīng)該就是A-SOUL——由旗下游戲品牌朝夕光年和樂華娛樂共同打造的虛擬偶像女團(tuán)。
SOUL出道幾個(gè)月就收獲了百萬粉絲,在虛擬偶像中堪稱“頂流”。其出色的舞臺(tái)表現(xiàn)和鮮明的人設(shè)性格完全不輸當(dāng)紅的真人偶像團(tuán)體。在吸金能力上,A-SOUL也不容小覷。安信證券預(yù)計(jì),樂華娛樂的泛娛樂業(yè)務(wù)收入在2021年為3790萬元,其中A-SOUL貢獻(xiàn)了約1700萬的增量收入。但是,在前途一片大好的發(fā)展態(tài)勢(shì)下,A-SOUL卻遭遇意外“剎車”。
伴隨成員“珈樂”的“直播休眠”聲明,一系列負(fù)面新聞甚囂塵上。這一虛擬形象背后的“中之人”長(zhǎng)期遭受職場(chǎng)PUA等傳聞引來了極大爭(zhēng)議。沒人能否定A-SOUL的成功:全網(wǎng)粉絲逾兩千萬,登頂“國(guó)內(nèi)第一虛擬偶像女團(tuán)”……但功成名就背后,觀眾對(duì)虛擬偶像的信任危機(jī)依舊無解。
對(duì)大廠來說,數(shù)字人賽道既是挑戰(zhàn),也是機(jī)遇。除了技術(shù)之外,品牌對(duì)IP和內(nèi)容的運(yùn)營(yíng)能力也是能否獲得長(zhǎng)期發(fā)展的個(gè)中關(guān)鍵。所有身處或準(zhǔn)備進(jìn)入這一賽道的玩家都需要考慮清楚,在撒網(wǎng)和收網(wǎng)之間,想要的到底是要短期收益還是長(zhǎng)期效益。
隱憂:長(zhǎng)期發(fā)展的藩籬
當(dāng)前數(shù)字人技術(shù)正在快速發(fā)展和迭代,但在欣欣向榮的表象下,數(shù)字人行業(yè)還是顯得頗為“稚嫩”。
其一,制作門檻高,成本所限難以普惠。這與數(shù)字人所需的建模、動(dòng)捕、渲染等技術(shù)花銷巨大相關(guān)。數(shù)字人精度越高、效果越好,成本也越令人望而生畏。比如曾經(jīng)在英偉達(dá)發(fā)布會(huì)上以假亂真的“黃仁勛虛擬人”,據(jù)英偉達(dá)官方透露,這個(gè)僅14秒的視頻耗費(fèi)了34位3D美術(shù)師和15位軟件工程師共計(jì)近千工時(shí)。
其二,產(chǎn)業(yè)鏈割裂,很難實(shí)現(xiàn)規(guī)?;a(chǎn)。數(shù)字人制作涉及形象生成、AI驅(qū)動(dòng)、長(zhǎng)期運(yùn)營(yíng)等環(huán)節(jié),流程多、周期長(zhǎng),常常需要跨界合作。對(duì)用戶來說,往往要輾轉(zhuǎn)于多個(gè)公司進(jìn)行整合,溝通成本較高,對(duì)于量產(chǎn)來說效率過低。
其三,在交互體驗(yàn)上依舊任重而道遠(yuǎn)。首先,視覺表現(xiàn)不夠自然。用戶對(duì)數(shù)字人的信任,很大程度上會(huì)建立在視聽感觀上。如何讓數(shù)字人更“自然”,面部表情、眼神、肌肉運(yùn)動(dòng)的細(xì)膩流暢是關(guān)鍵,而這一點(diǎn)需要更多優(yōu)質(zhì)數(shù)據(jù)和算法的支持。其次,驅(qū)動(dòng)方式也較為單一。相較用遙感或者按鍵操作,如何打造更多個(gè)性化的驅(qū)動(dòng)方式會(huì)極大影響用戶體驗(yàn)。在接近真人的互動(dòng)體驗(yàn)上,相關(guān)技術(shù)還有遠(yuǎn)路要走。
其四,同質(zhì)化嚴(yán)重,運(yùn)營(yíng)能力匱乏,商業(yè)化路徑未明。作為市場(chǎng)熱點(diǎn),大量替代真人服務(wù)的虛擬主播和具備IP潛力的虛擬偶像競(jìng)相涌現(xiàn),與此同時(shí),“同質(zhì)化”現(xiàn)象也暴露無遺。這一形勢(shì)下,哪家團(tuán)隊(duì)擁有更強(qiáng)的內(nèi)容策劃和運(yùn)營(yíng)能力,才越有可能突出重圍??上У氖?,更多的數(shù)字人往往因運(yùn)營(yíng)的后繼乏力而“泯然眾人”。這也直接導(dǎo)致大多數(shù)數(shù)字人無法實(shí)現(xiàn)真正的盈利。
以上挑戰(zhàn)是整個(gè)數(shù)字人行業(yè)必須直面的問題。盡管當(dāng)前的數(shù)字人在外觀上已經(jīng)較為寫實(shí),但現(xiàn)實(shí)和虛擬的藩籬依舊不容忽視。但長(zhǎng)遠(yuǎn)來看,順應(yīng)數(shù)字經(jīng)濟(jì)的發(fā)展趨勢(shì),在人工智能技術(shù)的加持下,數(shù)字人在各行各業(yè)和日常生活中必會(huì)扮演更加重要的角色,甚至在元宇宙場(chǎng)景中,更加智能的數(shù)字人會(huì)得到更有顛覆性的進(jìn)化。待到那時(shí),回歸最初的議題:在可預(yù)見的未來,你是會(huì)更期待自己在賽博空間的“復(fù)制體”呢,還是會(huì)更擔(dān)心數(shù)字人動(dòng)了“真人”的奶酪?
參考鏈接:
https://www.tmtpost.com/6175145.html
https://www.toutiao.com/article/7081963424443433480?wid=1658302887042
https://www.thepaper.cn/newsDetail_forward_19027734