自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

“數(shù)字人”也在卷,就問你怕不怕

原創(chuàng) 精選
元宇宙 人工智能
冬奧賽事正酣,除了新晉頂流“冰墩墩”外,支撐賽場內(nèi)外的各項“黑科技”也是熱議話題之一。其中,一眾虛擬數(shù)字人的集中亮相尤其引人關(guān)注。

  冬奧賽事正酣,除了新晉頂流“冰墩墩”外,支撐賽場內(nèi)外的各項“黑科技”也是熱議話題之一。其中,一眾虛擬數(shù)字人的集中亮相尤其引人關(guān)注。

  由百度智能云提供支持的AI手語虛擬主播亮相央視新聞,為聽障用戶提供24小時手語服務(wù),助其即時獲得賽事資訊;騰訊3D手語數(shù)智人“聆語”也上線央視頻,為賽事提供手語解說;中國氣象局推出的虛擬數(shù)字人“馮小殊”,為觀眾實時播報觀賽氣象指數(shù);在谷愛凌摘得大跳臺金牌的前夕,其數(shù)字分身Meet GU現(xiàn)身咪咕演播室;由科大訊飛打造的央視主播王冰冰虛擬形象,在《冰冰帶你說冬奧》專屬H5中登場;AI裁判&助理教練“觀君”助力我國運動員摘得兩金一銀;還有新華社數(shù)字記者“小諍”繼穿越空間站后,這次從火星發(fā)來賽事智能分析的特別報道……

  這些虛擬數(shù)字人形形色色、人設(shè)多樣,給觀眾帶來了嶄新的服務(wù)與視聽體驗,頗有些“亂花漸欲迷人眼”的味道??梢哉f,冬奧成為了國內(nèi)數(shù)字人集中展示的高規(guī)格舞臺,越來越多的人在這次展示中看到了現(xiàn)階段在數(shù)字人領(lǐng)域本土技術(shù)力量的崛起和進化。那么到底何謂數(shù)字人、數(shù)字人為什么會火、其商業(yè)前景如何,且讓我們先捋一捋其發(fā)展軌跡。

  那些年,橫空出世的數(shù)字人

  “數(shù)字人”并不新鮮。遙想當(dāng)年,老二次元必定還記得初音未來、洛天依等虛擬偶像剛出現(xiàn)時掀起的熱潮。雖然如今的大眾對于虛擬數(shù)字人基本都見怪不怪、波瀾不驚了,但事實上,虛擬數(shù)字人的發(fā)展到了近兩年才開啟了質(zhì)的飛躍,其定義、分類、功能和市場潛力才逐漸清晰起來。

  根據(jù)中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《2020年虛擬數(shù)字人發(fā)展白皮書》定義,虛擬數(shù)字人,即具有數(shù)字化外形的虛擬人物。簡言之,擁有類人的外觀、行為、思想(當(dāng)然也有一些非人的萌系形象,如火星車數(shù)字人“祝融號”)。

  從上世紀(jì)90年代至今,數(shù)字人的發(fā)展基本可以梳理為三個階段:

  以“紙片人”為代表的1.0階段:由初始公司發(fā)布初始形象,通過UGC的形式與用戶進行互動?;虞d體以長短視頻為主,面向泛二次元用戶。

  以vTuber主播為代表的2.0階段:通過背后的中之人加上動捕設(shè)備來與用戶進行千人一面的交流。驅(qū)動形態(tài)依舊限于二次元,用戶群體也相對受限。

  具備模型高精、人工智能驅(qū)動特點的數(shù)字人3.0階段:由于采用了傳統(tǒng)+AI的方式實現(xiàn),生產(chǎn)端成本降低,可驅(qū)動形態(tài)擴展到高精2D/3D,用戶覆蓋全人群。在AI能力的加持下,其互動載體更為多樣,且其交互可以做到全天候,達到千人千面的效果。

  近年來,隨著5G、AI等技術(shù)的發(fā)展,加之算力平臺的迭代,數(shù)字人領(lǐng)域逐漸出現(xiàn)各類超寫實、實時動捕乃至AI驅(qū)動的實驗性的落地產(chǎn)品。尤其去年以來,借著Metaverse概念的興起,MetaHuman也成為市場的寵兒。如何打開數(shù)字人在應(yīng)用場景的商業(yè)化空間成為資本關(guān)注的焦點。

  頭豹研究院數(shù)據(jù)顯示,當(dāng)前虛擬數(shù)字人市場規(guī)模已超過2000億元,預(yù)計到2030年將達到2703億元。當(dāng)然,普羅大眾的觀感會更直觀。你稍加留意就會發(fā)現(xiàn),從去年開始,形態(tài)各異的數(shù)字人在各大平臺次第登場,到冬奧會時密集露出,這無疑再次佐證了:數(shù)字人正在由一個泛化的概念真正進化到多元應(yīng)用的產(chǎn)業(yè)化階段。

  這是一場營銷下的“虛火”嗎?

  似乎在一夜之間,人人都知道了數(shù)字人是風(fēng)口。但也正因如此,不少人開始質(zhì)疑,數(shù)字人“火”了,是需求驅(qū)動下實打?qū)嵉摹罢婊稹边€是密集營銷下沸反盈天的“虛火”?我們可以從政策、市場、資本三個維度做一下觀察。

  首先,在政策上,2021年10月發(fā)布的《廣播電視和網(wǎng)絡(luò)視聽“十四五”科技發(fā)展規(guī)劃》指出:“要推動虛擬主播、動畫手語廣泛應(yīng)用于新聞播報、天氣預(yù)報、綜藝科教等節(jié)目生產(chǎn),創(chuàng)新節(jié)目形態(tài),提高制播效率和智能化水平”,首次明確鼓勵和支持虛擬人的發(fā)展。另外,《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》更新數(shù)字經(jīng)濟的指導(dǎo)意見,也讓虛擬人、元宇宙的概念和發(fā)展,有了更清晰的導(dǎo)向。可以看出,國家對虛擬人產(chǎn)業(yè)發(fā)展整體持肯定態(tài)度,這對從業(yè)者而言顯然是一劑強心針,可以專注研發(fā),而不必擔(dān)心行業(yè)會突然因政策而“觸礁”。

  再者,根據(jù)市場需求,基于當(dāng)前發(fā)展階段和商業(yè)模式,數(shù)字人主要分為兩類:偶像類演藝型數(shù)字人和服務(wù)型數(shù)字人。

  前者如虛擬偶像、虛擬主播、虛擬代言人等,主要落地在文娛和品牌營銷等領(lǐng)域,比如會“捉妖”的虛擬美妝達人“柳夜熙”、穿梭在真人間的虛擬KOL “AYAYI”、央美畢業(yè)唱歌吟詩作畫無一不精的虛擬數(shù)字人“夏語冰”;而服務(wù)型數(shù)字人則標(biāo)志著另一種截然不同的發(fā)展路線,比如數(shù)字客服、數(shù)字員工、虛擬培訓(xùn)師等等,主要在落地在金融、運營商等領(lǐng)域,比如最卷打工人萬科財務(wù)部的虛擬數(shù)字人“崔筱盼”、浦發(fā)銀行首位數(shù)字員工“小浦”等等。

  從春節(jié)期間的各類晚會到冬奧會賽場內(nèi)外,都可以看到,數(shù)字人并未止步于唱跳表演、直播或品牌營銷,而是逐步融入主流媒體搭建的新聞播報、知識科普、大型賽事、公益等場景,發(fā)揮出了更多服務(wù)和功能價值。從單純的虛擬偶像到如今在社交、游戲、辦公等場景下的多點開花,市場對于數(shù)字人的期望正在向縱深發(fā)展,數(shù)字人在更多場景下商業(yè)變現(xiàn)的可能也在進一步被證實。

  最后,除了政策層面的認(rèn)可,市場方面的需求,資本的涌入也是肉眼可見的。全球眾多財力雄厚的科技巨頭與平臺早已紛紛入場,布局?jǐn)?shù)字人賽道,搶占這個千億市場的先發(fā)優(yōu)勢。他們有的通過基礎(chǔ)技術(shù)賦能,有的從元宇宙全鏈路探索,有的走軟硬件并行發(fā)展路線,有的從企業(yè)級、消費級應(yīng)用打開缺口。

  B站早早開始布局并加碼虛擬偶像領(lǐng)域,騰訊互娛旗下NEXT Studios和新華社聯(lián)合打造數(shù)字記者“小諍”,阿里巴巴扶植虛擬主播助力內(nèi)容電商,字節(jié)跳動通過入股的方式擁有了虛擬偶像團體A-SOUL,科大訊飛推出了虛擬人交互平臺,網(wǎng)易發(fā)布虛擬人軟件開發(fā)工具包“有靈”,百度發(fā)布全新智能數(shù)字人平臺“百度智能云曦靈”,英偉達將自身積累的技術(shù)能力高度整合為Omniverse(全宇宙)產(chǎn)品,微軟基于多年來探索的人機交互技術(shù)推動虛擬人與真人交流。在這些巨頭的布局思路中,數(shù)字人不僅是當(dāng)下值得投入的潛力場域,也是未來虛實共生場景的重要入口。

  由此,我們可以看到,虛擬數(shù)字人不論是從政策、市場還是資本層面都有其“火起來”的先決條件。但不可否認(rèn)的是,在這個看似繁花簇錦的市場中,虛擬數(shù)字人的核心驅(qū)動技術(shù)仍處于發(fā)展的初始階段。一些分析人士也因此持觀望態(tài)度:“蜂擁而至的虛擬數(shù)字人,有點像過去企業(yè)吉祥物的變種。如果它們不能真正做到服務(wù)用戶,即使是花大力量做出的吉祥物,除了能為企業(yè)貢獻一時的流量外,未來并不具備可持續(xù)發(fā)展的可能?!?/p>

  數(shù)字人是如何“煉”成的

  數(shù)字人要邁向產(chǎn)業(yè)化、規(guī)?;?wù)階段,根本上還是要取決于技術(shù)的發(fā)展。

  一般來說,數(shù)字人系統(tǒng)由人物生成、人物表達、合成顯示、識別感知和分析決策等五大模塊構(gòu)成。這五大模塊主要解決虛擬人的兩個問題,第一,能否像真人一樣表達,第二,能否像真人一樣思考。

  能否像真人一樣表達?解決這個問題的關(guān)鍵在于建模、驅(qū)動和渲染三大技術(shù)。

  事實上,得益于這三大技術(shù)的突破,數(shù)字人的質(zhì)變式飛躍才有了可能。在建模端,具有高保真且能夠獲取人物動態(tài)模型數(shù)據(jù)的掃描技術(shù)已經(jīng)出現(xiàn),虛擬數(shù)字人在外表上已無限“逼近”人類;在驅(qū)動端,智能合成、動作捕捉取得了長足進步,虛擬人的表情、動作開始能達到以假亂真的程度;在渲染端,隨著CPU、GPU等硬件能力的提升和算法的突破,成像的真實性和細微度均大幅提升。

  以AI氣象服務(wù)數(shù)字人“馮小殊”為例,“馮小殊”的原型是《天氣預(yù)報》節(jié)目主持人馮殊。據(jù)公開資料顯示,小冰公司通過深度神經(jīng)網(wǎng)絡(luò)渲染技術(shù)(Xiaoice Neural Rendering, XNR)及小樣本學(xué)習(xí)技術(shù),僅用1周的時間就完成了對馮殊本人的學(xué)習(xí)。經(jīng)過語音、嘴型、人臉渲染專家模型訓(xùn)練,虛擬數(shù)字人可以完美地get馮殊本人的嘴部動作、眼部及臉部肌肉之間的協(xié)同關(guān)系,其面容、表情、肢體動作的整體自然度跟真人幾乎無異。

  技術(shù)的進步在一點點提升人們對虛擬數(shù)字人的期待,但很多時候這種期待會有落空之感。究其原因,在于數(shù)字人的“智能化”程度還不夠,無法自主和人類互動、交流。這就涉及到關(guān)鍵的第2個問題——能否像真人一樣思考?虛擬數(shù)字人在接收信息后作出判斷、決策、然后再向人類進行反饋,做到這一點,才是真正打開了數(shù)字人發(fā)展的通達大道。

  百度智能云AI人機交互實驗室負責(zé)人李士巖曾提到,目前,數(shù)字人雖然有很多技術(shù)創(chuàng)新,但它依舊處在3.0階段的初期,其發(fā)展還存在三大技術(shù)難題:其一,數(shù)字人產(chǎn)業(yè)鏈各個節(jié)點相對割裂、不能高效協(xié)同;其二,服務(wù)場景和演藝場景沒有有效打通,主要表現(xiàn)為演藝型數(shù)字人不具備客戶所需的業(yè)務(wù)能力,而服務(wù)型數(shù)字人缺乏人設(shè),難以與用戶進行情感交流;其三,滿足高機動性、高頻需求成本依舊較高。當(dāng)一些客戶要來頻繁升級數(shù)字人需求、做新場景時,依舊需要大量定制化開發(fā)成本。

  可以說,冬奧會中展現(xiàn)出的數(shù)字人的技術(shù)能力,幾乎代表了現(xiàn)階段虛擬數(shù)字人的最高水平。在這類資金實力充足的體育盛事中,集中力量打造符合賽事報道的數(shù)字人相對容易。但在廣泛的落地過程中,虛擬數(shù)字人的發(fā)展仍存在不少掣肘。如何針對這些痛點,探索新的產(chǎn)品路徑,想必是未來幾年中眾多玩家必爭之處。

  未來:人手一個數(shù)字人,可能嗎?

  在5G、AI等技術(shù)的加持下,現(xiàn)階段的虛擬數(shù)字人通過自我學(xué)習(xí)和算法能力可以實現(xiàn)與人語音、手勢的交互,但總體來說,智能化水平目前比較初級,距離泛化的應(yīng)用還有一段“長坡”要走。

  對演藝型數(shù)字人來說,要打造為成功的IP,過硬的專業(yè)素質(zhì)和原創(chuàng)內(nèi)容才能維持和拓展人設(shè)生命力,提升商業(yè)價值,但這樣也提高了應(yīng)用的門檻和成本;對服務(wù)型數(shù)字人來說,作為企業(yè)員工的補充,迅速適配應(yīng)用場景,助力企業(yè)降本增效才是立足之本,但定制化成本過高卻是不容回避的問題。

  但同樣不可否認(rèn)的是,隨著虛實共生時代的來臨,多元場景對虛擬人將有更廣泛的需求。當(dāng)現(xiàn)實世界與數(shù)字世界之間的界限不斷融合與模糊,虛擬數(shù)字人可以作為兩個世界連接的載體,擁有無限的生命力與想象空間。多元的身份、強大的分析與數(shù)據(jù)處理能力,類似真人交互般的體驗絲滑,這樣的數(shù)字分身將成為我們出入虛擬數(shù)字世界的堅實鎧甲。

  遠方,荊棘與鮮花共生。我們期待:“人手一個數(shù)字人”的未來終將到來。

責(zé)任編輯:張潔 來源: 51CTO技術(shù)棧
相關(guān)推薦

2019-02-27 16:00:28

IT資產(chǎn)審計

2017-04-27 10:43:12

互聯(lián)網(wǎng)

2016-11-08 09:55:51

Windows命令行登錄

2010-03-22 17:22:33

無線網(wǎng)絡(luò)輻射

2022-06-29 16:29:30

數(shù)字化轉(zhuǎn)型企業(yè)商業(yè)

2018-10-25 15:22:30

AI攻擊網(wǎng)絡(luò)安全

2023-08-06 12:50:19

機器人AI

2013-08-27 09:58:57

顧問職業(yè)規(guī)劃

2015-11-24 09:13:25

程序員bug

2010-09-16 11:07:28

裁員

2019-07-16 13:02:26

BugDebug代碼

2017-10-30 14:20:19

AndroidAS 3.0Java

2025-03-04 00:36:00

2010-03-05 08:54:14

Windows 7試用版升級

2010-05-25 11:41:36

數(shù)據(jù)中心布線問題

2010-05-18 15:36:59

IIS服務(wù)器

2021-10-11 07:46:50

ScalaJVM語言

2023-03-02 06:01:00

ExcelAI工具

2012-03-27 13:48:04

Win7

2018-12-07 09:50:41

回收站WindowsWindows 10
點贊
收藏

51CTO技術(shù)棧公眾號