自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

拋開(kāi)元宇宙,我們來(lái)聊聊音視頻技術(shù)的未來(lái)

開(kāi)發(fā) VR/AR
VR/AR的出現(xiàn),第一次讓人類(lèi)感受到什么叫做沉浸式體驗(yàn)。我們與數(shù)字世界的交互,從單向異步,變成了雙向同步。

1872年的某一天,在美國(guó)加利福尼亞州的一個(gè)酒店里,兩個(gè)年輕人發(fā)生了激烈的爭(zhēng)論。

其中一人認(rèn)為,奔跑的馬在躍起的瞬間,四蹄是騰空的。而另一人則認(rèn)為,馬奔跑時(shí),始終有一個(gè)蹄子是著地的。

來(lái)自英國(guó)的攝影師麥布里奇得知此事后,決定通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證誰(shuí)對(duì)誰(shuí)錯(cuò)。于是,他借助24臺(tái)相機(jī),連續(xù)拍攝了24張照片,并由此創(chuàng)造了人類(lèi)歷史上第一個(gè)“視頻”。

不久后,1877年,著名發(fā)明家愛(ài)迪生在他的“圓筒留聲機(jī)”上,錄下了他親自朗讀的《瑪麗有只小羊羔》的歌詞。

這短短數(shù)秒的聲音,成為了人類(lèi)歷史上第一條音頻。由此,人類(lèi)正式進(jìn)入了音視頻時(shí)代。

音視頻技術(shù)的發(fā)展和演進(jìn)

眾所周知,人有五感,分別是視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、味覺(jué)和觸覺(jué)。通過(guò)五感,我們才能感知外部物理世界的存在,享受真實(shí)生活的美好。

在人類(lèi)漫長(zhǎng)的歷史長(zhǎng)河中,文字、圖畫(huà)是記錄和傳遞信息的主要方式。直到前面提及的音視頻出現(xiàn),才將人類(lèi)記錄信息的方式,升級(jí)到了一個(gè)更高的維度,更加具象化。

音頻和視頻誕生早期,只能存儲(chǔ)在膠片和磁帶上,容量有限,也不方便保存和運(yùn)輸。

電影膠片

直到20世紀(jì)70-80年代,隨著數(shù)字錄音和攝像技術(shù)的不斷成熟,唱片公司和電影公司開(kāi)始采用數(shù)字方式錄制原始素材,并進(jìn)行后期制作,掀起了音視頻技術(shù)的革新浪潮。

在數(shù)字技術(shù)的支撐下,音視頻剪輯變得更加方便快捷。CD、MD、DVD等數(shù)字載體的出現(xiàn),不僅讓音質(zhì)畫(huà)質(zhì)大幅改善,還極大地?cái)U(kuò)充了存儲(chǔ)容量,減少了空間占用。

世界上第一款CD播放器,索尼CDP-101(1982年)

到了90年代,個(gè)人PC的規(guī)模普及,以及互聯(lián)網(wǎng)的爆炸式發(fā)展,再次刺激了音視頻技術(shù)的飛躍,并將人類(lèi)全面推向了多媒體時(shí)代。

那一時(shí)期,互聯(lián)網(wǎng)先民們瘋狂地上傳和下載mp3、wav格式的音樂(lè),bmp、jpg格式的圖片,還有rm、mov、avi格式的電影。他們不再局限于純文字的交互方式,而是全面轉(zhuǎn)向了QQ、MSN這樣的多媒體通信工具。

與此同時(shí),基于音視頻技術(shù)發(fā)展起來(lái)的游戲產(chǎn)業(yè),更是將人們對(duì)數(shù)字世界的感官體驗(yàn),推向了更高的層級(jí)。人們開(kāi)始有了對(duì)數(shù)字虛擬空間生活的早期憧憬和迷戀。

“模擬人生”游戲截圖

進(jìn)入21世紀(jì)后,隨著3G/4G、光纖寬帶的高速發(fā)展,以及摩爾定律下CPU、內(nèi)存、硬盤(pán)能力的進(jìn)一步躍升,音視頻技術(shù)再獲突破,幾乎可以說(shuō)是日新月異。

以視頻的清晰度為例,一路從早期的標(biāo)清(320p/480p),發(fā)展到高清(720P/1080P),再到超高清(4K/8K),并最終催生了前所未有的人機(jī)交互模式——VR/AR(虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí))。

VR/AR的出現(xiàn),第一次讓人類(lèi)感受到什么叫做沉浸式體驗(yàn)。我們與數(shù)字世界的交互,從單向異步,變成了雙向同步。我們向真正的數(shù)字空間生活,邁出了一大步。

2020年,騰訊提出“全真互聯(lián)網(wǎng)”。2021年,元宇宙火遍出圈。這些都是音視頻技術(shù)飛速發(fā)展的產(chǎn)物。

視頻編解碼技術(shù)的不斷演進(jìn),信息通信技術(shù)的快速迭代,極大地改善了人們的視頻觀看體驗(yàn),徹底激發(fā)了人們對(duì)平行數(shù)字空間的渴望和向往,認(rèn)為這是一種可以實(shí)現(xiàn)的夢(mèng)想。

人們不再滿(mǎn)足于使用音視頻技術(shù)傳遞真實(shí)世界的影像,而是更希望將真實(shí)世界的一切元素都“捕捉”下來(lái),轉(zhuǎn)換成無(wú)數(shù)的比特,存放在硬盤(pán)里。這些比特,將成為人們構(gòu)建數(shù)字虛擬世界的素材。

音視頻技術(shù)的需求變化

元宇宙到底能不能成真,我并不知道答案。但是,音視頻技術(shù)的需求趨勢(shì),卻是顯而易見(jiàn)的。歸納而言,就是兩點(diǎn):平民化、產(chǎn)業(yè)化。

近年來(lái),智能手機(jī)的普及,專(zhuān)業(yè)攝錄設(shè)備的降價(jià),讓越來(lái)越多的普通用戶(hù)有機(jī)會(huì)進(jìn)行音視頻內(nèi)容創(chuàng)造和生產(chǎn)。

短視頻業(yè)務(wù)的爆發(fā),以及全民直播的興起,更是將視頻平民化推向了新的高潮。

網(wǎng)紅直播帶貨

幾乎在一夜之間,我們就進(jìn)入了“人人看視頻,人人拍視頻”的時(shí)代。很多優(yōu)秀的up主或主播,能夠通過(guò)優(yōu)質(zhì)的內(nèi)容,賺取巨額收益,刺激了人們將視頻作為謀生手段的熱情。

在這樣的情況下,音視頻技術(shù)需要進(jìn)一步降低門(mén)檻,讓更多的人能夠更容易地生產(chǎn)內(nèi)容。

2020年,突如其來(lái)的新冠疫情,也間接推動(dòng)了音視頻產(chǎn)業(yè)的發(fā)展。我們需要借助虛擬空間的延伸,彌補(bǔ)疫情導(dǎo)致的物理空間上的限制。

學(xué)生居家學(xué)習(xí),企業(yè)居家辦公,產(chǎn)生了大量的網(wǎng)課、會(huì)議視頻流量。根據(jù)運(yùn)營(yíng)商的統(tǒng)計(jì)數(shù)據(jù),截至2020年底,視頻在全網(wǎng)數(shù)據(jù)流量的占比已接近70%。

遠(yuǎn)程會(huì)議

除了學(xué)習(xí)和辦公之外,產(chǎn)業(yè)將視頻的應(yīng)用進(jìn)行了延伸,發(fā)掘了更多的創(chuàng)新場(chǎng)景。

例如,借助視頻識(shí)別技術(shù),可以對(duì)產(chǎn)品進(jìn)行質(zhì)量檢驗(yàn),可以對(duì)園區(qū)進(jìn)行車(chē)輛管理,可以對(duì)工地進(jìn)行安全隱患識(shí)別。

再例如,借助VR/AR技術(shù),可以進(jìn)行人員崗前培訓(xùn),可以進(jìn)行遠(yuǎn)程手術(shù),可以進(jìn)行遠(yuǎn)程參觀,也可以進(jìn)行遠(yuǎn)程設(shè)備巡檢和故障處理。

也就是說(shuō),視頻不再僅僅是娛樂(lè)工具,而是變身為生產(chǎn)力工具。

各個(gè)領(lǐng)域和垂直行業(yè),都希望借助音視頻技術(shù),升級(jí)和改造現(xiàn)有生產(chǎn)場(chǎng)景,提升效率,降低成本。

企業(yè)希望充分利用音視頻技術(shù),但是,也面臨著對(duì)技術(shù)門(mén)檻和資源投入的擔(dān)憂(yōu),望而卻步。

我們現(xiàn)在每天都在討論數(shù)字化轉(zhuǎn)型,其實(shí),“音視頻+垂直行業(yè)”,就是企業(yè)數(shù)字化轉(zhuǎn)型的一個(gè)極佳入口。行業(yè)音視頻,即將進(jìn)入爆發(fā)期。

音視頻技術(shù)的未來(lái)方向

剛才說(shuō)的是外部需求的變化。接下來(lái),我們看看音視頻技術(shù)是如何應(yīng)對(duì)變化的。

簡(jiǎn)而言之,就是三點(diǎn):算法極致化、功能智能化、服務(wù)平臺(tái)化。

音視頻的性能指標(biāo)提升,一直沒(méi)有停止前進(jìn)的腳步。

尤其是視頻方面,因?yàn)楦咔屣@示技術(shù)的驅(qū)動(dòng),使得視頻的分辨率不斷增長(zhǎng)。除了分辨率之外,視頻的幀率要求,也在增加。

還有VR視頻,因?yàn)楹腥S的時(shí)間和空間信息,所以冗余更高,數(shù)據(jù)體積更大。

想要實(shí)現(xiàn)超高清高幀、VR/AR視頻應(yīng)用的普及,僅僅依靠增加硬盤(pán)容量和通信帶寬是不夠的,必須盡可能壓縮視頻的體積。這就離不開(kāi)視頻壓縮算法的持續(xù)改進(jìn)。

目前,全球視頻編碼標(biāo)準(zhǔn)分為多個(gè)派系。除了大家熟悉的H.26X系列(ITU-T主導(dǎo))之外,還有MPEG系列(ISO/IEC主導(dǎo)),AVS系列(國(guó)內(nèi)AVS組織主導(dǎo)),以及免費(fèi)開(kāi)源的AV1等。

來(lái)自知乎用戶(hù):甜草莓

這些標(biāo)準(zhǔn),形成了開(kāi)放的競(jìng)爭(zhēng)關(guān)系,不斷探索著視頻算法的極限。它們是視頻技術(shù)向前發(fā)展的基礎(chǔ)。

除了硬指標(biāo)提升之外,音視頻的另一個(gè)發(fā)展趨勢(shì),就是全面智能化時(shí)代的到來(lái)。

換言之,就是AI人工智能技術(shù)不斷被引入到音視頻領(lǐng)域,幫助提升音視頻內(nèi)容的生產(chǎn)效率,同時(shí)創(chuàng)新出更多的玩法。

首先看看音頻。

AI+音頻,可以實(shí)現(xiàn)對(duì)音頻信號(hào)的智能識(shí)別、編創(chuàng)。具體識(shí)別對(duì)象,可以是歌曲中的鼓點(diǎn)、節(jié)奏點(diǎn)。

AI可以針對(duì)音樂(lè)的強(qiáng)度、情緒、風(fēng)格、情感等維度,對(duì)音樂(lè)進(jìn)行理解和打標(biāo)簽。在編創(chuàng)時(shí),AI可以將音樂(lè)中人聲、伴奏、吉他、鋼琴等音軌進(jìn)行智能分離。

AI還可以自動(dòng)對(duì)歌詞進(jìn)行續(xù)寫(xiě),將一首流行歌曲,改編成一首R(shí)ap(說(shuō)唱音樂(lè))。

再看看視頻。

做過(guò)視頻的人都知道,視頻內(nèi)容創(chuàng)作的大部分工作量,都集中在視頻內(nèi)容剪輯和渲染上,既費(fèi)時(shí)又費(fèi)力。

相比于傳統(tǒng)的人工剪輯,基于算法和學(xué)習(xí),AI可以對(duì)視頻素材進(jìn)行“智能增強(qiáng)”、“智能剪輯/拆條”。

“智能增強(qiáng)”,則是通過(guò)AI技術(shù),進(jìn)行視頻圖像降噪、色彩增強(qiáng),改善畫(huà)面細(xì)節(jié),提升人眼的主觀效果。

“智能剪輯/拆條”,則是智能識(shí)別和分析視頻原始素材中人物的動(dòng)作、事件和表情,自動(dòng)定位精彩片段,將其提取出來(lái),完成剪輯、配樂(lè)等工作,變成精彩視頻集錦。

“AI+音頻+視頻”的融合,用途更為廣闊。Up主可以借此實(shí)現(xiàn)視頻智能配樂(lè)、音樂(lè)MV和vlog的自動(dòng)創(chuàng)作,大幅降低作品的生產(chǎn)難度。

除了內(nèi)容創(chuàng)作以外,AI還可以用于視頻修復(fù)(舊電影修復(fù))、視頻增強(qiáng)和行業(yè)視頻應(yīng)用。

例如,騰訊的多媒體實(shí)驗(yàn)室,通過(guò)深度學(xué)習(xí)敦煌壁畫(huà)病害數(shù)據(jù),形成自動(dòng)識(shí)別并添加圖示的一整套算法,打造出了高效的AI壁畫(huà)病害識(shí)別工具。

騰訊與敦煌研究院合作的文物VR遠(yuǎn)程會(huì)診

音視頻技術(shù)的第三個(gè)發(fā)展趨勢(shì),是服務(wù)形式的平臺(tái)化。

正如前面所介紹的,音視頻技術(shù)的應(yīng)用難度很高,一般個(gè)人和企業(yè)很難獨(dú)立玩轉(zhuǎn)。于是,現(xiàn)在很多音視頻技術(shù)服務(wù)商,開(kāi)始通過(guò)視頻云(騰訊)、視頻中臺(tái)(中國(guó)移動(dòng))等方式,對(duì)個(gè)人和政企用戶(hù)進(jìn)行音視頻能力服務(wù)。

這些平臺(tái)集成了開(kāi)放的API接口,方便上層應(yīng)用開(kāi)發(fā)商調(diào)用,開(kāi)發(fā)軟件。平臺(tái)本身,又結(jié)合了云的能力,擁有無(wú)限的算力,可以支撐用戶(hù)的需求。

專(zhuān)業(yè)服務(wù)商們提供的技術(shù)和平臺(tái),涵蓋了智能采集、數(shù)據(jù)處理和渲染展示等多個(gè)環(huán)節(jié),有利于降低垂直行業(yè)對(duì)音視頻業(yè)務(wù)的開(kāi)發(fā)門(mén)檻,讓更多的企業(yè)能夠從容地使用音視頻業(yè)務(wù),享受音視頻紅利,加快數(shù)字化轉(zhuǎn)型。

結(jié)語(yǔ)

現(xiàn)在,沒(méi)有音視頻,人們的快樂(lè)會(huì)減少一半。

未來(lái),沒(méi)有音視頻,企業(yè)的效率會(huì)下降一半。

正如前面所說(shuō),未來(lái),音視頻技術(shù)將進(jìn)入爆發(fā)期。尤其是工業(yè)制造、金融證券、文旅教育等垂直領(lǐng)域,音視頻將進(jìn)入高速增長(zhǎng)的階段。音視頻的商業(yè)模式,將發(fā)生很大的變化。音視頻業(yè)務(wù)的應(yīng)用場(chǎng)景,也將大量出現(xiàn)。

希望音視頻能夠帶來(lái)更多的創(chuàng)新,帶給我們更多的驚喜。

責(zé)任編輯:姜華 來(lái)源: 鮮棗課堂
相關(guān)推薦

2022-01-25 17:40:00

測(cè)試

2024-10-15 13:30:03

2022-06-20 05:59:35

5G技術(shù)音視頻技術(shù)安卓系統(tǒng)

2017-12-22 22:33:04

游戲語(yǔ)音音視頻社交

2017-09-19 11:00:09

音視頻技術(shù)

2023-04-10 07:49:43

云渲染平臺(tái)RTC

2022-03-28 14:59:00

元宇宙數(shù)字孿生人工智能

2023-05-06 21:52:14

數(shù)字

2023-03-03 15:40:43

抖音視頻編碼器

2017-10-23 18:13:42

CDN

2022-08-29 10:39:32

FFmpeg多媒體框架開(kāi)源

2018-05-22 13:09:57

網(wǎng)易云信音視頻

2021-01-20 15:31:00

區(qū)塊鏈比特幣數(shù)字貨幣

2018-05-23 13:54:30

窄邊屏幕筆記本

2021-11-04 16:05:08

鴻蒙HarmonyOS應(yīng)用

2018-04-23 10:24:05

2019-02-18 16:39:21

春節(jié)檔社交音視頻

2022-09-21 11:48:40

端到端音視頻測(cè)試用戶(hù)體驗(yàn)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)