自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Google 推出神經(jīng)網(wǎng)絡(luò)編解碼器 SoundStream,將整合進(jìn)開源項(xiàng)目 Lyra

人工智能 深度學(xué)習(xí)
Google 近日發(fā)布了一個(gè)端到端的神經(jīng)音頻編解碼器 —— SoundStream。最重要的是,Google 表示這是世界上第一個(gè)由神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)并支持語音、音樂和環(huán)境聲音等不同聲音類型的音頻編解碼器,可以在智能手機(jī)的處理器上實(shí)時(shí)處理上述各種音頻。

Google 近日發(fā)布了一個(gè)端到端的神經(jīng)音頻編解碼器 —— SoundStream。最重要的是,Google 表示這是世界上第一個(gè)由神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)并支持語音、音樂和環(huán)境聲音等不同聲音類型的音頻編解碼器,可以在智能手機(jī)的處理器上實(shí)時(shí)處理上述各種音頻。

[[418223]]

音頻編解碼器是壓縮音頻文件的基本工具,以使其體積更小,并在傳輸過程中盡可能節(jié)省時(shí)間。因此,音頻編解碼器對(duì)于流媒體、在線語音和視頻通話這類有音頻傳輸需求的服務(wù)而言至關(guān)重要。

雖然音頻編解碼器能夠壓縮音頻體積,加速音頻傳輸過程,但壓縮后的音頻也會(huì)損失音頻質(zhì)量和細(xì)節(jié),產(chǎn)生可以讓用戶察覺到的差異。而這就是 SoundStream 能夠彌補(bǔ)的地方。

今年 2 月的時(shí)候,Google 發(fā)布了一個(gè)用于低比特率語音的神經(jīng)音頻編解碼器 Lyra,并在今年 4 月正式開源。SoundStream 是 Lyra 的一個(gè)擴(kuò)展版本。SoundStream 不僅集成了 Lyra 在低比特率「語音」方面的能力,還具有對(duì)更多聲音類型的編碼支持,包括清晰的語音、嘈雜的語音、帶有回聲的語音、音樂和環(huán)境聲音等。

SoundStream 是圍繞一個(gè)由編碼器、解碼器和量化器組成的神經(jīng)網(wǎng)絡(luò)系統(tǒng)而建立的。編碼器將音頻轉(zhuǎn)換為編碼信號(hào),之后使用量化器進(jìn)行壓縮,并使用解碼器轉(zhuǎn)換回音頻。因此,在經(jīng)過訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型后,編碼器和解碼器可以在不同的客戶端工作,有助于在各種環(huán)境下以不損失質(zhì)量的前提傳輸音頻。

Google 已經(jīng)在網(wǎng)站上發(fā)布了不同音頻壓縮樣本與原始音頻樣本的對(duì)比。通過對(duì)比測(cè)試,經(jīng)過 SoundStream 處理過的 3 kbps 的音頻要優(yōu)于 Opus 音頻編解碼器處理過的 12 kbps 音頻,效果與 ECS 編解碼器處理過的 9 kbps 十分接近。

目前 Google 自己的在線會(huì)議平臺(tái) Google Meet 和視頻平臺(tái) YouTube 仍在使用 Opus 音頻編解碼器。隨著 SoundStream 技術(shù)的不斷進(jìn)步,可能很快就能看到 Google 將在自己的服務(wù)中使用自己的技術(shù)。

Google 表示,SoundStream 是將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用在音頻編解碼器中重要的一步,比目前最先進(jìn)的編解碼器 Opus 和 EVS 效果更好。SoundStream 將被整合進(jìn) Lyra,并隨著 Lyra 下一版本的發(fā)布一同推出。開發(fā)人員可以利用現(xiàn)有的 Lyra API 和工具,來提供更好的音質(zhì)。

本文轉(zhuǎn)自O(shè)SCHINA

本文標(biāo)題:Google 推出神經(jīng)網(wǎng)絡(luò)編解碼器 SoundStream,將整合進(jìn)開源項(xiàng)目 Lyra

本文地址:https://www.oschina.net/news/155954/google-soundstream-neural-audio-codec

責(zé)任編輯:未麗燕 來源: 開源中國(guó)
相關(guān)推薦

2021-04-07 13:52:57

GoogleLyra編譯器

2021-08-20 13:12:18

Google 開源技術(shù)

2021-08-03 08:38:21

Netty解碼器使用

2021-04-12 13:36:59

開源技術(shù) 工具

2023-06-20 08:34:33

SVT-AV1開源

2024-07-05 08:27:07

2022-02-15 21:42:23

嵌入式系統(tǒng)音頻編解碼器開發(fā)

2022-10-10 10:38:22

FedoraopenSUSE視頻編解碼

2020-02-19 19:15:27

UbuntuLinux媒體編解碼器

2021-12-25 16:20:38

微軟WindowsWindows 10

2021-07-13 09:27:20

AI 解碼視頻

2023-07-05 11:16:59

2009-07-06 16:19:00

HTML 5Ogg

2021-08-11 10:03:07

iOS 14.8蘋果iOS 15

2021-10-08 09:38:57

NettyChannelHand架構(gòu)

2023-07-26 16:31:09

Windows 10Windows 11微軟

2017-09-08 16:41:43

微軟

2021-04-22 11:21:03

Windows 10Windows微軟

2024-02-28 08:22:07

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)