自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Google 開源 Lyra 編解碼器,利用機器學(xué)習(xí)減少語音通話帶寬使用

開源
在疫情的持續(xù)影響下,過去一年多的時間表明,在線交流對我們的生活十分重要。無論你身處何地,無論網(wǎng)絡(luò)條件如何,清楚地了解彼此的在線情況從未像現(xiàn)在這樣重要。

在疫情的持續(xù)影響下,過去一年多的時間表明,在線交流對我們的生活十分重要。無論你身處何地,無論網(wǎng)絡(luò)條件如何,清楚地了解彼此的在線情況從未像現(xiàn)在這樣重要。這就是為什么 Google 在 2 月份推出了 Lyra 的原因:一個革命性的新音頻編解碼器,使用機器學(xué)習(xí)來產(chǎn)生高質(zhì)量的語音通話。

為了讓這個編解碼器變得更加完善,Google 近日通過官方博客宣布將 Lyra 進行開源,允許其他開發(fā)者為他們的通信應(yīng)用提供助力。這個版本提供了開發(fā)者使用 Lyra 進行音頻編碼和解碼所需的工具,針對 64 位 ARM Android 平臺進行了優(yōu)化,并在 Linux 上進行了開發(fā)。Google 希望能夠擴展這個代碼庫,并與社區(qū)一起開發(fā)對其他平臺的支持和改進。

Lyra 架構(gòu)

Lyra的架構(gòu)分為兩部分,編碼器和解碼器。當有人對著手機說話時,編碼器會從他們的語音中捕捉獨特的屬性。這些語音屬性,也稱為特征,以40ms為單位提取,然后壓縮并通過網(wǎng)絡(luò)發(fā)送。解碼器的工作是將這些特征轉(zhuǎn)換回音頻波形,以便通過電話聽筒播放出來。

將特征解碼回波形的過程是通過生成模型(Generative models)處理的,生成模型是一種特殊類型的機器學(xué)習(xí)模型,非常適合從有限的特征中重新創(chuàng)建一個完整的音頻波形。Lyra架構(gòu)與傳統(tǒng)的音頻編解碼器非常相似,幾十年來,傳統(tǒng)的音頻編解碼器已經(jīng)構(gòu)成了互聯(lián)網(wǎng)通信的主干。這些傳統(tǒng)的編解碼器是基于數(shù)字信號處理(DSP)技術(shù),而 Lyra 的關(guān)鍵優(yōu)勢來自于生成模型重建高質(zhì)量語音信號的能力。

Lyra 架構(gòu)圖

影響

在過去十年中,設(shè)備上計算能力的爆炸性增長超過了可靠的高速無線基礎(chǔ)設(shè)施的建設(shè)。對于存在這種反差的地區(qū)——特別是對發(fā)展中國家而言,技術(shù)將使人們能夠更緊密地聯(lián)系在一起的承諾仍然遙遙無期。即使在擁有高度可靠網(wǎng)絡(luò)環(huán)境的地區(qū),"隨時隨地"工作和遠程辦公的出現(xiàn)也進一步限制了移動數(shù)據(jù)的使用。雖然 Lyra 將原始音頻壓縮到 3kbps,質(zhì)量優(yōu)于其他編解碼器(如 Opus),但它并不打算成為一個完全的替代方案,而是可以在這種情況下節(jié)省帶寬。

此外,Google 還認識到 Lyra 可能會有其他一些獨特的應(yīng)用,由于 Lyra 可以顯著減少音頻文件大小,因此可以用于存檔大量的語音;通過利用 Lyra 編碼器來節(jié)省移動設(shè)備的電量;緩解緊急情況下許多人試圖同時撥打電話的網(wǎng)絡(luò)擁堵。

開源版本

Lyra 的代碼是用 C++ 所編寫的,以提高速度、效率和互操作性,使用 Bazel 構(gòu)建框架和 GoogleTest 框架進行徹底的單元測試,并基于 Apache 許可協(xié)議進行分發(fā)。感興趣的用戶可以訪問 GitHub 查看源代碼及演示。

本文轉(zhuǎn)自O(shè)SCHINA

本文標題:Google 開源 Lyra 編解碼器,利用機器學(xué)習(xí)減少語音通話帶寬使用

本文地址:https://www.oschina.net/news/136239/google-open-source-lyra

責(zé)任編輯:未麗燕 來源: 開源中國
相關(guān)推薦

2021-08-18 10:41:24

GoogleSoundStream神經(jīng)網(wǎng)絡(luò)

2021-04-12 13:36:59

開源技術(shù) 工具

2021-08-03 08:38:21

Netty解碼器使用

2023-06-20 08:34:33

SVT-AV1開源

2024-07-05 08:27:07

2022-10-10 10:38:22

FedoraopenSUSE視頻編解碼

2020-02-19 19:15:27

UbuntuLinux媒體編解碼器

2021-12-25 16:20:38

微軟WindowsWindows 10

2021-08-20 13:12:18

Google 開源技術(shù)

2024-02-28 08:22:07

2021-10-08 09:38:57

NettyChannelHand架構(gòu)

2023-07-05 11:16:59

2022-02-15 21:42:23

嵌入式系統(tǒng)音頻編解碼器開發(fā)

2023-07-26 16:31:09

Windows 10Windows 11微軟

2009-07-06 16:19:00

HTML 5Ogg

2021-04-22 11:21:03

Windows 10Windows微軟

2024-10-30 14:50:00

系統(tǒng)語音模型

2021-10-08 10:50:33

AI 編碼器人工智能

2025-04-10 10:15:30

2020-12-15 14:41:23

編解碼器阿里視頻
點贊
收藏

51CTO技術(shù)棧公眾號