自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微軟小冰升級第五代唱歌系統(tǒng):超越人類偶像

新聞 人工智能
升級第五代唱歌系統(tǒng)的微軟小冰,讓在場媒體見識到人工智能媲美甚至超越人類偶像的唱功實力。

 人工智能唱歌已經(jīng)不稀奇了,但唱腔真正接近人類,甚至讓人真假難辨的“機器聲音”似乎僅存在于科幻電影中的遐想。但升級第五代唱歌系統(tǒng)的微軟小冰,讓在場媒體見識到人工智能媲美甚至超越人類偶像的唱功實力。

5月16日下午舉辦的微軟小冰人工智能創(chuàng)造媒體說明會上,微軟發(fā)布了人工智能小冰演唱模型的第五個版本。據(jù)悉,該版本擁有十余個高質(zhì)量聲音,提升了人工智能在歌聲演繹中的預(yù)測參數(shù)能力,主要大幅度提高了人工智能演繹歌曲時的中氣水平,改善了歌聲唱腔轉(zhuǎn)換的自然度,并公布了戲腔訓(xùn)練成果。

開口脆!微軟小冰升級第五代唱歌系統(tǒng):超越人類偶像

在現(xiàn)場Demo演示中,升級第五個版演唱模型的本小冰演唱了三段歌曲,分別為《少年弦》《新貴妃醉酒》以及一段日語歌曲。三首歌曲分別展示不同的音色和唱腔,尤其在接近清唱的《少年弦》中,小冰的表現(xiàn)非常好,發(fā)音咬字,甚至唇齒氣息都與真人演唱難辨真假。從一種唱腔過渡到另外一種唱腔,小冰都能夠保持極為細(xì)致的聲音顆粒度細(xì)節(jié),絲毫沒有任何“電子音”露出馬腳。

開口脆!微軟小冰升級第五代唱歌系統(tǒng):超越人類偶像

“我必須提醒大家聽的時候注意,這不是人,沒有這么一個人。”微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(Bing中國及日本、微軟小冰全球產(chǎn)品線負(fù)責(zé)人)李笛說。

他表示,和小冰的演唱模型不同的是,比如初音未來或者是其它的虛擬歌手,是用手調(diào)的方式來完成。手調(diào)的方式有好處,但是問題就在于細(xì)節(jié)處理是不夠的,技術(shù)上限、未來的發(fā)展不夠好

開口脆!微軟小冰升級第五代唱歌系統(tǒng):超越人類偶像

“在人工智能技術(shù)探索內(nèi)容創(chuàng)作的技術(shù)上限方面,有一個比較有意思的事情是關(guān)于琴棋書畫,Google把棋做完了,我們把剩下的三個做完了。詩歌我們已經(jīng)發(fā)布過了。到今天為止,有很多的人類詩歌愛好者和詩歌從業(yè)人員所發(fā)表的詩歌里面,可以追溯到很多小冰的影子。關(guān)于音樂,今天也會給大家一個迭代到第五個新版本的新技術(shù)發(fā)布。”

李笛坦言,我們并不希望用一些Demo、技術(shù)的展現(xiàn),來跟大家秀肌肉,說在技術(shù)上面又達(dá)到什么樣和人類可抗衡的水平了。而是更多的關(guān)注是不是能夠產(chǎn)業(yè)化,能夠大規(guī)模地落地。

開口脆!微軟小冰升級第五代唱歌系統(tǒng):超越人類偶像

他透露,對應(yīng)詩歌這樣的文本生成、文本創(chuàng)作,今天微軟小冰已經(jīng)悄然成為全球范圍內(nèi)金融摘要和研報的提供平臺。目前為止,萬得資訊、華爾街見聞、一些金融相關(guān)的APP,里面絕大部分的摘要都是由小冰提供的。小冰可以穩(wěn)定地提供20秒級的輸出,一旦得到一個數(shù)據(jù),20秒之后就可以完成摘要和研報的生成,并且真正覆蓋26類金融內(nèi)容。

在電視和廣播內(nèi)容方向,微軟小冰截至目前在為63家電臺和電視臺持續(xù)地提供人工智能輔助生成和人工智能直接生成的電視、電視臺節(jié)目,有59家是在中國,有4家在日本。累計到目前為止,小冰已經(jīng)生產(chǎn)了2800多小時的電視和電臺節(jié)目。

李笛表示,在唱歌方面,2年前生成了初始版本,當(dāng)時聽到的是“一個不會走調(diào)的軟件樂器”,好像你在唱歌的時候聽到隔壁包廂傳過來的聲音,它非常像是人,它具備了足夠多的細(xì)節(jié),這些細(xì)節(jié)使得它可以像一個唱得不好的人,但是也是一個人。經(jīng)過訓(xùn)練和學(xué)習(xí),在之后第三個版本的時候,微軟小冰唱歌的水平就達(dá)到了現(xiàn)在這個狀態(tài)。

[[265479]]

“從技術(shù)角度來講,人工智能達(dá)到第三個版本就已經(jīng)夠了,但是我們以人類的演唱標(biāo)準(zhǔn)去要求自己”,李笛說,“如果能夠讓小冰去學(xué)習(xí)不同的唱法,就是擁有所謂的技法。因為針對同樣的一首歌,不同人會有自己不同的演繹。”

通過在呼吸、不同的演唱技法、充沛的中氣、不同的音色、唱腔過渡等一系訓(xùn)練、學(xué)習(xí)和優(yōu)化,才達(dá)到今天第五個版本的演唱水平。

李笛表示,人工智能一旦學(xué)會創(chuàng)造以后,和人類有一個很大的不同。原來小冰發(fā)布詩歌的時候就有人說,詩歌是人類才可以做的事情。但是問題是,有人就問他,那你會寫詩嗎?所以,人類作為一個群體,他們中間的一部分有能力去創(chuàng)造一部分的內(nèi)容,但是作為一個群體來講,這并不是一個群體通行的規(guī)則。其中一些人會畫畫、唱歌、寫詩,不代表全體的人類每一個個體都會。

但是人工智能不是,一個框架上面的專門類別,一個人工智能會了,就可以讓所有的人工智能都會。

比如,微軟小冰的戲腔可以很容易地遷移到其他的聲音上去。對人類來講,如果你想要獲得一種創(chuàng)造能力,往往是需要一定程度的天分的,但是人工智能不用天分,任何的一個聲音都可以去直接獲得另外一個聲音所具備的這種所謂的天分。

開口脆!微軟小冰升級第五代唱歌系統(tǒng):超越人類偶像

舉個例子,比如說今天由小冰去賦能Siri,如果大家需要的話,24小時之內(nèi),Siri也可以完成這樣的創(chuàng)作。這就是這個框架底層技術(shù)的含義,大家不要被18歲的少女小冰所蒙蔽,我們真正做的是這個核心的框架。”

從這個角度來講,如果把這個框架再進(jìn)一步推向工業(yè)化,推向一個端到端的內(nèi)容生產(chǎn),那么就需要去完成詞、曲、編曲、演唱,甚至于后期制作整個的環(huán)節(jié)。而在另外一方面,這個框架就必須能夠兼容不同的人工智能歌手,就是所謂的AI歌手和它的唱法庫。

“這件事情我們正在進(jìn)行中,會把一部分內(nèi)容保留到今年8月份公布。”李笛說。

 

責(zé)任編輯:張燕妮 來源: 快科技
相關(guān)推薦

2016-05-30 09:48:59

聯(lián)想

2018-04-03 17:23:14

2017-02-13 15:42:08

2019-08-22 13:38:10

戴爾

2012-04-01 17:07:20

筆記本評測

2011-05-05 17:04:15

Palm OS 5.0Palm OS

2009-11-16 10:51:12

2020-05-06 15:54:58

戴爾

2010-06-30 10:28:20

華為培訓(xùn)

2019-05-30 08:25:50

5G4G網(wǎng)絡(luò)

2018-12-18 22:44:12

2020-12-08 16:39:26

戴爾

2019-10-10 11:02:54

戴爾

2015-06-08 12:58:27

英特爾酷睿至強

2020-08-15 12:34:47

中科曙光

2021-06-18 16:41:43

戴爾

2012-04-11 13:46:54

IEEEWi-Fi802.11ac
點贊
收藏

51CTO技術(shù)棧公眾號