自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

從數(shù)據(jù)標(biāo)注師看AI技術(shù)深度應(yīng)用

原創(chuàng)
人工智能 機(jī)器學(xué)習(xí)
近期,AI領(lǐng)域的黑科技不斷刷新人們對(duì)人工智能的認(rèn)知,從張學(xué)友演唱會(huì)上人臉識(shí)別逃犯,到菜鳥在杭州試點(diǎn)的智能柜刷臉取件服務(wù),再到西溪濕地景區(qū)刷臉入園,阿里人臉識(shí)別已應(yīng)用在阿里平臺(tái)的電商、通信、寄遞、旅行、直播等60多個(gè)業(yè)務(wù)場(chǎng)景,人工智能技術(shù)開(kāi)始全面賦能各產(chǎn)業(yè)。

【51CTO.com原創(chuàng)稿件】近期,AI領(lǐng)域的黑科技不斷刷新人們對(duì)人工智能的認(rèn)知,從張學(xué)友演唱會(huì)上人臉識(shí)別逃犯,到菜鳥在杭州試點(diǎn)的智能柜刷臉取件服務(wù),再到西溪濕地景區(qū)刷臉入園,阿里人臉識(shí)別已應(yīng)用在阿里平臺(tái)的電商、通信、寄遞、旅行、直播等60多個(gè)業(yè)務(wù)場(chǎng)景,人工智能技術(shù)開(kāi)始全面賦能各產(chǎn)業(yè)。

優(yōu)酷AI技術(shù)成為各領(lǐng)域深度賦能的技術(shù)標(biāo)桿 

今年6月世界杯直播期間,優(yōu)酷向全世界展示了其在AI及云視頻領(lǐng)域的雄厚實(shí)力,作為歷史上首家拿下世界杯直播權(quán)的主流視頻平臺(tái),優(yōu)酷世界杯直播成功首秀的背后,由優(yōu)酷自研的“智能媒體大腦”、阿里云密集的CDN節(jié)點(diǎn)和巨量帶寬儲(chǔ)備支撐,實(shí)質(zhì)上是一場(chǎng)圍繞內(nèi)容產(chǎn)業(yè)的技術(shù)升級(jí)浪潮。

這波浪潮剛剛平息不久,優(yōu)酷的一則招聘啟示又登上熱搜。“娛樂(lè)數(shù)據(jù)標(biāo)注師”,俗稱“吻戲鑒定師”,其崗位描述如下:一是對(duì)視頻數(shù)據(jù)進(jìn)行標(biāo)注及歸納整理,二是負(fù)責(zé)數(shù)據(jù)質(zhì)量校驗(yàn),三是協(xié)助人臉識(shí)別模型的訓(xùn)練,對(duì)娛樂(lè)領(lǐng)域的算法進(jìn)行優(yōu)化。乍一看,AI相關(guān)職業(yè),工作年限要求不高,無(wú)臉盲,認(rèn)識(shí)大量明星,追過(guò)大量綜藝、網(wǎng)劇和電影,了解機(jī)器學(xué)習(xí),簡(jiǎn)直高大上啊!

可以說(shuō),優(yōu)酷招聘“娛樂(lè)數(shù)據(jù)標(biāo)注師”,是優(yōu)酷機(jī)器學(xué)習(xí)技術(shù)又一深度賦能產(chǎn)業(yè)的標(biāo)桿案例。

 “吻戲鑒定師”的叫法絕非浪得虛名,其主要職責(zé)是滿足視頻的智能編輯需求,將視頻分割成圖像對(duì)其進(jìn)行打標(biāo)簽,如教計(jì)算機(jī)識(shí)別接吻場(chǎng)景,需要將圖片打上“接吻”和“非接吻”的標(biāo)簽。據(jù)悉,目前優(yōu)酷標(biāo)簽庫(kù)的標(biāo)簽大致可分為三級(jí),標(biāo)簽種類已達(dá)上萬(wàn)個(gè),其中常用標(biāo)簽一千余個(gè),機(jī)器能夠理解的標(biāo)簽已達(dá)百余個(gè)。

[[241420]]

給接吻鏡頭打標(biāo)

優(yōu)酷高級(jí)算法工程師吉恒杉表示,為視頻打標(biāo)簽的訴求很早就有,以前都是以人工的方式針對(duì)頭部劇打標(biāo)簽,且顆粒度不會(huì)那么細(xì)。有了AI,通過(guò)智能的方式部分取代了人工打標(biāo)簽,一是提高了打標(biāo)效率,二是處理的顆粒度更細(xì)。優(yōu)酷算法專家郭亮提到,“AI智能化主要是對(duì)視頻的內(nèi)容做理解,有各種各樣的維度,通過(guò)收集用戶的喜好,例如喜歡的明星,喜歡的視頻類別和場(chǎng)景,來(lái)推薦更符合用戶喜好的視頻。”

“通過(guò)機(jī)器去理解視頻中的接吻、擁抱等片段,核心是要了解視頻中的情緒,將比較沖突的看點(diǎn)標(biāo)記出來(lái),推薦上榜,機(jī)器打標(biāo)能夠極大提高推薦的準(zhǔn)確率。如果人工去標(biāo)記整部劇,很難全部標(biāo)記出來(lái),機(jī)器識(shí)別的好處在于能夠形成規(guī)模化效應(yīng),標(biāo)簽越精細(xì),效益也就越高。”優(yōu)酷資深技術(shù)專家解縉介紹,“優(yōu)酷視頻上的劇集預(yù)告和回放片段都可以通過(guò)視覺(jué)理解技術(shù)自動(dòng)生產(chǎn),目前人工生產(chǎn)和機(jī)器生產(chǎn)的比例是7:3,二者相輔相成,熱點(diǎn)非常強(qiáng)的視頻會(huì)采用人工推薦,但不會(huì)全部由機(jī)器替代。” 

當(dāng)然,人臉識(shí)別模型需要不斷訓(xùn)練來(lái)提高準(zhǔn)確率,機(jī)器要學(xué)習(xí)大量的內(nèi)容場(chǎng)景,數(shù)據(jù)標(biāo)注師相當(dāng)于機(jī)器識(shí)別的老師,幫助機(jī)器理解哪些圖像是“吻戲”、“打戲”、“進(jìn)球”等,理解視頻中包含哪些明星,識(shí)別明星臉、網(wǎng)紅臉,經(jīng)過(guò)在不同場(chǎng)景、不同角度的反復(fù)學(xué)習(xí),準(zhǔn)確率才能達(dá)到可用水平。 

實(shí)際上,接吻場(chǎng)景又分正面、側(cè)面和后面等多類鏡頭,99%以上的接吻是一整段視頻,它是一個(gè)連續(xù)的場(chǎng)景,可以以鏡頭為單位,當(dāng)人物和臉融合在一起時(shí),業(yè)務(wù)準(zhǔn)確度可以達(dá)到非常高的水平。通過(guò)對(duì)視頻的拆分,可以對(duì)明星進(jìn)行識(shí)別,統(tǒng)計(jì)某一明星在單集中出現(xiàn)的時(shí)間段,可以將該明星出現(xiàn)的鏡頭拆分出來(lái)推薦給喜愛(ài)這一明星的用戶觀看,“只看他/她”這一功能在技術(shù)上已經(jīng)能夠?qū)崿F(xiàn)了,只是尚未對(duì)廣大用戶開(kāi)放。

[[241421]]

各種角度的網(wǎng)紅臉 傻傻分不清

說(shuō)到這里,小編有個(gè)疑問(wèn),明星臉尤其是網(wǎng)紅臉是怎么鑒別的呢,娛樂(lè)圈眾多明星撞臉,常常傻傻分不清楚,機(jī)器又該怎么識(shí)別呢?吉恒杉透露,該圖像分類識(shí)別模型基于當(dāng)前主流的TensorFlow以及阿里內(nèi)部的框架開(kāi)發(fā),為了保證機(jī)器識(shí)別的準(zhǔn)確率,技術(shù)人員會(huì)統(tǒng)一調(diào)一個(gè)閾值,如果明星比較多,會(huì)對(duì)明星做微調(diào)。保證識(shí)別準(zhǔn)確率一方面在于數(shù)據(jù),另一方面在于分類模型,當(dāng)圖片數(shù)據(jù)量達(dá)到一萬(wàn)張時(shí),準(zhǔn)確率達(dá)到80%左右就可以交給編輯進(jìn)行評(píng)估或是生產(chǎn)了,目前的圖片數(shù)據(jù)量已達(dá)幾萬(wàn)張,準(zhǔn)確率越來(lái)越高。

據(jù)悉,目前優(yōu)酷主要招聘娛樂(lè)數(shù)據(jù)標(biāo)注師和體育數(shù)據(jù)標(biāo)注師兩大類,對(duì)這兩方面感興趣且對(duì)機(jī)器學(xué)習(xí)有一定了解的程序員不妨一試。

技術(shù)團(tuán)隊(duì)底蘊(yùn)深厚,優(yōu)酷AI技術(shù)實(shí)力處在行業(yè)前列

在被問(wèn)及優(yōu)酷機(jī)器識(shí)別模型的訓(xùn)練時(shí)長(zhǎng)時(shí),吉恒杉表示該模型到目前為止僅訓(xùn)練2個(gè)多月的時(shí)間,如此短的訓(xùn)練時(shí)長(zhǎng)即可交付應(yīng)用,相信很多人對(duì)背后這支技術(shù)團(tuán)隊(duì)涌發(fā)強(qiáng)烈的好奇。

據(jù)目前了解,阿里對(duì)AI技術(shù)的研究已有數(shù)年,早在2015年10月,阿里安全部已開(kāi)始用人工智能識(shí)別網(wǎng)絡(luò)上包括色情、暴力在內(nèi)的違規(guī)信息,被稱為“阿里AI鑒黃師”,到目前為止,在智能鑒黃模型上跑的正常圖片與色情圖片數(shù)量已達(dá)千萬(wàn)張。阿里AI鑒黃師不僅能鑒別黃片黃圖,連帶有情色信息的語(yǔ)音內(nèi)容都能識(shí)別。當(dāng)然,AI鑒黃并不能完全取代人工鑒黃,最佳的審核方式是智能為主,人工為輔。人工鑒黃師群體被AI鑒黃師取代,轉(zhuǎn)而去做打標(biāo)和審查可疑圖片的工作,與優(yōu)酷所招聘的數(shù)據(jù)標(biāo)注師的職能類似。

今年世界杯期間,從拿到世界杯直播授權(quán),到世界杯開(kāi)賽,只有短短2個(gè)星期的時(shí)間,支撐優(yōu)酷直播的這支團(tuán)隊(duì)囊括了產(chǎn)品技術(shù)團(tuán)隊(duì)、阿里云的團(tuán)隊(duì)還有阿里做天貓雙十一的技術(shù)保障團(tuán)隊(duì)。在多個(gè)團(tuán)隊(duì)的合力支持下,6月14日,世界杯揭幕戰(zhàn)拉動(dòng)優(yōu)酷移動(dòng)端新用戶增長(zhǎng)日環(huán)比近160%,整體日活用戶環(huán)比增長(zhǎng)20%左右,世界杯直播觀看人數(shù)超過(guò)1200萬(wàn),創(chuàng)造優(yōu)酷平臺(tái)直播歷史新高。

阿里巴巴副總裁、阿里大文娛優(yōu)酷CTO莊卓然表示:“世界杯直播是阿里將機(jī)器智能大規(guī)模應(yīng)用于文娛產(chǎn)業(yè)各領(lǐng)域的一個(gè)縮影。從高質(zhì)量多媒體內(nèi)容的智能生產(chǎn)、大規(guī)模網(wǎng)絡(luò)資源的智能調(diào)度、到實(shí)時(shí)流媒體的智能編碼與動(dòng)態(tài)渲染,背后都有機(jī)器智能的參與。”

AI技術(shù)全面服務(wù)于內(nèi)容生產(chǎn)各環(huán)節(jié)

此前,莊卓然曾公開(kāi)表示,“文娛行業(yè)正處在發(fā)生巨變的前夜,而技術(shù)的發(fā)展正是推動(dòng)這次變革的推手,尤其是在中國(guó)。世界杯只是一個(gè)縮影,技術(shù)對(duì)內(nèi)容產(chǎn)業(yè)的影響是多元的,隨著機(jī)器智能、大數(shù)據(jù)、云計(jì)算的發(fā)展成熟,我們深刻的意識(shí)到,內(nèi)容產(chǎn)業(yè)的每一個(gè)環(huán)節(jié)都將迎來(lái)新的一輪升級(jí)。”

據(jù)莊卓然介紹,高頻運(yùn)動(dòng)畫面的清晰度和流暢度一直是互聯(lián)網(wǎng)體育賽事直播最大的挑戰(zhàn),而在本次世界杯直播中,優(yōu)酷技術(shù)團(tuán)隊(duì)利用在流媒體處理和網(wǎng)絡(luò)分發(fā)領(lǐng)域的深度積累,結(jié)合近年來(lái)在機(jī)器智能技術(shù)的沉淀和突破,創(chuàng)新性地將廣電專業(yè)鏈路同互聯(lián)網(wǎng)流媒體智能基礎(chǔ)設(shè)施結(jié)合,形成AI時(shí)代的“智能媒體大腦”,包括:智能編解碼、智能調(diào)度、智能交互、智能處理、智能生產(chǎn)五大引擎,全面覆蓋實(shí)時(shí)流媒體內(nèi)容的生產(chǎn)、分發(fā)、消費(fèi)與交互場(chǎng)景,保證了隨時(shí)隨地觀看高清、流暢直播的一體化體驗(yàn)首次在互聯(lián)網(wǎng)端實(shí)現(xiàn)。


其中優(yōu)酷世界杯直播受到一致好評(píng)的高清晰度背后就是智能編解碼引擎的作用,該技術(shù)還有一個(gè)名字“窄帶高清2.0”,已在優(yōu)酷平臺(tái)廣泛應(yīng)用,本次優(yōu)酷技術(shù)團(tuán)隊(duì)又針對(duì)賽事直播景基于機(jī)器學(xué)習(xí)優(yōu)化了特有的編碼策略,比如足球、草地、球員分別采用特別編碼策略進(jìn)行優(yōu)化,大幅提升了比賽畫面的層次感和通透性。 

[[241422]]

隨著機(jī)器智能、大數(shù)據(jù)、云計(jì)算的發(fā)展成熟,內(nèi)容產(chǎn)業(yè)的每一個(gè)環(huán)節(jié)都將引來(lái)新的一輪升級(jí)。莊卓然表示,“在AI驅(qū)動(dòng)下,優(yōu)酷的整個(gè)內(nèi)容采買、策劃、運(yùn)營(yíng)、甚至廣告營(yíng)銷體系都完成了重塑”。

“內(nèi)容產(chǎn)業(yè)會(huì)進(jìn)入到一個(gè)更加智能的時(shí)代,一個(gè)更加個(gè)性化多元化的時(shí)代,一個(gè)更加極致體驗(yàn)的時(shí)代。” 莊卓然表示,正式進(jìn)入阿里經(jīng)濟(jì)體兩年后,經(jīng)過(guò)技術(shù)基礎(chǔ)設(shè)施、人才團(tuán)隊(duì)和商業(yè)生態(tài)的進(jìn)一步融合,優(yōu)酷正在努力抓住這一機(jī)遇,加速落地好萊塢+硅谷模式,積極推動(dòng)中國(guó)式創(chuàng)新,迎接中國(guó)文娛行業(yè)走向世界巔峰的新機(jī)遇。

【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】

責(zé)任編輯:查士加 來(lái)源: 51CTO
相關(guān)推薦

2025-03-18 15:53:20

2019-01-16 21:00:44

2021-05-06 09:05:11

深度學(xué)習(xí)

2024-09-26 10:29:56

數(shù)據(jù)中臺(tái)數(shù)據(jù)飛輪

2019-07-03 10:21:50

人工智能數(shù)據(jù)庫(kù)算法

2024-02-19 14:18:11

2018-01-23 11:09:04

區(qū)塊鏈技術(shù)重用

2016-06-30 16:52:23

開(kāi)源

2020-01-02 10:21:40

技術(shù)研發(fā)架構(gòu)

2021-07-30 19:07:27

大數(shù)據(jù)云計(jì)算云原生化

2011-03-14 09:21:34

減震產(chǎn)品地震

2023-04-11 08:37:30

TPUAI芯片

2021-11-12 15:16:32

深度學(xué)習(xí)數(shù)據(jù)合成人工智能

2023-10-13 11:55:17

2011-05-11 13:58:19

HTML5

2024-09-23 19:47:27

數(shù)據(jù)技術(shù)數(shù)據(jù)飛輪數(shù)據(jù)驅(qū)動(dòng)

2016-01-15 10:18:48

ces展望技術(shù)

2017-04-01 13:30:23

OpenStack O容器技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)