侵權(quán)、抄襲,人工智能技術(shù)如何判定這一切?
人工智能(AI)是涵蓋機器學(xué)習(xí)(ML)和深度學(xué)習(xí)(DL)技術(shù)的總稱,它有望改變?nèi)祟惿畹姆椒矫婷?,包括實時流媒體。

對于像臉書這樣的科技巨頭來說,人工智能已經(jīng)變得司空見慣。每次上傳照片時,網(wǎng)站都會使用它來自動識別用戶的臉孔。臉書的面部識別程序(稱為DeepFace)令人不安,其準(zhǔn)確性要比FBI的準(zhǔn)確得多。為什么?由于臉書龐大的照片數(shù)據(jù)庫每天都在增長,因此,AI算法得到了不斷改善。
AI可以徹底改變實時流媒體表現(xiàn)在哪幾個方面呢?
流媒體現(xiàn)在占所有計算數(shù)據(jù)的很大一部分,到2022年,視頻預(yù)測將占所有互聯(lián)網(wǎng)流量的82%。利用AI尋找更有效的方式來編碼,分發(fā)和組織數(shù)據(jù)進行簡化數(shù)字分析。從規(guī)范非法內(nèi)容到防止版權(quán)侵權(quán),人工智能有望在流媒體行業(yè)中發(fā)揮關(guān)鍵作用。
人工智能與機器學(xué)習(xí)與深度學(xué)習(xí)
雖然有時可以互換使用,但是機器學(xué)習(xí)和人工智能指的是細(xì)微差別的概念。廣義上的“人工智能”是指機器以公認(rèn)的智能方式執(zhí)行任務(wù)。執(zhí)行通常需要人類工作的任何能力-感知,推理,行動和適應(yīng)-都屬于人工智能領(lǐng)域。
機器學(xué)習(xí)將這一步驟進一步向前發(fā)展,指的是通過暴露于數(shù)據(jù)而自動獲取知識的機器。依賴模式而不是顯式指令的計算稱為機器學(xué)習(xí)。機器學(xué)習(xí)允許計算機定義自己的規(guī)則,而不是依賴于預(yù)先編程的規(guī)則。
最后,我們進行深度學(xué)習(xí)。這就是人工神經(jīng)網(wǎng)絡(luò)發(fā)揮作用的地方。這些網(wǎng)絡(luò)以人腦為模型,由數(shù)千個相互連接的節(jié)點(神經(jīng)元)組成,這些節(jié)點旨在處理和傳輸整個網(wǎng)絡(luò)中的信息。之所以將它們描述為很深,是因為它們是由多個堆疊的層組成的,允許進行計算密集型功能,例如圖像識別,聲音識別和自然語言處理。
為什么視頻直播需要人工智能(AI)
由于AI包含許多復(fù)雜的學(xué)習(xí)過程,因此它的功能是巨大的。行業(yè)領(lǐng)導(dǎo)者開始利用它來解決實時視頻流媒體傳輸中出現(xiàn)的一些問題。
借助當(dāng)今的實時流技術(shù),幾乎任何人都可以發(fā)布或觀看實時視頻。如果他們有錄音設(shè)備(例如智能手機或筆記本電腦)并且可以連接到互聯(lián)網(wǎng),則直播視頻流需要幾秒鐘。
AI物體檢測作為視頻內(nèi)容的審查方法
雖然常用于娛樂,但對象檢測具有實際優(yōu)勢。人工智能將通過這種技術(shù)支持的審查形式,為內(nèi)容監(jiān)管鋪平道路,這有望取代人工監(jiān)控。
過去,由于檢查該內(nèi)容的基礎(chǔ)設(shè)施不完善,違規(guī)視頻流變得非常流行。具體來說,臉書依靠一組審核員來中斷任何違反其社區(qū)標(biāo)準(zhǔn)的直播。通過機器學(xué)習(xí)和深度學(xué)習(xí),臉書和Google等組織將能夠更快,更智能,更有效地采取行動。我們可以期望AI解釋流內(nèi)容并自動提取元數(shù)據(jù)。從那里,他們將能夠更有效地監(jiān)視有害內(nèi)容并保護受害者的隱私。
人工智能有望使我們的數(shù)字世界更加安全,但這還不是全部。
借助AI內(nèi)容索引以改善用戶體驗
人們制作的視頻比以往任何時候都多,因此需要實時編錄流。諸如TikTok之類的流行社交媒體應(yīng)用正在利用AI來實現(xiàn)這一目標(biāo),并通過內(nèi)容個性化來增強這一點。該應(yīng)用程序的母公司字節(jié)跳動的一位代表闡明了這一點:
“我們構(gòu)建的智能機器能夠使用自然語言處理和計算機視覺技術(shù)來理解和分析文本,圖像和視頻。這使我們能夠為用戶提供他們認(rèn)為最有趣的內(nèi)容,并使創(chuàng)作者能夠與全球觀眾分享日常生活中重要的時刻。”字節(jié)跳動被評為全球最有價值的創(chuàng)業(yè)公司,表明他們必須做正確的事。
AI工具也被應(yīng)用于音樂流,以改善個性化。現(xiàn)在,算法可以采用歌曲的音高,節(jié)奏,和弦進行和人聲風(fēng)格以及用戶的歷史來建議類似的內(nèi)容。
人工智能防止版權(quán)侵權(quán)
處理實時內(nèi)容時,版權(quán)保護變得棘手。不管是防止體育賽事或流行歌曲的版權(quán)受到侵犯,監(jiān)管機構(gòu)都在尋求AI技術(shù)。 與AI可以改善內(nèi)容索引和標(biāo)記非法內(nèi)容的方法類似,基于學(xué)習(xí)的視頻工具將越來越多地用于分析實況視頻以獲取受版權(quán)保護的材料。
也就是說,人工智能可以實現(xiàn)這一目標(biāo)的程度仍然很模糊。 就音樂行業(yè)中的版權(quán)侵權(quán)而言,這種AI的應(yīng)用引出了一個問題:如何界定抄襲呢?
內(nèi)容感知編碼
像Netflix這樣的視頻流巨人使用AI根據(jù)復(fù)雜性為每個視頻確定適當(dāng)?shù)木幋a設(shè)置。這有助于優(yōu)化資源和視頻質(zhì)量。這很簡單。盡可能對低比特率的流進行編碼有助于最大程度地降低成本并節(jié)省帶寬,而體育賽事和動感十足的鏡頭需要較高的比特率才能適應(yīng)運動的節(jié)奏。
Netflix依靠機器學(xué)習(xí)通過使用視頻多方法評估融合或VMAF為每種類型的視頻量身定制編碼。同樣,油管使用神經(jīng)網(wǎng)絡(luò)來改善編碼過程。
結(jié)語
我們剛剛開始嘗試如何將人工智能應(yīng)用于實時流媒體。當(dāng)前你從事的任何工作都將在某天落入AI的范疇。編劇,剪輯,字幕等等。因此,我們最好的方法就是利用它。
也有可能涉及的風(fēng)險。一個例子就是Google的對象識別工具將黑人的照片錯誤地歸類為大猩猩的時間。為了防止將來發(fā)生此類進攻性錯誤,IBM發(fā)布了“去偏見工具包”,該工具包使公司可以掃描自己的AI系統(tǒng)以識別歧視性行為并進行適當(dāng)調(diào)整。由于AI是人類的發(fā)明,因此可以將人類的偏見內(nèi)置到系統(tǒng)中。
這些問題都需要解決。但是,隨著實時流媒體的普及,我們需要同樣強大的計算能力來對其進行編碼,索引和審查。總的來說,行業(yè)需要人工智能。