自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

五分鐘技術(shù)趣談 | AI技術(shù)與“網(wǎng)絡(luò)暴力”治理

網(wǎng)絡(luò) 人工智能
“網(wǎng)絡(luò)暴力”的治理,國家正在積極從法律角度,通過亮紅牌、劃紅線的方式治理網(wǎng)絡(luò)暴力,凈化網(wǎng)絡(luò)空間。也有部分公司開始探索將人工智能自然語言處理技術(shù)應(yīng)用于網(wǎng)絡(luò)暴力的分析上。

Part 01

“網(wǎng)絡(luò)暴力”是什么?

“網(wǎng)絡(luò)暴力”是指用文字、圖片、視頻等形式在網(wǎng)絡(luò)上誹謗、污蔑他人,損害他人的名譽(yù)權(quán)、隱私權(quán)等,給當(dāng)事人帶來精神壓力與心靈創(chuàng)傷,是社會(huì)暴力在網(wǎng)絡(luò)上的延伸。我們最常見的網(wǎng)絡(luò)暴力主要出現(xiàn)在微博、視頻、新聞資訊、論壇上。

“網(wǎng)絡(luò)暴力”的成因,一是網(wǎng)絡(luò)的匿名性,保護(hù)了個(gè)人隱私的同時(shí),也讓侵權(quán)者可以發(fā)表不計(jì)后果的言論;二是部分媒體為了追求流量與關(guān)注度,采用片面報(bào)道和刻意扭曲事實(shí)來增加話題性;三是當(dāng)輿論形成,個(gè)人容易趨向于群體價(jià)值理念的方向、忽視了自我理性思考的能力。

Part 02

自然語言處理技術(shù)(NLP)與“網(wǎng)絡(luò)暴力” 

社交媒體上的網(wǎng)絡(luò)暴力主要以評論、彈幕等形式傳播,對于分析評論、彈幕這樣的非結(jié)構(gòu)化語言數(shù)據(jù),應(yīng)用的核心AI技術(shù)主要是自然語言處理。自然語言處理技術(shù)基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法,能夠讓機(jī)器自動(dòng)學(xué)習(xí)語言特征,從而讓機(jī)器擁有對人類語言的理解能力,目前該技術(shù)已廣泛用于文本分類、自動(dòng)摘要、問答系統(tǒng)、機(jī)器翻譯、情感分析等方面,在現(xiàn)實(shí)生活中常見的語音助手、以及最近大火的ChatGPT等都是自然語言處理技術(shù)常見的應(yīng)用,而在“網(wǎng)絡(luò)暴力”治理方面,也會(huì)涉及到以下幾個(gè)方向:

文本實(shí)體抽?。?/span>

“網(wǎng)暴”的對象通常是某個(gè)人物或事件,所以我們首先要在海量評論數(shù)據(jù)中篩選出對某網(wǎng)暴事件的評論,這里面主要涉及命名實(shí)體識別算法(NER)。NER算法主要分為基于規(guī)則方法,基于統(tǒng)計(jì)方法,基于深度學(xué)習(xí)方法等。

圖片

圖1 命名實(shí)體識別方法

文本情感分析:

情感分析可以針對某條評論進(jìn)行正/負(fù)向打分,同時(shí)識別出語義中是否包含不同種類的情緒細(xì)節(jié),還可以從文本中智能提煉對整體情緒影響最大的關(guān)鍵詞。從而可以了解千萬條評論內(nèi)容背后的網(wǎng)民情緒分布,甚至還可以按時(shí)段,按地域,按性別對不同群體對不同事件的情緒進(jìn)行分析,及時(shí)管控對事件的消極暴力情緒,同時(shí)根據(jù)極性詞挖掘更多潛在網(wǎng)暴行為。

圖片

圖2 不同的情緒分類

涉及的技術(shù)點(diǎn)主要是利用機(jī)器學(xué)習(xí)(SVM等)或深度學(xué)習(xí)(CNN)的文本分類和極性詞挖掘,整體流程如圖所示: 

圖片

圖3 句子級情感分析方案

文本相似度分析:

對同一個(gè)事件的評論內(nèi)容進(jìn)行相似度分析,可以幫助我們發(fā)現(xiàn)事件評論的輿論趨勢。對不同事件的評論內(nèi)容進(jìn)行相似度分析,可以找到與“網(wǎng)暴”用戶用詞或表達(dá)有共同點(diǎn)的評論,挖掘出某件事/某個(gè)人近期的輿論積極/消極性。目前,相似度分析的深度學(xué)習(xí)范式主要有兩種,如下圖所示:

圖片

圖4 相似度分析的兩種范式

第一種范式首先通過深度神經(jīng)網(wǎng)絡(luò)提取評論內(nèi)容的表示向量,再通過表示向量的簡單距離函數(shù)(歐式距離等)計(jì)算兩者的相似度,這種方式提取表示向量通常用孿生網(wǎng)絡(luò)來實(shí)現(xiàn),屬于這一類的常用模型包括DSSM、CNTN等。

第二種范式是通過深度模型提取評論內(nèi)容的交叉特征,得到匹配信號張量,再聚合為相似度分?jǐn)?shù)。

句法/詞法分析:

通過句法和詞法分析,我們可以挖掘出大量“積極”評論和“網(wǎng)暴”評論的常見句法,詞法習(xí)慣,從而總結(jié)出當(dāng)前網(wǎng)絡(luò)環(huán)境中“網(wǎng)暴”用戶普遍所使用的話術(shù)和用詞,以及不同用戶在表達(dá)觀點(diǎn)極性時(shí)所使用的的語言特點(diǎn)。

句法結(jié)構(gòu)分析,用來識別句子的主謂賓定狀補(bǔ),并分析各成分之間的關(guān)系,一般基于深度學(xué)習(xí)的RNN和LSTM序列模型。

詞法分析的任務(wù)就是:將輸入的評論內(nèi)容字符串轉(zhuǎn)換成詞序列并標(biāo)記出各詞的詞性,主要用到序列標(biāo)注技術(shù),具體算法包括,條件隨機(jī)場(CRF)、RNN+CRF等。

圖片

圖5 詞法分析樣例


Part 03

總結(jié) 

“網(wǎng)絡(luò)暴力”的存在,不僅會(huì)直接危害到受害人的權(quán)益,還會(huì)對網(wǎng)絡(luò)安全和社會(huì)和諧帶來不良的影響。中國移動(dòng)智慧家庭運(yùn)營中心憑借在深度學(xué)習(xí)、圖像識別、自然語言處理、OCR等方面的技術(shù)積累,推出內(nèi)容安全防護(hù)產(chǎn)品,可對圖片、文本、視頻、音頻等中涉黃、涉暴恐、涉政、涉賭、圖片OCR、人臉識別等多維度內(nèi)容進(jìn)行安全檢測。

隨著AI技術(shù)的發(fā)展,基于技術(shù)手段的互聯(lián)網(wǎng)暴力治理,將逐漸扮演重要角色。中國移動(dòng)智慧家庭運(yùn)營中心將在該場景持續(xù)進(jìn)行先進(jìn)技術(shù)探索,結(jié)合業(yè)界前沿技術(shù)賦能內(nèi)容生態(tài)構(gòu)建,積極響應(yīng)國家網(wǎng)信辦“清朗”系列專項(xiàng)行動(dòng),為清朗網(wǎng)絡(luò)環(huán)境貢獻(xiàn)自己的一份力量。

責(zé)任編輯:龐桂玉 來源: 移動(dòng)Labs
相關(guān)推薦

2023-07-23 18:47:59

Docker開源

2023-08-06 07:00:59

Openstack網(wǎng)絡(luò)

2023-07-16 18:49:42

HTTP網(wǎng)絡(luò)

2023-04-15 20:25:23

微前端

2023-07-02 16:09:57

人工智能人臉識別

2023-07-02 16:34:06

GPU虛擬化深度學(xué)習(xí)

2023-09-12 07:10:13

Nacos架構(gòu)

2023-06-03 21:06:05

2023-07-02 16:17:31

VR虛擬現(xiàn)實(shí)

2023-08-06 06:55:29

數(shù)字可視化物聯(lián)網(wǎng)

2023-08-15 14:46:03

2023-09-17 17:51:43

Android 14

2023-07-12 16:03:37

Android開發(fā)架構(gòu)

2023-07-12 15:50:29

機(jī)器學(xué)習(xí)人工智能

2023-08-29 06:50:01

Javamaven

2024-12-18 14:10:33

2023-07-23 08:26:39

平安鄉(xiāng)村網(wǎng)絡(luò)

2023-08-07 06:31:56

Kafka

2023-09-03 19:06:42

2023-09-18 07:10:48

限流算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號