自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

走出“題海戰(zhàn)術(shù)”,讓模型學(xué)會(huì)像人一樣思考

人工智能
當(dāng)你在社交媒體上發(fā)表內(nèi)容時(shí),在打出#時(shí),社交媒體會(huì)推薦給你一個(gè)合適的Hashtag (話題詞) ,把內(nèi)容劃分到相應(yīng)的話題下面去,方便對(duì)社交媒體的內(nèi)容進(jìn)行分類管理。

 [[395305]]

近日,螞蟻安全天筭實(shí)驗(yàn)室安全專家蕉雪與復(fù)旦大學(xué)自然語(yǔ)言處理團(tuán)隊(duì)(Fudan NLP)魏忠鈺教授合作的學(xué)術(shù)論文《基于小樣本學(xué)習(xí)的個(gè)性化Hashtag推薦》被中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦B類期刊《中文信息學(xué)報(bào)》錄取。

《中文信息學(xué)報(bào)》創(chuàng)刊于1986年,作為國(guó)內(nèi)計(jì)算機(jī)、計(jì)算技術(shù)類83種中文期刊評(píng)出的十五種核心期刊之一,及時(shí)反映著我國(guó)中文信息處理的先進(jìn)水平 。數(shù)據(jù)顯示,《中文信息學(xué)報(bào)》每年在各個(gè)相關(guān)子方向錄取文章平均為10篇左右, 代表了我國(guó)最新的中文信息處理進(jìn)展和學(xué)術(shù)動(dòng)向。

一、快速學(xué)習(xí):從“題海戰(zhàn)術(shù)”到“觸類旁通”

當(dāng)你在社交媒體上發(fā)表內(nèi)容時(shí),在打出#時(shí),社交媒體會(huì)推薦給你一個(gè)合適的Hashtag (話題詞) ,把內(nèi)容劃分到相應(yīng)的話題下面去,方便對(duì)社交媒體的內(nèi)容進(jìn)行分類管理。

為什么要在Hashtag推薦算法里引入小樣本學(xué)習(xí)算法?復(fù)旦大學(xué)自然語(yǔ)言處理團(tuán)隊(duì)的曾蘭君同學(xué)向我們介紹:舉個(gè)例子,現(xiàn)有的Hashtag推薦算法,一般是使用分類框架來(lái)做的, 當(dāng)你 使用屬于100個(gè)類別的社交媒體文本來(lái)對(duì)模型進(jìn)行訓(xùn)練,后面在做推薦時(shí),模型也只能將待 推薦的文本分到這100個(gè)類別中來(lái)。 沒有進(jìn)行重新訓(xùn)練的情況下,模型不能處理訓(xùn)練不可見的Hashtag。

然而,Hashtag會(huì)隨著時(shí)事熱點(diǎn)不斷快速更新。課題組 希 望社交媒體在你寫下#時(shí),就會(huì)根據(jù)你社交媒體文本的歷史特征和當(dāng)前輸入的文本內(nèi)容,猜到你可能需要的Hashtag,并將合適的Hashtag推薦給你。

為了解決這一問題,論文提出將Hashtag推薦任務(wù)建模成小樣本學(xué)習(xí)任務(wù)。 同時(shí),結(jié)合用戶使用Hashtag的 偏好降低推薦的復(fù)雜度。 通過互聯(lián)網(wǎng)公開授權(quán)的API獲取的數(shù)據(jù)集上的 實(shí)驗(yàn)表明, 與目前最優(yōu)方法相比,該模型不僅可以取得更好的推薦結(jié)果,而且表現(xiàn)更為魯棒 (即穩(wěn)定性更強(qiáng)) 。

一般模型在認(rèn)識(shí)一個(gè)類別的時(shí)候,需要非常多的數(shù)據(jù)才能夠正確地識(shí)別一個(gè)類別,這種依賴于數(shù)據(jù)學(xué)習(xí)的識(shí)別,就像一個(gè)高考機(jī)器,通過題海戰(zhàn)術(shù)來(lái)提高做題效率,卻缺乏有效的推理邏輯。而對(duì)于人類來(lái)說,即便是兒童,當(dāng)你告訴他看到的一張圖片是什么的話,他就能很快地認(rèn)識(shí)這個(gè)類別。

小樣本學(xué)習(xí)就是希望機(jī)器能夠擁有這樣一個(gè)能力,在見到一個(gè)只有少量樣本的類別之后,通過數(shù)據(jù)學(xué)習(xí)舉一反三,就擁有對(duì)這個(gè)類別的識(shí)別能力。它可以根據(jù)用戶的歷史特征,之前學(xué)到的經(jīng)驗(yàn)和當(dāng)前的少量樣本,能夠快速的認(rèn)識(shí)這個(gè)新類別,從而使識(shí)別的效率得到提升。

在未來(lái),小樣本學(xué)習(xí)可以運(yùn)用到更多的領(lǐng)域當(dāng)中。在欺詐風(fēng)險(xiǎn)防控中,欺詐手法識(shí)別對(duì)于欺詐風(fēng)險(xiǎn)形勢(shì)感知以及欺詐管控至關(guān)重要。而新欺詐手法會(huì)不斷出現(xiàn),對(duì)于新手法的樣本積累往往不足以訓(xùn)練好的識(shí)別模型,如何在少數(shù)樣本積累的情況下對(duì)新手法進(jìn)行準(zhǔn)確識(shí)別也是一個(gè)問題。這篇對(duì)于小樣本學(xué)習(xí)進(jìn)行研究的工作后續(xù)計(jì)劃遷移到欺詐手法識(shí)別的場(chǎng)景中。

二、知識(shí)驅(qū)動(dòng):從“填鴨式接受”到“主動(dòng)推理”

在小樣本學(xué)習(xí)領(lǐng)域以外,魏忠鈺教授和螞蟻天筭安全實(shí)驗(yàn)室還在欺詐要素識(shí)別的領(lǐng)域進(jìn)行了合作。魏忠鈺教授表示,此項(xiàng)目是希望模型在面對(duì)大量用戶的欺詐投訴文本時(shí),能夠通過舉報(bào)文本來(lái)判定欺詐要素是否滿足進(jìn)而判定欺詐事實(shí)是否成立。

項(xiàng)目的創(chuàng)新之處在于:之前的模型識(shí)別是數(shù)據(jù)來(lái)驅(qū)動(dòng);現(xiàn)在模型能在模型識(shí)別文本要素后主動(dòng)推理,通過數(shù)據(jù)學(xué)習(xí)和知識(shí)推理的雙驅(qū)動(dòng),更有效地將風(fēng)險(xiǎn)防范于未然。

因?yàn)樵擁?xiàng)目跟業(yè)務(wù)場(chǎng)景有很高的關(guān)聯(lián)度,但團(tuán)隊(duì)沒有法律方面的專家,在前期對(duì)欺詐文本的標(biāo)注及識(shí)別上遇到困難,只能通過對(duì)信息檢索系統(tǒng)和相關(guān)文獻(xiàn)的調(diào)研,來(lái)設(shè)計(jì)初步的文本標(biāo)注的框架。

而螞蟻在合作中引入了司法團(tuán)隊(duì),提供了相對(duì)專業(yè)的關(guān)于欺詐識(shí)別的框架設(shè)計(jì),使標(biāo)簽體系的建立更符合業(yè)務(wù)場(chǎng)景,在此框架上,校方團(tuán)隊(duì)再進(jìn)行數(shù)據(jù)的標(biāo)注、模型自動(dòng)化識(shí)別等算法的設(shè)計(jì)來(lái)完成模型。螞蟻前期提供的框架基礎(chǔ),相當(dāng)于在業(yè)務(wù)上對(duì)研究團(tuán)隊(duì)有了一次很實(shí)際的指導(dǎo),最后呈現(xiàn)出來(lái)的效果甚至超出雙方的預(yù)期。

目前團(tuán)隊(duì)對(duì)于欺詐要素的識(shí)別準(zhǔn)確率已超過85%,主要識(shí)別舉報(bào)者是否被誘騙轉(zhuǎn)賬、收款方是否有非法占有目的等欺詐司法審理的關(guān)鍵證據(jù)。研究團(tuán)隊(duì)目前完成欺詐投訴樣本的要素標(biāo)注達(dá)到4萬(wàn)條,通過欺詐要素識(shí)別模型判斷引導(dǎo)用戶主動(dòng)去補(bǔ)充遺漏點(diǎn),加強(qiáng)用戶在舉報(bào)流程中的體驗(yàn)感和主觀能動(dòng)性。在這過程中用戶完成舉報(bào)率相對(duì)提高了10%,舉報(bào)的信息質(zhì)量提升了8%。確保了欺詐定性的準(zhǔn)確率穩(wěn)定增長(zhǎng),對(duì)于欺詐的防控效率也得到提升。

據(jù)課題組的研究成果顯示,在對(duì)用戶舉證文本的欺詐證據(jù)要素的識(shí)別基礎(chǔ)上,進(jìn)一步通過數(shù)據(jù)+知識(shí)推理實(shí)現(xiàn)智能抗辯審理,模型根據(jù)用戶舉證與大數(shù)據(jù)信息為用戶輸出可解釋性更強(qiáng)的審理邏輯鏈條和結(jié)果 (即模型不僅能給出結(jié)論,還能告訴你它的分析思路,提供有說服力的理由) 。

相較于傳統(tǒng)的依賴數(shù)據(jù)學(xué)習(xí)的欺詐識(shí)別算法,本次與螞蟻的聯(lián)合創(chuàng)新性地提出了將人的知識(shí)、經(jīng)驗(yàn)、規(guī)則都輸入到欺詐識(shí)別算法體系中,模型將實(shí)現(xiàn)基于推理的智能判斷。相信課題組在這一技術(shù)上的創(chuàng)新將更好地保障用戶的資金安全,也對(duì)提升行業(yè)整體的風(fēng)控水平起到重要作用。

魏忠鈺教授表示: 這樣全新的校企合作模式,不僅帶來(lái)了團(tuán)隊(duì)研究一直所需的應(yīng)用落地場(chǎng)景,還將螞蟻的實(shí)際業(yè)務(wù)經(jīng)驗(yàn)與團(tuán)隊(duì)在算法上的創(chuàng)新互相補(bǔ)益,成為往后科研項(xiàng)目運(yùn)營(yíng)的一次很好的示范。 期待與螞蟻日后能夠有更進(jìn)一步的長(zhǎng)期合作,同時(shí)也期待這項(xiàng)研究在多個(gè)場(chǎng)景中得到應(yīng)用,為用戶推薦更為精準(zhǔn)的信息內(nèi)容。

 

責(zé)任編輯:張燕妮 來(lái)源: 螞蟻安全實(shí)驗(yàn)室
相關(guān)推薦

2022-07-12 14:56:30

AI模型研究

2018-07-30 13:19:15

打印機(jī)

2015-04-09 11:27:34

2023-09-22 11:56:57

模型駕駛

2020-03-09 10:00:35

人工智能機(jī)器學(xué)習(xí)技術(shù)

2022-11-24 12:22:39

2017-05-22 10:33:14

PythonJuliaCython

2011-10-24 13:07:00

2021-10-31 08:09:07

網(wǎng)絡(luò)攻擊黑客網(wǎng)絡(luò)安全

2020-10-11 21:39:35

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)

2022-09-27 14:45:51

安全服務(wù)商黑客

2022-07-12 16:46:45

DeepMindAIAlphaFold?

2009-12-08 18:06:12

戴爾存儲(chǔ)動(dòng)車組

2009-12-08 14:26:13

大型網(wǎng)絡(luò)運(yùn)維

2020-12-07 10:10:22

企業(yè)文化客戶體驗(yàn)

2009-11-02 09:44:07

2019-04-11 18:00:40

數(shù)據(jù)數(shù)據(jù)科學(xué)項(xiàng)目

2023-04-05 14:19:07

FlinkRedisNoSQL

2021-04-13 22:30:17

SpringBoot日志微服務(wù)

2012-10-26 12:33:58

視頻會(huì)議視頻通信華為
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)