自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MIT研究發(fā)現(xiàn):十大最常用數(shù)據(jù)集標(biāo)簽錯誤率達(dá)3.4%

新聞
近日,麻省理工學(xué)院檢查了10個最常引用的AI數(shù)據(jù)集。他們發(fā)現(xiàn)其中存在大約3.4%的數(shù)據(jù)不正確或標(biāo)簽錯誤,這可能會導(dǎo)致使用這些數(shù)據(jù)集的AI系統(tǒng)出現(xiàn)問題。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

近日,麻省理工學(xué)院檢查了10個最常引用的AI數(shù)據(jù)集。他們發(fā)現(xiàn)其中存在大約3.4%的數(shù)據(jù)不正確或標(biāo)簽錯誤,這可能會導(dǎo)致使用這些數(shù)據(jù)集的AI系統(tǒng)出現(xiàn)問題。

MIT研究發(fā)現(xiàn):十大最常用數(shù)據(jù)集標(biāo)簽錯誤率達(dá)3.4%

這些數(shù)據(jù)集被引用次數(shù)均超過10萬次,其中包括來自新聞的文本數(shù)據(jù)集, 亞馬遜和IMDb評論。上圖就是幾個明顯標(biāo)簽錯誤的例子。

為了發(fā)現(xiàn)可能的錯誤,研究人員使用了Confident Learning,檢查數(shù)據(jù)集的標(biāo)簽噪聲。

研究人員發(fā)現(xiàn)QuickDraw數(shù)據(jù)集錯誤最多,大約有500萬,約占數(shù)據(jù)集的10%。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2020-10-23 14:14:54

語音識別ASR錯誤率

2023-08-08 12:34:18

ChatGPT人工智能

2022-09-04 19:38:11

機器學(xué)習(xí)算法

2022-07-19 16:23:00

數(shù)據(jù)谷歌

2025-04-07 04:10:00

黑客RDP服務(wù)器

2018-05-21 21:34:26

Linux命令代碼

2022-10-08 12:04:49

語言網(wǎng)絡(luò)安全

2012-10-08 09:21:49

jQuery Mobi

2022-12-09 15:09:00

2025-01-06 00:02:51

2009-08-26 09:09:46

服務(wù)器維護(hù)錯誤

2024-01-12 08:00:00

2024-03-12 08:57:39

2017-02-27 11:36:31

阿里

2010-02-03 10:15:30

2013-06-28 10:41:07

產(chǎn)品經(jīng)理

2014-03-18 11:05:16

Android應(yīng)用導(dǎo)航設(shè)計錯誤

2010-05-10 09:10:51

Linux

2022-06-08 13:02:19

數(shù)據(jù)治理變革管理工具

2018-02-23 10:02:25

技術(shù)阿里巴巴基因
點贊
收藏

51CTO技術(shù)棧公眾號