自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="y6buk"><i id="y6buk"></i></blockquote>}

<big id="y6buk"></big>

<blockquote id="y6buk"><b id="y6buk"></b></blockquote>

<p id="y6buk"><li id="y6buk"><pre id="y6buk"></pre></li></p>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

弱智吧竟成最佳中文AI訓練數(shù)據(jù)？！中科院等：8項測試第一，遠超知乎豆瓣小紅書

作者：量子位 2024-04-07 06:50:00

人工智能新聞

使用弱智吧數(shù)據(jù)訓練的大模型，跑分超過百科、知乎、豆瓣、小紅書等平臺，甚至是研究團隊精心挑選的數(shù)據(jù)集。

想了解更多AIGC的內(nèi)容：

請訪問： 51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

離大譜了，弱智吧登上正經(jīng)AI論文，還成了最好的中文訓練數(shù)據(jù)？？

具體來說，使用弱智吧數(shù)據(jù)訓練的大模型，跑分超過百科、知乎、豆瓣、小紅書等平臺，甚至是研究團隊精心挑選的數(shù)據(jù)集。

在問答、頭腦風暴、分類、生成、總結(jié)、提取等8項測試中取得最高分。

沒錯，論文中的Ruozhiba就是指百度貼吧弱智吧，一個充滿荒謬、離奇、不合常理發(fā)言的中文社區(qū)，畫風通常是這樣的：

最離譜的是，弱智吧AI代碼能力也超過了使用專業(yè)技術(shù)問答社區(qū)思否數(shù)據(jù)訓練的AI，這下吧友自己都鬧不明白了。

其他平臺圍觀網(wǎng)友也紛紛蚌埠住。

這項研究來自中科院深圳先進技術(shù)研究院、中科院自動化研究所，滑鐵盧大學等眾多高校、研究機構(gòu)聯(lián)合團隊。

作者之一也現(xiàn)身評論區(qū)，透露使用弱智吧數(shù)據(jù)訓練AI屬于靈機一動，以前只用來測試。

弱智吧數(shù)據(jù)究竟如何達成這一成就，具體到論文中看。

弱智發(fā)言成指令微調(diào)神器

這項研究起初為解決中文大模型訓練中的諸多問題：

中文數(shù)據(jù)集很多是從英文翻譯過來的，沒有很好地契合中文的語言習慣和文化背景
不少數(shù)據(jù)集是用AI生成的，質(zhì)量難以保證，容易出現(xiàn)事實性錯誤
即使是人工標注的數(shù)據(jù)集，也存在數(shù)據(jù)量小、覆蓋領(lǐng)域不全面等問題

為了解決這些痛點，團隊從中文互聯(lián)網(wǎng)的各種知識源頭直接收集數(shù)據(jù)，比如知乎、豆瓣、百科、小紅書等，經(jīng)過一系列嚴格的清洗和人工審核，打造成高質(zhì)量、多樣化的中文指令微調(diào)數(shù)據(jù)集COIG-CQIA。

除了探索不同數(shù)據(jù)源的作用，團隊還專門從中抽取出一個精華子集CQIA-Subset。

在眾多數(shù)據(jù)來源中，弱智吧成了最特別的一個。

由500個點贊最高的帖子標題+人工或GPT-4的回復組成指令微調(diào)數(shù)據(jù)集，經(jīng)過人工審核后，最終留下了240組指令-回復數(shù)據(jù)對。

分別用各種數(shù)據(jù)集訓練零一萬物Yi系列開源大模型，在BELLE-Eval測試集上使用GPT-4評分得到結(jié)果。

在規(guī)模較小的Yi-6B模型上，純?nèi)踔前砂姹究偡峙琶谌?，還不算太突出。

看來小模型還沒能領(lǐng)悟弱智的精髓。

到了Yi-34B，弱智吧版本表現(xiàn)就一騎絕塵了。

只有在改寫和數(shù)學任務(wù)上沒能取得最高分，但成績也比較靠前。

另外，在安全評估上弱智吧版本也能排上第二。

對于這類現(xiàn)象，研究人員在分析中也給出簡單猜測：

可能是弱智吧問題增強了AI的邏輯推理能力，從而使指令遵循任務(wù)受益。

當然弱智吧并不是這項研究的全部，它的真正貢獻在于為中文大模型開發(fā)提供了一個高質(zhì)量的指令微調(diào)數(shù)據(jù)集COIG-CQIA。

通過對各種中文互聯(lián)網(wǎng)數(shù)據(jù)源的探索，這項研究為構(gòu)建中文指令數(shù)據(jù)集提供了很多有益的啟示。比如社交媒體數(shù)據(jù)雖然開放多樣，但也存在不少有害信息風險；而百科類數(shù)據(jù)專業(yè)性強，但覆蓋面可能不夠廣。

弱智吧上大分

這項研究一發(fā)，網(wǎng)友集體笑不活。除了“XSWL、思路開闊了”嬸兒的純圍觀，也有網(wǎng)友認真討論起了弱智吧有如此奇效的原因。

大伙兒都比較認可的一個原因是弱智吧題目的“異質(zhì)”。

像腦筋急轉(zhuǎn)彎，增加了指令多樣性，所以提升了模型最終性能：

通用數(shù)據(jù)集多半已經(jīng)在pretrain階段見過了，再訓一遍只會加重overfitting。

另一個原因是弱智吧數(shù)據(jù)文本質(zhì)量很高，用詞準確且簡潔。

千言萬語匯成一句話：把弱智吧只當簡單的段子合集真的是嚴重低估了它的價值！

雀食，要不此前弱智吧問題也經(jīng)常被大伙兒用來測試大模型呢。

事實上從ChatGPT誕生之初，弱智吧就深度參與了大模型的發(fā)展，可以算是這一波AI浪潮的重要見證者了。

一開始只是網(wǎng)友拿來拷打AI，搞搞節(jié)目效果。

后來大家發(fā)現(xiàn)，弱智吧問題中充滿陷阱，剛好可以用來分辨AI能力高低。

還記得23年初那會兒，各家大模型第一版還不太能很好應(yīng)對這類問題，如2023年3月的文心一言：

后續(xù)版本也漸入佳境了，如2023年8月的文心一言：

直到今天，弱智吧問題都是每個新發(fā)布大模型都必須要過的一關(guān)，被戲稱為弱智吧Benchmark。

△秘塔寫作貓

△Inspo

再后來，AI公司們自己也開始重視起來，如百度官方就搞過聯(lián)動直播。

當初網(wǎng)友為了調(diào)戲大模型專門搜集的弱智吧問題測試集，沒想到有一天也能搖身一變，成了訓練集。

思路確實是被打開了～

想了解更多AIGC的內(nèi)容：

請訪問： 51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

責任編輯：張燕妮來源：量子位

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<tfoot id="ly9fw"></tfoot>

<cite id="ly9fw"><track id="ly9fw"></track></cite>