自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%

發(fā)布于 2025-4-18 09:47
瀏覽
0收藏

今天凌晨,微軟在官網(wǎng)開源了DeepSeek-R1魔改版MAI-DS-R1,在保留原有推理性能的基礎(chǔ)上進(jìn)行了大幅度增強(qiáng)。


尤其是在響應(yīng)和屏蔽詞方面有了顯著改進(jìn):MAI-DS-R1可以響應(yīng)99.3%的敏感話題提示,比原版R1提升了2倍,這對(duì)于政治學(xué)術(shù)研究、社會(huì)問題、倫理道德研究等幫助巨大;

但在安全風(fēng)險(xiǎn)大幅度降低,比原版R1降低了50%。那些想體驗(yàn)一下“放飛自我”版R1的小伙伴們可以試試這個(gè),非常有意思打開全新世界。

微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%-AI.x社區(qū)

開源地址:??https://huggingface.co/microsoft/MAI-DS-R1??

Azure地址:??https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml??


微軟在訓(xùn)練 MAI-DS-R1 的過程中,從大約 350000 個(gè)被屏蔽的主題示例中,收集和篩選查詢關(guān)鍵詞,將這些關(guān)鍵詞轉(zhuǎn)化為多個(gè)問題,并翻譯成不同語言;


還通過 DeepSeek R1 和內(nèi)部模型為這些問題生成答案和思維鏈。此外,訓(xùn)練數(shù)據(jù)中還納入了來自Tulu3 SFT數(shù)據(jù)集的 110K 個(gè)安全和違規(guī)示例,這些示例涵蓋了 CoCoNot、WildJailbreak 和 WildGuardMix 等內(nèi)容。

微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%-AI.x社區(qū)

隨后,微軟對(duì)MAI-DS-R1進(jìn)行了綜合評(píng)估。在敏感話題響應(yīng)方面,MAI-DS-R1能夠成功響應(yīng)99.3%的敏感話題提示,這一表現(xiàn)顯著優(yōu)于DeepSeek R1和R1-1776。


在安全性評(píng)估方面,MAI-DS-R1在HarmBench評(píng)估中表現(xiàn)出色,相比DeepSeek R1和R1-1776,在減少有害內(nèi)容方面降低了50%風(fēng)險(xiǎn)。這說明雖然MAI-DS-R1能響應(yīng)更多的敏感話題,但還是在安全控制范圍之內(nèi)。

微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%-AI.x社區(qū)

在推理能力方面,MAI-DS-R1保持了與DeepSeek R1相同的推理能力,在一般知識(shí)、推理、數(shù)學(xué)和編程基準(zhǔn)測(cè)試中表現(xiàn)非常出色。

微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%-AI.x社區(qū)

微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%-AI.x社區(qū)

在倫理和法律標(biāo)準(zhǔn)方面,MAI-DS-R1在處理非法或不道德的請(qǐng)求時(shí)表現(xiàn)得更加謹(jǐn)慎,拒絕生成有害或不當(dāng)?shù)膬?nèi)容。


此外,MAI-DS-R1在后訓(xùn)練過程中將問題翻譯成多種語言,能夠更好地適應(yīng)不同語言環(huán)境下的需求。這使得MAI-DS-R1在需要多語言支持的領(lǐng)域,如國際組織、跨國企業(yè)、教育機(jī)構(gòu)等,能夠提供多語言的高質(zhì)量回答。

目前,微軟已經(jīng)在huggingface開源了該模型,同時(shí)在Azure AI Foundry進(jìn)行了發(fā)布。


本文轉(zhuǎn)自 AIGC開放社區(qū)  ,作者:AIGC開放社區(qū)


原文鏈接:??https://mp.weixin.qq.com/s/gQ9LA6lWevmw32aJ8Ck0Pg??


標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦