微軟開源DeepSeek-R1魔改版:響應(yīng)99%敏感提示,風(fēng)險(xiǎn)降50%
今天凌晨,微軟在官網(wǎng)開源了DeepSeek-R1魔改版MAI-DS-R1,在保留原有推理性能的基礎(chǔ)上進(jìn)行了大幅度增強(qiáng)。
尤其是在響應(yīng)和屏蔽詞方面有了顯著改進(jìn):MAI-DS-R1可以響應(yīng)99.3%的敏感話題提示,比原版R1提升了2倍,這對(duì)于政治學(xué)術(shù)研究、社會(huì)問題、倫理道德研究等幫助巨大;
但在安全風(fēng)險(xiǎn)大幅度降低,比原版R1降低了50%。那些想體驗(yàn)一下“放飛自我”版R1的小伙伴們可以試試這個(gè),非常有意思打開全新世界。
開源地址:??https://huggingface.co/microsoft/MAI-DS-R1??
Azure地址:??https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml??
微軟在訓(xùn)練 MAI-DS-R1 的過程中,從大約 350000 個(gè)被屏蔽的主題示例中,收集和篩選查詢關(guān)鍵詞,將這些關(guān)鍵詞轉(zhuǎn)化為多個(gè)問題,并翻譯成不同語言;
還通過 DeepSeek R1 和內(nèi)部模型為這些問題生成答案和思維鏈。此外,訓(xùn)練數(shù)據(jù)中還納入了來自Tulu3 SFT數(shù)據(jù)集的 110K 個(gè)安全和違規(guī)示例,這些示例涵蓋了 CoCoNot、WildJailbreak 和 WildGuardMix 等內(nèi)容。
隨后,微軟對(duì)MAI-DS-R1進(jìn)行了綜合評(píng)估。在敏感話題響應(yīng)方面,MAI-DS-R1能夠成功響應(yīng)99.3%的敏感話題提示,這一表現(xiàn)顯著優(yōu)于DeepSeek R1和R1-1776。
在安全性評(píng)估方面,MAI-DS-R1在HarmBench評(píng)估中表現(xiàn)出色,相比DeepSeek R1和R1-1776,在減少有害內(nèi)容方面降低了50%風(fēng)險(xiǎn)。這說明雖然MAI-DS-R1能響應(yīng)更多的敏感話題,但還是在安全控制范圍之內(nèi)。
在推理能力方面,MAI-DS-R1保持了與DeepSeek R1相同的推理能力,在一般知識(shí)、推理、數(shù)學(xué)和編程基準(zhǔn)測(cè)試中表現(xiàn)非常出色。
在倫理和法律標(biāo)準(zhǔn)方面,MAI-DS-R1在處理非法或不道德的請(qǐng)求時(shí)表現(xiàn)得更加謹(jǐn)慎,拒絕生成有害或不當(dāng)?shù)膬?nèi)容。
此外,MAI-DS-R1在后訓(xùn)練過程中將問題翻譯成多種語言,能夠更好地適應(yīng)不同語言環(huán)境下的需求。這使得MAI-DS-R1在需要多語言支持的領(lǐng)域,如國際組織、跨國企業(yè)、教育機(jī)構(gòu)等,能夠提供多語言的高質(zhì)量回答。
目前,微軟已經(jīng)在huggingface開源了該模型,同時(shí)在Azure AI Foundry進(jìn)行了發(fā)布。
本文轉(zhuǎn)自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)
原文鏈接:??https://mp.weixin.qq.com/s/gQ9LA6lWevmw32aJ8Ck0Pg??
