DeepSeek官方發(fā)布R1模型推薦設(shè)置,這才是正確用法
自春節(jié)以來,DeepSeek 就一直是 AI 領(lǐng)域最熱門的關(guān)鍵詞,甚至可能沒有之一,其官方 App 成為了史上最快突破 3000 萬日活的應(yīng)用。最近一段時(shí)間,各家 AI 或云服務(wù)廠商更是掀起了部署 DeepSeek-R1 服務(wù)的狂潮,甚至讓薅羊毛的用戶們都有點(diǎn)忙不過來了。
就在剛剛,DeepSeek 官網(wǎng) X 帳號(hào)終于更新了(上一次更新還是在 1 月 28 日),官方下場(chǎng)推薦了部署 DeepSeek-R1 的設(shè)置。DeepSeek 強(qiáng)調(diào)官方部署的版本跟開源版本模型完全一致。
剛剛發(fā)出,就吸引了全網(wǎng)圍觀。
內(nèi)容不多,分為四項(xiàng)。
第一項(xiàng)是:不要使用系統(tǒng)提示詞。這個(gè)建議其實(shí)已經(jīng)被很多開發(fā)者提出過了。
第二項(xiàng)是:溫度參數(shù)設(shè)置為 0.6。至于原因,DeepSeek-R1 項(xiàng)目中寫到:「將溫度設(shè)置在 0.5-0.7 范圍內(nèi)(建議為 0.6),以防止無休止的重復(fù)或不連貫的輸出。」
第三項(xiàng),DeepSeek 分享了用于搜索和文件上傳的官方提示詞。
對(duì)于文件上傳,建議用戶按照模板創(chuàng)建提示,其中 {file_name}、{file_content} 和 {question} 是參數(shù)。
filetemplate = \ """[file name]: {filename} [file content begin] {file_content} [file content end] {question}"""
對(duì)于網(wǎng)頁搜索,參數(shù)包括 {search_results}、{cur_data} 和 {question} 。
對(duì)于中文查詢,使用的提示詞是:
對(duì)于英文查詢,使用的提示詞是:
第四項(xiàng)則是一個(gè)指南,說明了可以如何緩解模型繞過思考的問題。DeepSeek 寫到:「我們觀察到 DeepSeek-R1 系列模型在響應(yīng)某些查詢時(shí)傾向于繞過思考模式(即輸出 <think>\n\n</think>),這可能會(huì)對(duì)模型的性能產(chǎn)生不利影響。為了確保模型進(jìn)行徹底的推理,我們建議強(qiáng)制模型對(duì)每個(gè)輸出都以 <think>\n 為其響應(yīng)的開頭。」
雖然這一次實(shí)際上就只是更新了 DeepSeek-R1 項(xiàng)目的 README.md 文件,但依然收獲了不少好評(píng)。
當(dāng)然,也有用戶對(duì) DeepSeek 官方推薦的設(shè)置有所困惑:
最后,雖然這種開源奉獻(xiàn)精神令網(wǎng)友們感動(dòng),不過,大家當(dāng)前最大的痛還是這個(gè):