OpenAI公開了大模型o3-mini的推理思維鏈
2月8日消息,據(jù)外媒報道,OpenAI更新了o3-mini?AI模型的“思維鏈”功能,讓用戶可以看到模型的思考過程。這是在DeepSeek-R1發(fā)布之后發(fā)生的,DeepSeek-R1是一個競爭對手的推理模型,也顯示了其反應(yīng)背后的思維過程。
推理模型旨在逐步分解其決策過程,因此需要更長的時間來生成響應(yīng)。這樣的解釋可以更容易地理解為什么給出了特定的響應(yīng),允許用戶看到為什么他們的提示可能會或可能不會產(chǎn)生期望的答案。它們還允許人工智能研究人員識別潛在的偏見或錯誤,并提高其推理能力。
OpenAI在一篇文章中表示,該公司已經(jīng)為免費和付費用戶發(fā)布了“更新的OpenAI?o3-mini思維鏈”,并為付費用戶發(fā)布了o3-mini-high思維鏈?!皁3-mini-high是o3-mini的付費版本,具有更深入的推理能力和更詳細的思維過程,但代價是反應(yīng)時間較慢。
在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能讓用戶訪問思想鏈摘要,而不是完整的推理;該公司表示,這是為了“在速度和準確性之間提供一個平衡的權(quán)衡”,盡管它過去也提到“競爭優(yōu)勢”是決定的一個因素。
然而,由于DeepSeek的開源R1展示了其反應(yīng)背后的整個過程,OpenAI決定將該過程公布。在更新中,“模型的原始(思維鏈)仍然隱藏,因為它很難理解”,但以一種“易于閱讀”的方式呈現(xiàn)。
新的、更深入的推理總結(jié)將經(jīng)過后處理步驟,簡化任何過于復(fù)雜的解釋,刪除任何“不安全”的推理解釋,并將其翻譯成用戶的母語。
OpenAI的首席產(chǎn)品官Kevin?Weil表示:“展示所有的思維鏈會帶來競爭的升華,但我們也知道人們需要它,所以我們會找到平衡它的正確方法。”這就是這種平衡的結(jié)果。