DeepSeek公布了推理引擎開源路徑，OpenAI也將開始連續(xù)一周發(fā)布

作者：機器之心 2025-04-15 08:50:01

DeepSeek宣布將開源自己的內部推理引擎（internal inference engine）并與開源社區(qū)建立更廣泛的合作。

DeepSeek 默默地在自己的 open-infra-index 庫中發(fā)布了一份題為「開源 DeepSeek 推理引擎的路徑」的文檔，宣布將開源自己的內部推理引擎（internal inference engine）并與開源社區(qū)建立更廣泛的合作。有意思的是，該文檔發(fā)布之后不久就經歷了兩次修改，對一些措辭和表述進行了更加中立和寬泛的處理。

在其中一次修改中，DeepSeek 提到了與 SGLang 和 vLLM 項目的合作關系，但這兩個具體的項目名稱在新版本中被替換成了「現(xiàn)有的開源項目」。修改原因是為了強調「未來的開源合作是面向整個開源社區(qū)的，不局限于具體某些項目?！挂虼?，DeepSeek 與 SGLang 和 vLLM 這兩大開源項目的合作關系應該是已經確定了。

不得不說，DeepSeek 非常 GOAT（Greatest of All Time）！

而就在不久前，Sam Altman 才宣布 OpenAI 將開始一輪發(fā)布周。猶記得上一次，在 OpenAI 一連 12 個工作日的連續(xù)發(fā)布中，o1 滿血版、Sora、強化微調技術、Canvas 更新、o3-mini 等產品和服務紛紛問世。不知道，這一次，OpenAI 又將發(fā)布什么東西？

事實上，各路網友已經開始根據各種草蛇灰線的線索開始猜測這一周將會發(fā)布的東西了。說實在的，有一些頗具說服力，而且還有證據。

下面我們首先將介紹「開源 DeepSeek 推理引擎的路徑」，然后將簡單盤點一番網友對 OpenAI 這周發(fā)布內容的預測。

開源 DeepSeek 推理引擎的路徑

文檔地址：https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md

以下為 DeepSeek 發(fā)布的文檔的原文譯本：

幾周前，在開源周期間，我們開源了多個庫。社區(qū)的反響非常積極 —— 激發(fā)了鼓舞人心的合作、富有成效的討論以及寶貴的錯誤修復。受此鼓舞，我們決定更進一步：將我們的內部推理引擎回饋給開源社區(qū)。

我們非常感謝開源生態(tài)系統(tǒng)，沒有它，我們不可能在通用人工智能 (AGI) 方面取得進展。我們的訓練框架依賴于 PyTorch，我們的推理引擎基于 vLLM，這兩者都對加速 DeepSeek 模型的訓練和部署起到了重要作用。

鑒于部署 DeepSeek-V3 和 DeepSeek-R1 等模型的需求日益增長，我們希望盡己所能回饋社區(qū)。在我們起初考慮將完整的內部推理引擎開源時，我們發(fā)現(xiàn)了一些挑戰(zhàn)：

代碼庫差異：我們的引擎基于 vLLM 一年多前的一個早期分支。雖然結構相似，但我們針對 DeepSeek 模型對其進行了大量定制化處理，因此難以擴展到更廣泛的用例。
基礎設施依賴：該引擎與我們的內部基礎設施（包括集群管理工具）緊密耦合，如果不進行重大修改，就無法進行公開部署。
維護帶寬有限：作為一個專注于開發(fā)更優(yōu)質模型的小型研究團隊，我們缺乏維護大型開源項目的帶寬。

考慮到這些挑戰(zhàn)，我們決定采用一種更可持續(xù)的替代方案：與現(xiàn)有的開源項目合作。

展望未來，我們將在以下方面與現(xiàn)有的開源項目緊密合作：

提取出分立的功能：將可復用的組件模塊化并作為獨立的軟件庫貢獻出來。
共享優(yōu)化：直接貢獻設計改進和實現(xiàn)細節(jié)。

我們衷心感謝開源運動 —— 從操作系統(tǒng)和編程語言到機器學習框架和推理引擎。能夠為這個蓬勃發(fā)展的生態(tài)系統(tǒng)做出貢獻，并看到我們的模型和代碼受到社區(qū)的廣泛歡迎，我們深感榮幸。讓我們攜手突破通用人工智能 (AGI) 的界限，并確保其造福全人類。

注：需要說明，本文僅概述了我們開源 DeepSeek-Inference-Engine 代碼庫的路徑。對于未來的模型發(fā)布，我們將對開源社區(qū)和硬件合作伙伴保持開放和協(xié)作的態(tài)度。我們承諾在新模型發(fā)布之前主動同步與推理（inference）相關的工程工作，目標是使社區(qū)能夠從第一天起就獲得 SOTA 級支持。我們的最終目標是建立一個同步的生態(tài)系統(tǒng)，使尖端的 AI 功能能夠在模型正式發(fā)布后無縫地應用于各種硬件。

OpenAI 將發(fā)布什么？

看了 DeepSeek 振奮人心的開源路徑，再來看看 OpenAI 是否有可能給我們帶來類似的震撼。

o3、o4-mini、GPT-4.1 系列模型

對于 OpenAI 這次發(fā)布周，目前最可信的信息還是來自 OpenAI 自己，其已經在自家的 CDN（內容分發(fā)網絡）上發(fā)布了一些圖標，幾乎明示了即將發(fā)布的一系列模型。從目前網友們收集到的數(shù)據看，OpenAI 這一次一共公布了至少 5 個圖標：

但從這些圖標看，OpenAI 有可能在今晚開始的發(fā)布周中發(fā)布至少 5 個模型，包括 o3 滿血版與 o4-mini 兩個推理模型以及 GPT-4.1 系列模型（包括滿血版、mini 以及 nano）版。

開源模型

此外，還有人猜測 OpenAI 可能會開源一個可與 DeepSeek-R1 比肩的開源模型，而且這個模型很可能就是已經在 OpenRouter 上線且可免費使用的 Optimus Alpha。該模型支持 100 萬上下文長度，網友實測其編程性能非常好。

地址：https://openrouter.ai/openrouter/optimus-alpha

理由之一是如果用戶讓 Optimus Alpha 介紹自己，他會自稱是來自 OpenAI 并且基于 GPT-4 架構。

機器之心的測試

智能體軟件工程師

OpenAI CFO Sarah Friar 近日在高盛舉辦的一次活動上透露，該公司正在開發(fā)一款名叫 Agentic Software Engineer（A-SWE）的產品，即智能體軟件工程師 / 自主式軟件工程師。不同于編程助手（Copilot），A-SWE 可以自己完成構建應用、處理拉取請求、進行質量保證、修復錯誤和編寫文檔等任務。

視頻由 ?? 用戶 @slow_developer 剪輯

在此之前，OpenAI 已經發(fā)布了 Operator 和 Deep Research 這兩款智能體，分別面向計算機控制和深度研究兩個應用方向，而 A-SWE 很顯然會是一個面向編程任務的智能體。

除了以上傳言，還有網友猜測 OpenAI 可能還會發(fā)布一個新的圖像生成模型，并且其性能可能勝過因吉卜力風格生成而大火的 GPT-4o。不過關于此傳言的切實信息并不多。

你期待在 OpenAI 這次發(fā)布周上看到什么呢？

責任編輯：張燕妮來源：機器之心

DeepSeek 模型 AI

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepSeek公布了推理引擎開源路徑，OpenAI也將開始連續(xù)一周發(fā)布

開源 DeepSeek 推理引擎的路徑

OpenAI 將發(fā)布什么？

DeepSeek公布了推理引擎開源路徑，OpenAI也將開始連續(xù)一周發(fā)布

OpenAI 將發(fā)布什么？