自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepSeek玩家能提前拿蘋果新品!只要15萬元,在家跑滿血版R1

人工智能 新聞
Alex老哥用配備Thunderbolt 5互連技術(傳輸速率為 80Gbps)的EXO Labs設備,來運行完整的DeepSeek R1模型(671B、8-bit)。

號稱地表最強的M3 Ultra,本地跑滿血版DeepSeek R1,效果到底如何?

其實,有些DeepSeek玩家們已經提前拿到手做過實測了。

例如這位Alex老哥就是其中之一:

圖片

他提前拿到了兩臺搭載M3 Ultra的Mac Studio,配置是這樣的:

  • M3 Ultra(32 核中央處理器、80 核圖形處理器和 32 核神經網絡引擎)
  • 512G統(tǒng)一內存
  • 1TB固態(tài)硬盤

圖片

具體來說,Alex老哥用配備Thunderbolt 5互連技術(傳輸速率為 80Gbps)的EXO Labs設備,來運行完整的DeepSeek R1模型(671B、8-bit)。

然后效果是這樣的:

嗯,跑通了!

Alex老哥表示,兩臺Mac Studio本地跑滿血版DeepSeek R1,實際速度是11 tokens/秒,理論上可以達到20 tokens/秒。

至于價格嘛,一臺上述配置的Mac Studio是74249元,兩臺就是小15萬元。

圖片

或許很多小伙伴覺得這個價格有點略貴。

但在M3 Ultra之前啊,如果你想在本地使用顯卡來推理V3或R1,那么就得起碼需要6、7張A100……大約小100萬元。

也正因如此,也有不少網友認為搭載M3 Ultra的Mac Studio,堪稱是“性價比最高的大模型一體機”。

圖片

值得注意的是,蘋果這次似乎是主動給DeepSeek玩家們提前發(fā)貨,有種讓他們趕緊測一測的意味。

畢竟在發(fā)布之際,蘋果就強調了可以在M3 Ultra版Mac Studio中跑超過6000億參數(shù)的大模型。

掀起一波本地跑DeepSeek的風

其實在M3 Ultra版Mac Studio發(fā)布前后,已經有不少人做過類似的評測。

例如B站博主“雖然但是張黑黑”的測試結果是:

  • 15.78 tokens/秒:采用Ollama的GGUF格式
  • 19.17 tokens/秒:采用更適合蘋果的MLX格式

圖片

這個速度已經跟在線使用DeepSeek R1的速度相媲美了。

除此之外,像外網博主Xcreate還把M3 Ultra版Mac Studio和M4 Max版Macbook Pro的拉到一個“擂臺”做了比較。

首先從性能上來看,Geekbench測試的結果顯示,M3 Ultra在CPU性能方面與M4 Max非常接近,但M3 Ultra略勝一籌。

圖片

在本地運行大模型測試方面,博主在運行基于Llama的DeepSeek R1 70B模型時,M3 Ultra的速度為11.3 tokens/ 秒,而M4 Max測試結果為10.69 tokens/秒,差距并不是很大。

圖片

但更重要的是測試滿血版DeepSeek R1的結果。

對此,博主認為在本地完整運行671B的DeepSeek是有點困難的,因為已經有人宣告失敗。

但也有成功的例子。

他舉例另一位評測人員的結果,顯示是運行8bit量化版本的DeepSeek R1,得到了9-21 tokens/秒的速度。

而在4bit量化版情況下,速度為16-18 tokens/秒。

圖片
圖片

至于為什么體量更大的671B的DeepSeek,會比70B運行速度更快,是因為DeepSeek將671B模型分片為 “專家混合體”,實際運行時根據(jù)問題切換,類似運行30B的模型。

最后,博主也提醒想要在本地運行大模型的友友們,網傳蘋果將在今年WWDC上發(fā)布M4 Ultra,所以可以再觀望一下。

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-25 08:20:50

AI程序員DeepSeek

2025-02-27 00:00:05

2025-03-11 02:00:00

AI工具Token-AI

2025-03-07 08:50:03

2025-01-23 08:30:00

2025-01-27 12:30:07

2025-02-17 00:00:05

IDEADeepSeek

2025-02-17 09:20:00

AI微信模型

2025-02-20 15:32:28

2025-02-11 16:11:12

2025-02-12 12:45:59

2025-03-03 00:04:00

DeepSeek教程部署

2025-02-12 12:12:59

2025-02-08 11:31:17

DeepseekR1模型

2025-02-11 08:35:30

點贊
收藏

51CTO技術棧公眾號