DeepSeek與Qwen組團開源了模型,沖!
幾乎就在同一天,兩個國內(nèi)著名大模型廠商DeepSeek與阿里通義千問組團開源了模型:DeepSeek-V3-0324(更美觀的網(wǎng)頁和游戲前端),Qwen2.5-VL-32B-Instruct(以小博大):
Qwen2.5-vl-32B模型
- 72B 對 VLM 來說太大?7B 不夠強!那么可以使用32B 模型
- 響應(yīng)更符合人類偏好:調(diào)整輸出樣式以提供更詳細(xì)、格式更好的答案,使其更符合人類偏好。
- 數(shù)學(xué)推理:顯著提高解決復(fù)雜數(shù)學(xué)問題的準(zhǔn)確性。
- 細(xì)粒度圖像理解與推理:增強圖像解析、內(nèi)容識別、視覺邏輯推理等任務(wù)的準(zhǔn)確性和細(xì)節(jié)分析。
Blog: https://qwenlm.github.io/blog/qwen2.5-vl-32b/
Qwen Chat: https://chat.qwen.ai
HF: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct
ModelScope: https://modelscope.cn/models/Qwen/Qwen2.5-VL-32B-Instruct
DeepSeek-V3-0324模型
- DeepSeek是在昨晚悄悄開源的新版本V3模型的,此次最大的亮點是編程能力,性能比肩Claude 3.7
- 前端 Web 開發(fā),提高了代碼的可執(zhí)行性,更美觀的網(wǎng)頁和游戲前端
- 漢語寫作能力,與 DeepSeek-R1 寫作風(fēng)格保持一致中長篇寫作質(zhì)量更高
- 函數(shù)調(diào)用,改進(jìn)提高了函數(shù)調(diào)用的準(zhǔn)確性,工具/MCP調(diào)用更加穩(wěn)健
本文轉(zhuǎn)載自??PaperAgent??,作者:PaperAgent
贊
收藏
回復(fù)
分享
微博
QQ
微信
舉報

回復(fù)
相關(guān)推薦