字節(jié)跳動(dòng)豆包大模型 1.5 Pro 發(fā)布,綜合得分優(yōu)于 GPT-4o、Claude 3.5 Sonnet
1 月 22 日消息,字節(jié)跳動(dòng)旗下豆包大模型 1.5 Pro 今日正式發(fā)布,全新 Doubao-1.5-pro 模型增強(qiáng)了綜合能力,在知識(shí)、代碼、推理、中文等多個(gè)測評(píng)基準(zhǔn)上,綜合得分優(yōu)于 GPT-4o、Claude 3.5 Sonnet 等模型。
目前,Doubao-1.5-pro 已在豆包 App 灰度上線,同時(shí)開發(fā)者也可在火山引擎直接調(diào)用 API 。
據(jù)字節(jié)跳動(dòng)官方介紹,豆包大模型 1.5 Pro 使用較小的激活參數(shù)進(jìn)行預(yù)訓(xùn)練,采用大規(guī)模稀疏 MoE 架構(gòu),等效 7 倍激活參數(shù)的 Dense 模型性能,遠(yuǎn)超業(yè)內(nèi) MoE 架構(gòu)約 3 倍杠桿的常規(guī)效率。
新版豆包視覺理解模型 Doubao-1.5-vision-pro、豆包實(shí)時(shí)語音模型 Doubao-1.5-realtime-voice-pro 一同發(fā)布。
相比上一版本,Doubao-1.5-vision-pro 在多模態(tài)數(shù)據(jù)合成、動(dòng)態(tài)分辨率、多模態(tài)對(duì)齊、混合訓(xùn)練上進(jìn)行了全面的技術(shù)升級(jí),進(jìn)一步增強(qiáng)了模型在視覺推理、文字文檔識(shí)別、細(xì)粒度信息理解、指令遵循方面的能力,并讓模型的回復(fù)模式變得更加精簡、友好。
豆包大模型 1.5 Pro 本次推出了豆包?實(shí)時(shí)語音模型,并在豆包 App 全量開放(豆包 App 升級(jí)至 7.2.0 版本)。作為一款語音理解和生成一體化的模型,豆包實(shí)時(shí)語音大模型實(shí)現(xiàn)了端到端語音對(duì)話,具備低時(shí)延、對(duì)話中可隨時(shí)打斷等特性。火山引擎將在上半年通過方舟平臺(tái)推出對(duì)應(yīng) API 服務(wù)。
IT之家從字節(jié)跳動(dòng)官方獲悉,豆包大模型 1.5 Pro 宣稱“所有模型訓(xùn)練過程中,未使用任何其他模型生成的數(shù)據(jù)”。豆包大模型 1.5 全產(chǎn)品,包括 Doubao-1.5-pro,Doubao-1.5-lite,Doubao-1.5-vision-pro 等,將繼續(xù)保持原有模型價(jià)格不變,加量不加價(jià)。