百川智能 × 昇騰AI|百川重磅發(fā)布Baichuan2大模型!已上線昇思開(kāi)源社區(qū)
【2023年9月6日,北京】今日,百川智能在北京召開(kāi)大模型發(fā)布會(huì),正式發(fā)布Baichuan2開(kāi)源大模型,昇騰AI基礎(chǔ)軟硬件平臺(tái)正式支持Baichuan2大模型,并在昇思MindSpore開(kāi)源社區(qū)大模型平臺(tái)上線Baichuan2-7B模型開(kāi)放體驗(yàn)。
發(fā)布會(huì)現(xiàn)場(chǎng),百川智能宣布正式開(kāi)源微調(diào)后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其量化版本4bit,面向?qū)W術(shù)及商業(yè)市場(chǎng)提供大模型服務(wù),并且均為免費(fèi)可商用。
昇思MindSpore版本開(kāi)源倉(cāng)鏈接:
https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md
昇思MindSpore開(kāi)源社區(qū)大模型平臺(tái):
https://xihe.mindspore.cn/modelzoo/baichuan2_7b_chat
文理兼?zhèn)湫阅軆?yōu)異,全面領(lǐng)先 LLaMA 2
Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于2.6T?質(zhì)量多語(yǔ)?數(shù)據(jù)進(jìn)?訓(xùn)練,在保留了上一代開(kāi)源模型良好的生成與創(chuàng)作能力,流暢的多輪對(duì)話能力以及部署?檻較低等眾多特性的基礎(chǔ)上,兩個(gè)模型在數(shù)學(xué)、代碼、安全、邏輯推理、語(yǔ)義理解等能?有顯著提升。其中Baichuan2-13B-Base相比上?代13B模型,數(shù)學(xué)能力提升49%,代碼能?提升46%,安全能力提升37%,邏輯推理能力提升25%,語(yǔ)義理解能力提升15%。
本次開(kāi)源的兩個(gè)模型在各?評(píng)測(cè)榜單上的表現(xiàn)優(yōu)秀,在MMLU、CMMLU、GSM8K等幾?權(quán)威評(píng)估基準(zhǔn)中,以絕對(duì)優(yōu)勢(shì)領(lǐng)先LLaMA 2,相比其他同等參數(shù)量大模型,表現(xiàn)也十分亮眼,性能大幅度優(yōu)于LLaMA 2等同尺寸模型競(jìng)品。
更值得一提的是,根據(jù)MMLU等多個(gè)權(quán)威英文評(píng)估基準(zhǔn)評(píng)分 Baichuan2-7b以70億的參數(shù)在英文主流任務(wù)上與130 億參數(shù)量的LLaMA 2基本持平。
7B參數(shù)模型的Benchmark成績(jī)
13B參數(shù)模型的Benchmark成績(jī)
Baichuan2-7B和Baichuan2-13B不僅對(duì)學(xué)術(shù)研究完全開(kāi)放,開(kāi)發(fā)者也僅需郵件申請(qǐng)獲得官方商用許可后,即可以免費(fèi)商用。
Baichuan2大模型
Baichuan2大模型是由百川智能開(kāi)發(fā)的一系列開(kāi)源可商用的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型。包含了70億、130億、530億參數(shù)的模型。百川智能?成?之初,就將通過(guò)開(kāi)源?式助?中國(guó)?模型?態(tài)繁榮作為公司的重要發(fā)展?向。此次開(kāi)源的兩款Baichuan2?模型,得到了上下游企業(yè)的積極響應(yīng),華為等眾多知名企業(yè)均參加了本次發(fā)布會(huì)并與百川智能達(dá)成了合作。
昇騰AI
昇騰 AI 是以昇騰 AI 基礎(chǔ)軟硬件平臺(tái)為基礎(chǔ)構(gòu)建的人工智能計(jì)算產(chǎn)業(yè)。昇騰AI基礎(chǔ)軟硬件平臺(tái)包括 Atlas 系列硬件及伙伴自有品牌硬件、異構(gòu)計(jì)算架構(gòu) CANN、全場(chǎng)景AI框架昇思 MindSpore、昇騰應(yīng)用使能 MindX、一站式開(kāi)發(fā)平臺(tái) ModelArts 和統(tǒng)一工具鏈MindStudio 等。