自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="flbzt"></cite>

<cite id="flbzt"></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

專用于法律的兩個(gè)開(kāi)源大模型，最高1410億參數(shù)

發(fā)布于 2024-9-11 10:38

瀏覽

0收藏

法國(guó)國(guó)家高等教育計(jì)算中心、巴黎薩克雷大學(xué)的研究人員聯(lián)合開(kāi)源了專用于法律領(lǐng)域的大模型——SaulLM。

SaulLM一共有540億、1410億兩種參數(shù)，以及基礎(chǔ)模型和指令微調(diào)兩種版本。SaulLM的最大特色是使用了5400億token的專業(yè)法律數(shù)據(jù)進(jìn)行了預(yù)訓(xùn)練，包括美國(guó)、歐洲、澳大利亞等地的法律文本，輸出內(nèi)容的準(zhǔn)確率高于很多同類模型。

開(kāi)源地址：https://huggingface.co/Equall/SaulLM-54-Base

指令微調(diào)：https://huggingface.co/Equall/SaulLM-141B-Instruct

專用于法律的兩個(gè)開(kāi)源大模型，最高1410億參數(shù)-AI.x社區(qū)

SaulLM-54B和SaulLM-141B是基于Mixtral系列模型開(kāi)發(fā)而成，通過(guò)引入專家混合（MoE）機(jī)制，顯著提升了模型處理大量數(shù)據(jù)的能力。

MoE架構(gòu)的核心思想是將大型模型分解為多個(gè)小型專家網(wǎng)絡(luò)，這些專家可以根據(jù)輸入數(shù)據(jù)的不同特點(diǎn)被動(dòng)態(tài)地激活。這種方法不僅提高了模型的計(jì)算效率，還增強(qiáng)了模型處理復(fù)雜法律文本的能力。

專用于法律的兩個(gè)開(kāi)源大模型，最高1410億參數(shù)-AI.x社區(qū)

SaulLM-54B由32層組成，模型維度為4096，隱藏維度為14336；而SaulLM-141B則由56層構(gòu)成，模型維度增至6144，隱藏維度達(dá)到16384。使得兩個(gè)模型最多能支持長(zhǎng)達(dá)32768和65536個(gè)token的上下文長(zhǎng)度。

研究人員使用了分段策略來(lái)訓(xùn)練SaulLM模型，包括持續(xù)預(yù)訓(xùn)練、專業(yè)法律指令遵循協(xié)議的實(shí)施，以及模型輸出與人類偏好的對(duì)齊。

第一步使用了超過(guò)5400億token的專業(yè)法律語(yǔ)料庫(kù)對(duì)模型進(jìn)行預(yù)訓(xùn)練，蓋了來(lái)自不同法律體系的廣泛文本，包括美國(guó)、歐洲、澳大利亞等地的法律文獻(xiàn)。

在預(yù)訓(xùn)練過(guò)程中，研究人員采用了AdamW優(yōu)化器，并設(shè)置了特定的學(xué)習(xí)速率和梯度累積策略，以優(yōu)化模型的學(xué)習(xí)效率和穩(wěn)定性。此外，為了應(yīng)對(duì)模型在訓(xùn)練過(guò)程中可能出現(xiàn)的災(zāi)難性遺忘等問(wèn)題，研究團(tuán)隊(duì)還引入了重放策略，重新引入早期訓(xùn)練分布中的數(shù)據(jù)，以增強(qiáng)模型的記憶能力。

法律領(lǐng)域?qū)Υ竽Ｐ洼敵鰞?nèi)容的準(zhǔn)確性和專業(yè)性要求極高。為了提升模型在法律任務(wù)上的表現(xiàn)，研究人員使用了專業(yè)法律指令遵循協(xié)議，訓(xùn)練模型理解和執(zhí)行法律場(chǎng)景中的指令。

在這一階段，模型接受了包括法律分析、案件總結(jié)、法規(guī)解讀等多種法律相關(guān)任務(wù)的訓(xùn)練。通過(guò)這種方式，模型學(xué)會(huì)了如何根據(jù)法律專家的需求，提供準(zhǔn)確和相關(guān)的信息。

專用于法律的兩個(gè)開(kāi)源大模型，最高1410億參數(shù)-AI.x社區(qū)

為了使模型的輸出更加符合法律專業(yè)人士的期望和偏好，使用了模型輸出與人類偏好的對(duì)齊方法。主要使用了合成數(shù)據(jù)和人類反饋來(lái)調(diào)整模型的輸出。合成數(shù)據(jù)的生成是基于模型的自我對(duì)話，模擬法律專家在分析案件時(shí)可能提出的問(wèn)題和答案。通過(guò)這種方式，模型能夠?qū)W習(xí)到法律推理的深層邏輯和結(jié)構(gòu)。

同時(shí)，研究人員還引入了人類反饋機(jī)制，通過(guò)評(píng)估模型輸出的準(zhǔn)確性、相關(guān)性和邏輯一致性，進(jìn)一步優(yōu)化模型的性能。

研究人員在專業(yè)法律基準(zhǔn)測(cè)試平臺(tái)LegalBench - Instruct 和多基準(zhǔn)平臺(tái)MMLU上對(duì)模型進(jìn)行了綜合評(píng)估。

專用于法律的兩個(gè)開(kāi)源大模型，最高1410億參數(shù)-AI.x社區(qū)

實(shí)驗(yàn)結(jié)果顯示， SaulLM – 54B優(yōu)于 Mixtral - 54B，SaulLM -141B也優(yōu)于Mixtral - 141B，比GPT-4、Llama-3也更加出色。此外，繼續(xù)預(yù)訓(xùn)練顯著增強(qiáng)了模型在法律領(lǐng)域的性能，在 IFT和 DPO階段都有大約 7% 的顯著提升。

本文轉(zhuǎn)自 AIGC開(kāi)放社區(qū) ，作者：AIGC開(kāi)放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/tgNnk_REDBjmRwagTF8Uog??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

2萬(wàn)億訓(xùn)練數(shù)據(jù)，120億參數(shù)！開(kāi)源大模型Stable LM 2-12B

Aceryt ? 3562瀏覽 ? 0回復(fù)
首批開(kāi)源 8B 和 70B兩個(gè)版本，未來(lái)有望開(kāi)源400B大模型！

AIGC最前線 ? 1.2w瀏覽 ? 0回復(fù)
楊立昆等語(yǔ)出驚人：這里有兩個(gè)悖論

51CTO技術(shù)棧 ? 2483瀏覽 ? 0回復(fù)
谷歌開(kāi)源TimesFM：1000億個(gè)時(shí)間點(diǎn)訓(xùn)練，入選ICML 2024

duhorse ? 2759瀏覽 ? 0回復(fù)
什么是超參數(shù)？大模型的超參數(shù)是做什么用的？超參數(shù)和大模型參數(shù)有什么關(guān)系？

AI探索時(shí)代 ? 5416瀏覽 ? 0回復(fù)
谷歌發(fā)布專用于個(gè)人健康的大語(yǔ)言模型PH-LLM

Aceryt ? 2342瀏覽 ? 0回復(fù)
專用于理解游戲場(chǎng)景的開(kāi)源大模型-VideoGameBunny

Aceryt ? 2648瀏覽 ? 0回復(fù)
超GPT-4o，1240億參數(shù)！最強(qiáng)開(kāi)源多模態(tài)模型 Pixtral Large！

Aceryt ? 2049瀏覽 ? 0回復(fù)
開(kāi)源最大AI視頻模型，130億參數(shù)，性能媲美閉源，擊敗Runway Gen-3、Luma 1.6

51CTO技術(shù)棧 ? 2173瀏覽 ? 0回復(fù)
NVIDIA AI 推出 Fugatto：一個(gè) 25 億參數(shù)的音頻模型，可從文本和音頻輸入生成音樂(lè)、語(yǔ)音和聲音

Halo咯咯 ? 2101瀏覽 ? 0回復(fù)
RAG技術(shù)落地的兩個(gè)問(wèn)題及應(yīng)對(duì)策略

zhishan15 ? 1863瀏覽 ? 0回復(fù)
兩個(gè)簡(jiǎn)單技巧把 RAG 檢索正確率從 50% 提高到 95 %

玄姐聊AGI ? 5867瀏覽 ? 0回復(fù)
阿里開(kāi)源QwQ-32B，性能與Deepseek R1持平。一個(gè)擁有320億參數(shù)的全新推理模型

Halo咯咯 ? 2132瀏覽 ? 0回復(fù)
剛剛，OpenAI 開(kāi)源了兩個(gè) Agent 項(xiàng)目，手搓 Manus 時(shí)代來(lái)襲

玄姐聊AGI ? 1833瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的兩個(gè)重難點(diǎn)之一，數(shù)據(jù)處理和模型設(shè)計(jì)

AI探索時(shí)代 ? 1219瀏覽 ? 0回復(fù)
【AI 界大地震】AMD 開(kāi)源 30 億參數(shù)大模型 Instella：性能碾壓同類，訓(xùn)練成本暴跌 80%？

Halo咯咯 ? 1241瀏覽 ? 0回復(fù)
AMD開(kāi)源30億小參數(shù)模型，媲美Qwen-2.5

Aceryt ? 1221瀏覽 ? 0回復(fù)
LawLLM：面向美國(guó)法律體系的法律大語(yǔ)言模型

AIRoobt ? 1098瀏覽 ? 0回復(fù)
港大&字節(jié)開(kāi)源GigaTok首次破解圖像重建與生成矛盾，30億參數(shù)登頂SOTA！

angel ? 1104瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦 6天前發(fā)布
字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.5 7天前發(fā)布

熱門推薦

微軟開(kāi)源DeepSeek-R1魔改版：響應(yīng)99%敏感提示，風(fēng)險(xiǎn)降50% 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

上一篇： OpenAI將在兩周內(nèi)發(fā)布“草莓”模型，推理模式非常特殊！

下一篇： Mistral開(kāi)源首個(gè)多模態(tài)大模型—Pixtral 12B

社區(qū)精華內(nèi)容

目錄