自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<li id="xvpkr"></li>

<output id="xvpkr"><center id="xvpkr"></center></output>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

一大堆Llama3.1-Chinese正在襲來精華

發(fā)布于 2024-8-1 14:19

瀏覽

0收藏

寫在前面

Llama3.1模型已經(jīng)開源，在這短短幾天之內(nèi)，也是出現(xiàn)了一些Llama3.1漢化的repo，開源社區(qū)也是相當?shù)木怼?/p>

主要是Llama3.1沒有關注中文，雖然是多語言，但主要針對英語、法語、德語、印地語、意大利語、葡萄牙語、西班牙語和泰語。

雖然讓Llama3.1系列模型用中文回答時，也可以正?；卮?，但仍然有中英文混合現(xiàn)象，并且詞表是真沒中文呀，中文場景下解碼效率會比較低。

咋說呢？反正也給中文大模型更多機會吧，開源社區(qū)也有更多事情可以做。

對Llama3.1進行中文增強，當然還是那幾步：擴充中文詞表、中文數(shù)據(jù)continue-pretrain、中文sft。

下面先簡單過一下Llama3.1的一些介紹和效果，再給大家分享一些已經(jīng)開源的Chinese-Llama3.1項目。

Llama3.1介紹和效果

前幾天關于Llama3.1的介紹其實一大堆了，我就不過的介紹了，可以看我之前分享的兩篇文章Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時代將迎來結(jié)束？和淺談Llama3.1，從結(jié)構(gòu)、訓練過程、影響到數(shù)據(jù)合成。

對于Llama3.1的系列模型，現(xiàn)在很多平臺都已經(jīng)支持，如果本地沒有資源部署，可以從這些平臺上測試。下面的測試截圖均來自Hugging Chat測試結(jié)果。

HF：https://huggingface.co/chat/

雖然Llama3.1-405B模型榜單效果有很秀，但是9.9和9.11誰的大也是一本正經(jīng)的的胡說八道。

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

不過確實是Tokenizer的問題。

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

其實對于個人來說比較奇怪，之前一些模型其實都強調(diào)過，數(shù)字內(nèi)容按照每個單獨數(shù)字切割，不知道為啥Llama3.1沒有采用該策略。

反正GPT4也是一樣。

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

下面兩個弱智吧的問題，考考Llama3.1（405B）,

石油也是油，為啥沒人用它來炒菜？

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

如果把臟話都說出來了，那么嘴是不是就干凈了

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

為什么孫悟空是中國猴子卻叫美猴王，不應該叫中猴王嗎？

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

下雨天關節(jié)疼那我騙它是晴天不就不會疼了。

一大堆Llama3.1-Chinese正在襲來-AI.x社區(qū)

整體來說，還是比較不錯的，可以理解其中的含義，不過如果不強調(diào)中文回答，總是出現(xiàn)中英混雜的情況。

個人覺得，如果是公開、簡單的中文任務，Llama3.1還是可以直接使用的，但如果是比較領域、具化的場景，可能效果不會很好。

本人在自己的一個中文分類場景上，比較過Qwen2-7B、ChatGLM3-6B和Llama3.1-8B的效果，無論是否SFT，Llama3.1-8B在中文上的效果都要比另外兩個差。

PS：個人數(shù)據(jù)結(jié)果，不是絕對，可以自行嘗試，同時也歡迎留言討論。

Chinese-Llama3.1模型

下面放幾個已經(jīng)開源權重的Chinese-Llama3.1，這才兩天，后面會越來越多，現(xiàn)在還有一些repo在占坑。

shenzhi-wang/Llama3.1-8B-Chinese-Chat
shenzhi-wang/Llama3.1-70B-Chinese-Chat
haijian06/Llama3.1-Chinese-Chat
shareAI/llama3.1-8b-instruct-dpo-zh

但現(xiàn)在還是已SFT為主，在等等會有更多Chinese-Llama3.1系列模型出現(xiàn)，畢竟之前Chinese-Llama3已經(jīng)有很多模型啦。

騙Star的機會又來啦?。?！

寫在最后

Llama3.1系列模型的開源意義真是蠻大的，405B證明開源也能追該上閉源，雖然Mistral新開源的123B模型狙擊了Llama3.1-405B，但只能說開源真實原來越好了。

但是從真實使用角度來說，還是8B、70B的模型作用更直接，畢竟很多大模型真正落地上線的規(guī)模也就8B，要不然并發(fā)起來真耗不起。

那么有一個不成熟的想法，是否更大的開源模型利于哪些搞大模型AI平臺的廠商，因為自己有一套infra優(yōu)化機制，專注推理，又有卡，為更多企業(yè)提供服務。而小模型才是企業(yè)可以自己玩耍的，服務器不用推太多，開源推理框架就夠用了。

最后，小扎的格局要打開呀，Mistral-123B都支持中文呦！

本文轉(zhuǎn)載自 ??NLP工作站??，作者：劉聰NLP

標簽

贊

收藏

回復

舉報

回復

相關推薦

LangChain v0.2：向穩(wěn)定性邁進的一大步

ermulong ? 3486瀏覽 ? 0回復
一大堆Chinese Llama3正在襲來

NLP工作站 ? 2514瀏覽 ? 0回復
【創(chuàng)新一夏學習季】熱浪升溫，創(chuàng)新一夏，釋放開發(fā)潛能

AI.x社區(qū)官方賬號 ? 52.8w瀏覽 ? 39回復
Llama 3.1磁力鏈提前泄露！開源模型王座一夜易主，GPT-4o被超越

duhorse ? 2021瀏覽 ? 0回復
最強模型Llama 3.1 405B正式發(fā)布，扎克伯格：開源引領新時代

輕薄滴假象 ? 2202瀏覽 ? 0回復
最強大模型 Llama 3.1-405B 架構(gòu)設計剖析

玄姐聊AGI ? 2850瀏覽 ? 0回復
解析Llama 3.1 與Meta 的 AI 戰(zhàn)略，以及新的開放前沿模型生態(tài)系統(tǒng)

lintoms ? 2234瀏覽 ? 0回復
基于Llama 3.1和一臺MacBook搭建商用級知識庫

玄姐聊AGI ? 2687瀏覽 ? 0回復
AI界的新寵：揭秘Llama 3.1如何革新AI合成技術

ermulong ? 2159瀏覽 ? 0回復
微軟開源Phi-3.5：支持手機、平板電腦，性能超Llama 3.1

Aceryt ? 2136瀏覽 ? 0回復
ViT篇外：NVIDIA Llama-3.1-Minitron 4B

魯班模錘1 ? 2258瀏覽 ? 0回復
阿里史上最大規(guī)模開源發(fā)布，超GPT-4o 、Llama-3.1！

Aceryt ? 2085瀏覽 ? 0回復
從 Llama 1 到 3.1：Llama 模型架構(gòu)演進詳解

Baihai_IDP ? 3905瀏覽 ? 0回復
Llama 3.1 70B AQLM-PV版發(fā)布！大模型壓縮后可在24GB顯存GPU上本地運行?。?/a>

老蛀蟲 ? 2435瀏覽 ? 0回復
使用LLaMA 3.1、Firebase和Node.js，構(gòu)建一個音控的智能廚房應用程序

51CTO內(nèi)容精選 ? 1825瀏覽 ? 0回復
Dolphin 3.0 發(fā)布（Llama 3.1 + 3.2 + Qwen 2.5）：本地優(yōu)先、可操縱的 AI 模型

Halo咯咯 ? 2033瀏覽 ? 0回復
Good Fire AI 針對 Llama 3.1 8B 和 Llama 3.3 70B 的開源稀疏自動編碼器 (SAE)

Halo咯咯 ? 1585瀏覽 ? 0回復
NVIDIA開源Llama-3.1-Nemotron-Ultra-253B-v1，性能直逼DeepSeek

Halo咯咯 ? 968瀏覽 ? 0回復
谷歌的“雙子星”，正在圍剿一眾大模型

51CTO技術棧 ? 894瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

LLM實戰(zhàn)系列 | 大模型的多Lora部署，將顯存節(jié)省到極致 8天前發(fā)布
Llama4 模型細節(jié) & 效果實測 2025-04-09 07:07:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇： Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時代將迎來結(jié)束？

下一篇：淺談—領域模型訓練

社區(qū)精華內(nèi)容

目錄

<legend id="ozru1"><track id="ozru1"></track></legend>

<cite id="ozru1"></cite>