自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

五分鐘本地部署史上最強(qiáng)開(kāi)源大模型Llama3

開(kāi)源
Llama3的最小版本8B和70B已經(jīng)全面領(lǐng)先其他競(jìng)爭(zhēng)對(duì)手的開(kāi)源大模型。其中70B的模型相當(dāng)于GPT-4的水平,其中8B和70B都可以在個(gè)人PC上跑起來(lái),8B就是80億參數(shù)的模型只需要8G+的顯存就可以流暢跑起來(lái),70B就是700億參數(shù)的模型雖然宣稱需要40G+的顯存,經(jīng)測(cè)試在個(gè)人電腦的16G的顯存上也可以跑起來(lái),就是吐字速度慢些。?

幾天前meta發(fā)布了史上最強(qiáng)開(kāi)源大模型Llama3,要想免費(fèi)使用Llama3,除了去官網(wǎng) https://llama.meta.com/llama3/  在線使用外,還可以本地部署。

本地部署有多種方式,常見(jiàn)的有如下3種方式:

1. github倉(cāng)庫(kù)clone后,https://github.com/meta-llama/llama3   安裝python,pip相關(guān)的包,官網(wǎng)在線填寫個(gè)人信息申請(qǐng)模型下載鏈接

2. LL-studio

3. ollama

其中以ollama部署最為便捷和友好,部署時(shí)間可在5分鐘內(nèi)完成。本篇就介紹ollama本地部署llama3模型。

step1:ollama官網(wǎng)(https://ollama.com/download)下載ollama,有mac,windows,linux三個(gè)版本,選擇適合自己機(jī)器的版本下載并安裝。

圖片圖片

step2:命令行執(zhí)行ollama run llama3 (默認(rèn)是下載8b的模型,若要下載40b的,執(zhí)行 ollama run llama3:70b)

圖片圖片

Llama3的最小版本8B和70B已經(jīng)全面領(lǐng)先其他競(jìng)爭(zhēng)對(duì)手的開(kāi)源大模型。其中70B的模型相當(dāng)于GPT-4的水平,其中8B和70B都可以在個(gè)人PC上跑起來(lái),8B就是80億參數(shù)的模型只需要8G+的顯存就可以流暢跑起來(lái),70B就是700億參數(shù)的模型雖然宣稱需要40G+的顯存,經(jīng)測(cè)試在個(gè)人電腦的16G的顯存上也可以跑起來(lái),就是吐字速度慢些。

模型下載完成后就進(jìn)入命令行交互界面,這時(shí)候就可以和llama3聊天了。

step3(可選):命令行交互畢竟沒(méi)有圖形化界面友好,可以任選一個(gè)界面。目前市面上的界面多如牛毛,這里以開(kāi)源軟件chatbox為例,https://github.com/Bin-Huang/chatbox/releases

下載安裝后,進(jìn)入設(shè)置,配置使用本地ollama的llama3模型,之后就可以愉快的聊天了。

圖片圖片

除了通過(guò)圖形化界面和Llama3聊天外,還可以自己編程調(diào)用Llama3 的rest api,自動(dòng)化讓AI完成很多本地工作。

調(diào)用llama3 rest api,參考官網(wǎng)說(shuō)明:https://github.com/ollama/ollama/blob/main/docs/api.md

curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [
    {
      "role": "user",
      "content": "why is the sky blue?"
    }
  ],
  "stream": false
}'

圖片 圖片

責(zé)任編輯:武曉燕 來(lái)源: 后端云
相關(guān)推薦

2024-04-26 07:48:45

DockerLLama3模型

2024-04-23 07:00:00

2020-10-26 08:28:29

路由協(xié)議路由器網(wǎng)絡(luò)

2022-12-16 09:55:50

網(wǎng)絡(luò)架構(gòu)OSI

2024-05-27 09:00:00

2023-08-29 07:02:09

3D

2023-07-31 11:37:05

經(jīng)營(yíng)分析模型

2024-07-16 09:41:01

2025-04-24 08:20:00

C#Llama3人工智能

2023-08-06 07:00:59

Openstack網(wǎng)絡(luò)

2024-02-22 10:09:00

開(kāi)源模型

2020-03-06 10:45:48

機(jī)器學(xué)習(xí)人工智能神經(jīng)網(wǎng)絡(luò)

2020-06-16 08:47:53

磁盤

2009-11-16 10:53:30

Oracle Hint

2024-12-11 07:00:00

面向?qū)ο?/a>代碼

2025-03-13 06:22:59

2021-01-27 08:03:53

項(xiàng)目Web外網(wǎng)

2021-03-03 16:33:24

web項(xiàng)目外網(wǎng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)