自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

谷歌最新開源的 Gemma 模型,秒殺 Llma-2!

人工智能
本文介紹了 3 種方式來體驗谷歌最新的 Gemma 開源模型,感興趣的小伙伴,可以體驗一下該模型的效果。

Gemma 是什么

Gemma 是一個輕量級、最先進的開放式模型系列,采用了與創(chuàng)建 Gemini 模型相同的研究和技術(shù)。Gemma 由 Google DeepMind 和 Google 的其他團隊共同開發(fā),其靈感來源于雙子座,名字反映了拉丁語 gemma,意為 "寶石"。在發(fā)布模型權(quán)重的同時,谷歌還將發(fā)布相關(guān)工具,以支持開發(fā)人員創(chuàng)新、促進協(xié)作,并指導(dǎo)負(fù)責(zé)任地使用 Gemma 模型。

以下是需要了解的關(guān)鍵細(xì)節(jié):

  • 兩種尺寸的模型權(quán)重:Gemma 2B 和 Gemma 7B。每種尺寸都發(fā)布了預(yù)訓(xùn)練和指令調(diào)整變體。
  • 新的 “Responsible Generative AI Toolkit” 為使用 Gemma 創(chuàng)建更安全的人工智能應(yīng)用提供了指導(dǎo)和基本工具。
  • 為所有主要框架的推理和監(jiān)督微調(diào)(SFT)提供了工具鏈:JAX、PyTorch 和 TensorFlow,以及本地 Keras 3.0。
  • 現(xiàn)成可用的 Colab 和 Kaggle 筆記本,以及與 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成,使 Gemma 的上手非常容易。
  • 經(jīng)過預(yù)訓(xùn)練和指令調(diào)整的 Gemma 模型可在你的筆記本電腦、工作站或谷歌云上運行,并可在 Vertex AI 和谷歌 Kubernetes Engine (GKE) 上輕松部署。
  • 跨多個人工智能硬件平臺的優(yōu)化確保了行業(yè)領(lǐng)先的性能,包括英偉達?(NVIDIA?)GPU 和谷歌云 TPU。
  • 使用條款允許負(fù)責(zé)任的商業(yè)使用和傳播。

Gemma 模型與 Gemini 共享技術(shù)和基礎(chǔ)設(shè)施組件,而 Gemini 是目前市場上最大、功能最強的人工智能模型。這使得 Gemma 2B 和 7B 與其他開放模型相比,在其規(guī)模上實現(xiàn)了同類最佳的性能。而且,Gemma 模型能夠直接在開發(fā)人員的筆記本電腦或臺式電腦上運行。值得注意的是,Gemma 在關(guān)鍵基準(zhǔn)上超過了更大的模型,同時還符合嚴(yán)格的安全和負(fù)責(zé)任的輸出標(biāo)準(zhǔn)。

由上圖的測評數(shù)據(jù)來看,Gemma 7B 模型的能力,已經(jīng)秒殺同級的 Llma-2 7B,而且還完全超越 Llama-2 13B。接下來,本文將介紹如何快速體驗最新的 Gemma 模型。

Ollama 運行 Gemma

首先,先確保你電腦已經(jīng)安裝 ollama[1],如果還沒安裝的話,可以參考 “部署本地的大語言模型,只需幾分鐘!” 這篇文章。

成功安裝 ollama 之后,可以在命令行輸入以下命令來運行 Gemma 2b 或 Gemma 7b 模型:

ollama run gemma:2b
# Or
ollama run gemma:7b

運行該命令后,會自動下載 Gemma 2B 或 Gemma 7B 模型。如果你的電腦擁有足夠的內(nèi)存,可以使用以下命令安裝非量化的版本,即使用精度更高的版本,以體驗更好效果:

ollama run gemma:2b-instruct-fp16
# Or
ollama run gemma:7b-instruct-fp16

除了 ollama 之外,你也可以通過 llama.cpp[2]  gemma.cpp[3] 來體驗 gemma。

llama.cpp 運行 Gemma

來源:https://github.com/ggerganov/llama.cpp/pull/5631

gemma.cpp 運行 Gemma

來源:https://github.com/google/gemma.cpp

本文介紹了 3 種方式來體驗谷歌最新的 Gemma 開源模型,感興趣的小伙伴,可以體驗一下該模型的效果。

參考資料

[1]ollama: https://ollama.com/

[2]llama.cpp: https://github.com/ggerganov/llama.cpp

[3]gemma.cpp: https://github.com/google/gemma.cpp


責(zé)任編輯:姜華 來源: 全棧修仙之路
相關(guān)推薦

2023-03-24 09:17:04

微服務(wù)架構(gòu)谷歌

2024-02-22 07:44:02

2024-02-28 12:34:11

AI訓(xùn)練

2024-04-07 11:44:53

MagistralaIoT物聯(lián)網(wǎng)平臺

2012-08-30 11:25:45

開源平臺谷歌Drill

2024-02-22 10:09:00

開源模型

2024-02-22 16:19:20

2024-04-19 07:55:57

Llama 3模型人工智能開源

2025-03-04 09:00:00

2019-12-26 15:31:17

騰訊框架開源

2022-08-25 14:12:15

Python對象池

2024-06-28 13:42:07

2024-03-04 00:00:00

GemmaAI模型

2025-01-21 11:53:53

2025-03-13 07:30:00

谷歌Gemma 3AI 模型

2023-09-11 15:57:16

人工智能模型GPT-4

2021-04-13 14:39:08

谷歌Logica語言

2024-03-12 09:29:21

2018-04-30 18:07:51

谷歌開源編程

2024-02-22 17:19:26

谷歌模型PC
點贊
收藏

51CTO技術(shù)棧公眾號