自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

英偉達股價暴跌！或與 Llama 3 發(fā)布有關？原創(chuàng)

開發(fā)者阿橙

發(fā)布于 2024-4-23 10:08

瀏覽

0收藏

Llama 3在Groq平臺運行速度超快

美國時間4月18日中午，Meta發(fā)布了Llama 3 大模型。該版本的模型經(jīng)過預訓練和指令微調(diào)，參數(shù)分別為 8B 和 70B，可支持廣泛的用例。Llama 3在行業(yè)基準測試中展示了最先進的性能，包括改進的推理能力。Meta在發(fā)布的文章中聲稱Llama 3是目前同類產(chǎn)品中最好的開源模型。

4月19日凌晨，也就是Llama 3 發(fā)布12小時后，AI芯片公司Groq 發(fā)布在其 LPU? 推理引擎上運行的 Llama 3 8B (8k) 和 70B (4k, 8k)，并通過 groq.com 和 GroqCloud? 控制臺提供給開發(fā)者社區(qū)。

“我比較了 Llama 3和 GPT-4，讓它們用 Python 編寫一個蛇形游戲，看看速度有何不同！” 計算機教授Alvaro Cintas用Groq運行Llama 3，并直觀地對比了Llama3和GPT-4的生成速度。

據(jù)OthersideAI創(chuàng)始人 Matt Shumer在X.com的發(fā)帖及其他幾位知名用戶的描述，Groq系統(tǒng)在運行LLaMA 3模型時的推理速度極快，超過800 token/秒（T/s）。

你也可以通過Groq官網(wǎng)免費親自測試一下：

??https://groq.com/??

隨后，根據(jù)Artificial Analysis的獨立基準測試，Groq在Llama 3 8B和Llama 3 70B上的吞吐量分別達到877 token/秒和284 token/秒，是所有供應商中最高的2倍多。Groq 的產(chǎn)品還具有成本競爭力，兩款機型的價格均低于其他供應商。結(jié)合 Llama 3 大模型的高質(zhì)量，Groq 的產(chǎn)品非常有吸引力。

英偉達股價暴跌！或與 Llama 3 發(fā)布有關？-AI.x社區(qū)

Groq的創(chuàng)新型AI芯片架構(gòu)

Groq，這家位于硅谷、資金雄厚的初創(chuàng)企業(yè)，正在開發(fā)一種全新的處理器架構(gòu)，專為深度學習中的矩陣乘法操作進行優(yōu)化。公司推出的Tensor Streaming Processor放棄了傳統(tǒng)CPU和GPU的緩存及復雜控制邏輯，轉(zhuǎn)而采用一種針對AI工作負載定制的簡化模式。

Groq的處理器架構(gòu)與Nvidia及其他主流芯片生產(chǎn)商的設計截然不同。Groq沒有選擇通用處理器適配AI的常規(guī)路徑，而是從零開始，專門開發(fā)了Tensor Streaming Processor以提升深度學習特有的計算模式。

英偉達股價暴跌！或與 Llama 3 發(fā)布有關？-AI.x社區(qū)

這種從零構(gòu)建的策略使Groq能夠剔除不必要的電路，并針對AI推理中常見的高度可并行和重復性工作負載優(yōu)化數(shù)據(jù)流。Groq聲稱，這樣做不僅大幅降低了運行大型神經(jīng)網(wǎng)絡的延遲和能耗，也減少了成本，與市場上的主流產(chǎn)品相比有了顯著改進。

AI推理的能效正受到越來越多的關注。由于數(shù)據(jù)中心已成為電力的大戶，大規(guī)模AI的計算需求可能會顯著增加電力消耗。在保持推理性能的同時最小化能源消耗的硬件開發(fā)，是實現(xiàn)大規(guī)模AI可持續(xù)發(fā)展的關鍵。Groq的Tensor Streaming Processor便是為此目的設計的。該處理器承諾能夠顯著降低運行大型神經(jīng)網(wǎng)絡的電力成本，相比傳統(tǒng)通用處理器顯示出顯著的優(yōu)勢。

Nvidia的霸主地位遭遇挑戰(zhàn)

4月19日，英偉達（Nvidia）股價暴跌10%，市值蒸發(fā)2117億美元，為美股史上第二大單日損失，幾乎跌掉一個AMD。

英偉達股價暴跌！或與 Llama 3 發(fā)布有關？-AI.x社區(qū)

Nvidia目前在AI處理器市場中占據(jù)領先地位，其A100和H100 GPU成為大多數(shù)云AI服務的核心動力。然而，Groq、Cerebras、SambaNova和Graphcore這些資金充裕的初創(chuàng)企業(yè)正通過專為AI設計的新型架構(gòu)挑戰(zhàn)Nvidia的主導地位。

在這些競爭者中，Groq表現(xiàn)尤為活躍，不僅關注于訓練領域，更在推理技術方面積極推廣。Meta最近發(fā)布的Llama 3，作為目前最先進的開源語言模型之一，為Groq提供了展示其硬件推斷性能的良機。Meta宣稱這一模型能夠與市場上最優(yōu)的閉源模型匹敵，預計將廣泛應用于基準測試和多種AI場景。

如果Groq的硬件在運行LLaMA 3時能顯著超越現(xiàn)有主流產(chǎn)品的速度和效率，不僅能驗證其技術優(yōu)勢，還可能加速其技術的廣泛應用。結(jié)合Llama等強大的開源模型和Groq這類高效推理硬件，可能會讓AI技術更具成本效益，從而更易于被更多企業(yè)和開發(fā)者采用。盡管如此，Nvidia并不會輕易放棄市場領先地位，其他競爭者也在緊追不舍。

當前競爭的焦點在于構(gòu)建能與AI模型的快速發(fā)展相匹配的基礎設施，并拓展技術以滿足日益增長的應用需求。近乎實時的AI推理和低成本實現(xiàn)，可能在電商、教育、金融、醫(yī)療等領域開啟革命性的新局面。

如X.com一位用戶所評價的基于Groq的Llama 3性能基準：“速度+低成本+高質(zhì)量=當前沒有理由選擇其他產(chǎn)品。”在新一代架構(gòu)挑戰(zhàn)傳統(tǒng)的浪潮中，AI的硬件基礎仍在不斷演進。

本文轉(zhuǎn)載自公眾號AIGC開發(fā)者，作者：阿橙AIGC

原文鏈接：??https://mp.weixin.qq.com/s/ZxDFIC0X9Es0O3RKfzSBkQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

已于2024-4-23 10:19:10修改

贊

收藏

回復

舉報

回復

相關推薦

CAN和Diffusion Transformer才是最佳拍檔(MIT&清華&英偉達)

angel ? 3483瀏覽 ? 0回復
新測試基準發(fā)布，最強開源Llama 3尷尬了

Crystalcxt ? 2954瀏覽 ? 0回復
Llama3背后的秘密：HuggingFace發(fā)布萬億級數(shù)據(jù)集Fineweb

AIGC最前線 ? 7745瀏覽 ? 0回復
英偉達開源大模型對齊框架—NeMo-Aligner

Aceryt ? 2748瀏覽 ? 0回復
Meta LlaMA 3模型深度解析

51CTO內(nèi)容精選 ? 3894瀏覽 ? 0回復
又來一個RAG：RankRAG，英偉達RAG新思路

大語言模型論文跟蹤 ? 2555瀏覽 ? 0回復
英偉達提出LATTE3D：大規(guī)模高質(zhì)量的Amortized文本到增強3D 合成

angel ? 2485瀏覽 ? 0回復
英偉達&斯坦福大學發(fā)布GRS：從真實世界觀測中生成機器人仿真任務

angel ? 2660瀏覽 ? 0回復
英偉達發(fā)布超強小模型，性能、速率、緩存全面超越Llama3.2！

51CTO技術棧 ? 1744瀏覽 ? 0回復
英偉達NVLM多模態(tài)大模型細節(jié)和數(shù)據(jù)集

大模型自然語言處理 ? 2234瀏覽 ? 0回復
博通連續(xù)30天暴漲，英偉達將遭平替？AMD優(yōu)勢不夠，英偉達卡生產(chǎn)過剩

51CTO技術棧 ? 2360瀏覽 ? 0回復
英偉達開源世界大模型，完美模擬物理世界！

Aceryt ? 2461瀏覽 ? 0回復
英偉達ECLAIR-端到端的文檔布局提取，并集成閱讀順序方法

大模型自然語言處理 ? 1628瀏覽 ? 0回復
英偉達發(fā)布天氣模型CorrDiff，預測效率大漲

Aceryt ? 1596瀏覽 ? 0回復
CVPR 2025 | 英偉達重塑自動駕駛場景生成！3D點云賦能電影級特效：GEN3C效果炸裂??！

angel ? 2061瀏覽 ? 0回復
英偉達全力發(fā)展AI Agent！開源專屬大模型，最強AI工廠

Aceryt ? 1305瀏覽 ? 0回復
英偉達開源通用機器人大模型—GR00T N1

Aceryt ? 1347瀏覽 ? 0回復
英偉達等發(fā)布VideoMage巧用"時空組合拳"

angel ? 885瀏覽 ? 0回復
英偉達押注Agent新基建！AI專屬搜索引擎問世

探索AGI ? 1146瀏覽 ? 0回復

開發(fā)者阿橙

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

用Python打造加密貨幣算法交易機器人 2024-09-13 12:54:05發(fā)布
用 Dify 和 Notion 打造輕量級金融數(shù)據(jù)庫 2024-09-04 14:05:24發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：超越GPT-4！最強大模型 Claude 3 完全解讀

下一篇：炒股利器！用Python大模型篩選低估值股票

社區(qū)精華內(nèi)容

目錄

<sub id="rg38y"></sub>