自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k

輕薄滴假象

發(fā)布于 2024-4-7 14:11

瀏覽

0收藏

在大模型落地應(yīng)用的過程中，端側(cè) AI 是非常重要的一個方向。

近日，斯坦福大學(xué)研究人員推出的 Octopus v2 火了，受到了開發(fā)者社區(qū)的極大關(guān)注，模型一夜下載量超 2k。

20 億參數(shù)的 Octopus v2 可以在智能手機(jī)、汽車、個人電腦等端側(cè)運行，在準(zhǔn)確性和延遲方面超越了 GPT-4，并將上下文長度減少了 95%。此外，Octopus v2 比 Llama7B + RAG 方案快 36 倍。

不少網(wǎng)友感嘆：設(shè)備端 AI 智能體的時代到來了！

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k-AI.x社區(qū)

論文：Octopus v2: On-device language model for super agent
論文地址：https://arxiv.org/abs/2404.01744
模型主頁：https://huggingface.co/NexaAIDev/Octopus-v2

模型概述

Octopus-V2-2B 是一個擁有 20 億參數(shù)的開源語言模型，專為 Android API 量身定制，旨在在 Android 設(shè)備上無縫運行，并將實用性擴(kuò)展到從 Android 系統(tǒng)管理到多個設(shè)備的編排等各種應(yīng)用程序。

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k-AI.x社區(qū)

通常，檢索增強(qiáng)生成 (RAG) 方法需要對潛在函數(shù)參數(shù)進(jìn)行詳細(xì)描述（有時需要多達(dá)數(shù)萬個輸入 token）?；诖耍琌ctopus-V2-2B 在訓(xùn)練和推理階段引入了獨特的函數(shù) token 策略，不僅使其能夠達(dá)到與 GPT-4 相當(dāng)?shù)男阅芩剑疫€顯著提高了推理速度，超越了基于 RAG 的方法，這使得它對邊緣計算設(shè)備特別有利。

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k-AI.x社區(qū)

Octopus-V2-2B 能夠在各種復(fù)雜場景中生成單獨的、嵌套的和并行的函數(shù)調(diào)用。

數(shù)據(jù)集

為了訓(xùn)練、驗證和測試階段采用高質(zhì)量數(shù)據(jù)集，特別是實現(xiàn)高效訓(xùn)練，研究團(tuán)隊用三個關(guān)鍵階段創(chuàng)建數(shù)據(jù)集：

生成相關(guān)的查詢及其關(guān)聯(lián)的函數(shù)調(diào)用參數(shù)；
由適當(dāng)?shù)暮瘮?shù)組件生成不相關(guān)的查詢；
通過 Google Gemini 實現(xiàn)二進(jìn)制驗證支持。

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k-AI.x社區(qū)

研究團(tuán)隊編寫了 20 個 Android API 描述，用于訓(xùn)練模型。下面是一個 Android API 描述示例：

def get_trending_news (category=None, reginotallow='US', language='en', max_results=5):


    """


    Fetches trending news articles based on category, region, and language.


    Parameters:


    - category (str, optional): News category to filter by, by default use None for all categories. Optional to provide.


    - region (str, optional): ISO 3166-1 alpha-2 country code for region-specific news, by default, uses 'US'. Optional to provide.


    - language (str, optional): ISO 639-1 language code for article language, by default uses 'en'. Optional to provide.


    - max_results (int, optional): Maximum number of articles to return, by default, uses 5. Optional to provide.


    Returns:


    - list [str]: A list of strings, each representing an article. Each string contains the article's heading and URL.


    """

模型開發(fā)與訓(xùn)練

該研究采用 Google Gemma-2B 模型作為框架中的預(yù)訓(xùn)練模型，并采用兩種不同的訓(xùn)練方法：完整模型訓(xùn)練和 LoRA 模型訓(xùn)練。

在完整模型訓(xùn)練中，該研究使用 AdamW 優(yōu)化器，學(xué)習(xí)率設(shè)置為 5e-5，warm-up 的 step 數(shù)設(shè)置為 10，采用線性學(xué)習(xí)率調(diào)度器。

LoRA 模型訓(xùn)練采用與完整模型訓(xùn)練相同的優(yōu)化器和學(xué)習(xí)率配置，LoRA rank 設(shè)置為 16，并將 LoRA 應(yīng)用于以下模塊：q_proj、k_proj、v_proj、o_proj、up_proj、down_proj。其中，LoRA alpha 參數(shù)設(shè)置為 32。

對于兩種訓(xùn)練方法，epoch 數(shù)均設(shè)置為 3。

使用以下代碼，就可以在單個 GPU 上運行 Octopus-V2-2B 模型。

from transformers import AutoTokenizer, GemmaForCausalLMimport torchimport time


def inference (input_text):


    start_time = time.time ()


    input_ids = tokenizer (input_text, return_tensors="pt").to (model.device)


    input_length = input_ids ["input_ids"].shape [1]


    outputs = model.generate (


        input_ids=input_ids ["input_ids"], 


        max_length=1024,


        do_sample=False)


    generated_sequence = outputs [:, input_length:].tolist ()


    res = tokenizer.decode (generated_sequence [0])


    end_time = time.time ()


    return {"output": res, "latency": end_time - start_time}


model_id = "NexaAIDev/Octopus-v2"


tokenizer = AutoTokenizer.from_pretrained (model_id)


model = GemmaForCausalLM.from_pretrained (


    model_id, torch_dtype=torch.bfloat16, device_map="auto"


)


input_text = "Take a selfie for me with front camera"


nexa_query = f"Below is the query from the users, please call the correct function and generate the parameters to call the function.\n\nQuery: {input_text} \n\nResponse:"


start_time = time.time () print ("nexa model result:\n", inference (nexa_query)) print ("latency:", time.time () - start_time,"s")

評估

Octopus-V2-2B 在基準(zhǔn)測試中表現(xiàn)出卓越的推理速度，在單個 A100 GPU 上比「Llama7B + RAG 解決方案」快 36 倍。此外，與依賴集群 A100/H100 GPU 的 GPT-4-turbo 相比，Octopus-V2-2B 速度提高了 168%。這種效率突破歸功于 Octopus-V2-2B 的函數(shù)性 token 設(shè)計。

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k-AI.x社區(qū)

Octopus-V2-2B 不僅在速度上表現(xiàn)出色，在準(zhǔn)確率上也表現(xiàn)出色，在函數(shù)調(diào)用準(zhǔn)確率上超越「Llama7B + RAG 方案」31%。Octopus-V2-2B 實現(xiàn)了與 GPT-4 和 RAG + GPT-3.5 相當(dāng)?shù)暮瘮?shù)調(diào)用準(zhǔn)確率。

超越GPT-4，斯坦福團(tuán)隊手機(jī)可跑的大模型火了，一夜下載量超2k-AI.x社區(qū)

感興趣的讀者可以閱讀論文原文，了解更多研究內(nèi)容。

本文轉(zhuǎn)自機(jī)器之心，作者：機(jī)器之心

原文鏈接:??https://mp.weixin.qq.com/s/qnFZOPLpdRxW42_cLUcImA??

標(biāo)簽

斯坦福大模型

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

長文本之罪：Claude團(tuán)隊新越獄技術(shù)，Llama 2到GPT-4無一幸免

輕薄滴假象 ? 3152瀏覽 ? 0回復(fù)
超越GPT-4！最強(qiáng)大模型 Claude 3 完全解讀

開發(fā)者阿橙 ? 5727瀏覽 ? 0回復(fù)
斯坦福學(xué)者推出專為Android移動設(shè)備打造的大模型，開源！

AIGC最前線 ? 2.5w瀏覽 ? 0回復(fù)
與OpenAI的Q*道殊同歸？斯坦福團(tuán)隊發(fā)現(xiàn)語言模型的新路徑為Q函數(shù)

xuxiangda ? 3188瀏覽 ? 0回復(fù)
蘋果推出理解、轉(zhuǎn)化模型ReALM，性能超GPT-4

Aceryt ? 2581瀏覽 ? 0回復(fù)
奧特曼承認(rèn)了神秘gpt2！哈佛MIT巡演繼續(xù)，斯坦福演講完整版公開

Crystalcxt ? 2256瀏覽 ? 0回復(fù)
AlphaGo核心算法增強(qiáng)，7B模型數(shù)學(xué)能力直逼GPT-4，阿里大模型新研究火了

Crystalcxt ? 2738瀏覽 ? 0回復(fù)
斯坦福新研究：RAG能幫助LLM更靠譜嗎？

duhorse ? 2313瀏覽 ? 0回復(fù)
超越GPT-4o，Claude 3.5一夜封王！10倍編碼速度逆天，全網(wǎng)最全實測來了

duhorse ? 3942瀏覽 ? 0回復(fù)
中國AI大模型論文數(shù)量全球第一，清華力壓麻省理工、斯坦福

Aceryt ? 2436瀏覽 ? 0回復(fù)
開源模型王座一夜易主，GPT-4o被超越

duhorse ? 2009瀏覽 ? 0回復(fù)
快手可靈團(tuán)隊最新開源項目火了：大叔實時變身少女，GitHub狂攬7.5K星

Crystalcxt ? 2527瀏覽 ? 0回復(fù)
超越GPT-4！香港科技大學(xué)破解Transformer算術(shù)難題，乘法準(zhǔn)確率超99.9%

AI論文解讀 ? 2240瀏覽 ? 0回復(fù)
斯坦福、Salesforce等開源1萬億tokens多模態(tài)數(shù)據(jù)集

Aceryt ? 2021瀏覽 ? 0回復(fù)
超越GPT-4！LoRA技術(shù)引領(lǐng)大型語言模型新革命

AI論文解讀 ? 2856瀏覽 ? 0回復(fù)
谷歌&卡內(nèi)基梅隆&斯坦福發(fā)布Gen2Act：泛化超棒！

angel ? 1988瀏覽 ? 0回復(fù)
開源大模型如何治理？斯坦福基礎(chǔ)模型研究中心給您支招

AIGC最前線 ? 2633瀏覽 ? 0回復(fù)
Meta AI眼鏡銷量破百萬，應(yīng)用下載量激增200%！羅永浩再次入局AI…風(fēng)口真的來了嗎？

51CTO技術(shù)棧 ? 1959瀏覽 ? 0回復(fù)
谷歌開源A2A，一夜改變智能體交互

Aceryt ? 1138瀏覽 ? 0回復(fù)

輕薄滴假象

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek一口氣開源3個項目，還有梁文鋒親自參與，昨晚API大降價 2025-02-27 12:40:06發(fā)布
全球首個AI CUDA工程師來了！將PyTorch原生實現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：谷歌DeepMind發(fā)布Gecko：專攻檢索，與大7倍模型相抗衡

下一篇：多模態(tài)大模型有了統(tǒng)一分割框架，華科PSALM多任務(wù)登頂，模型代碼全開源

社區(qū)精華內(nèi)容

目錄

<cite id="buelh"><track id="buelh"></track></cite>

<tr id="buelh"><menuitem id="buelh"></menuitem></tr>