自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

斯坦福學(xué)者推出專為Android移動(dòng)設(shè)備打造的大模型,開源!

發(fā)布于 2024-4-11 11:23
瀏覽
0收藏

Octopus-V2-2B是一個(gè)具有20億參數(shù)的先進(jìn)開源語言模型,代表著Nexa AI在大型語言模型(LLMs)在函數(shù)調(diào)用方面的研究突破,特別針對(duì)Android API進(jìn)行了定制。與需要潛在函數(shù)參數(shù)的詳細(xì)描述(有時(shí)需要多達(dá)數(shù)萬個(gè)輸入標(biāo)記)的檢索增強(qiáng)生成(RAG)方法不同,Octopus-V2-2B在其訓(xùn)練和推理階段都引入了獨(dú)特的功能token策略。這種方法不僅使其能夠達(dá)到與GPT-4可比較的性能水平,而且還顯著提高了其推理速度,超越了基于RAG的方法,使其在邊緣計(jì)算設(shè)備上尤為有益

?? 在設(shè)備上的應(yīng)用:Octopus-V2-2B被設(shè)計(jì)成能夠在Android設(shè)備上無縫運(yùn)行,擴(kuò)展了其在從Android系統(tǒng)管理到多設(shè)備編排等各種應(yīng)用中的效用,展示了其適應(yīng)性和在設(shè)備上集成的潛力。

?? 推理速度:在基準(zhǔn)測(cè)試中,章魚-V2-2B展示了出色的推理速度,在單個(gè)A100 GPU上表現(xiàn)比“Llama7B + RAG解決方案”組合快出36倍。此外,與依賴于集群A100/H100 GPU的GPT-4-turbo(gpt-4-0125-preview)相比,Octopus-V2-2B快168%。這種效率歸因于獨(dú)特的功能token設(shè)計(jì)。

?? 準(zhǔn)確性:Octopus-V2-2B不僅在速度上表現(xiàn)出色,而且在準(zhǔn)確性上也表現(xiàn)出色,其函數(shù)調(diào)用準(zhǔn)確性超過了“Llama7B + RAG解決方案”31%。它實(shí)現(xiàn)了與GPT-4和RAG + GPT-3.5相媲美的函數(shù)調(diào)用準(zhǔn)確性,在基準(zhǔn)數(shù)據(jù)集上得分在98%至100%之間。

?? 函數(shù)調(diào)用能力:章魚-V2-2B能夠在各種復(fù)雜場(chǎng)景中生成單個(gè)、嵌套和并行函數(shù)調(diào)用。

使用示例

斯坦福學(xué)者推出專為Android移動(dòng)設(shè)備打造的大模型,開源!-AI.x社區(qū)

評(píng)測(cè)結(jié)果

斯坦福學(xué)者推出專為Android移動(dòng)設(shè)備打造的大模型,開源!-AI.x社區(qū)

斯坦福學(xué)者推出專為Android移動(dòng)設(shè)備打造的大模型,開源!-AI.x社區(qū)


論文:??https://arxiv.org/pdf/2404.01744.pdf??

模型地址:??https://huggingface.co/NexaAIDev/Octopus-v2??

譯自(有刪改):https://huggingface.co/NexaAIDev/Octopus-v2


本文轉(zhuǎn)載自公眾號(hào)AIGC最前線 

原文鏈接:??https://mp.weixin.qq.com/s/Xob5ILvaMF2_4f6_X94aqA??


標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦