自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="90gwj"><i id="90gwj"><tr id="90gwj"></tr></i></blockquote>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

除了ChatGPT，還有14個(gè)你不可不知的大模型

2023-07-06 14:08:54

人工智能自然語言處理

以下是14個(gè)非ChatGPT的大型語言模型示例。它們可能適合您的項(xiàng)目，也可能不適合。了解真相的唯一方法就是向它們發(fā)送提示并仔細(xì)評(píng)估結(jié)果。

許多老板將人工智能視為未來，許多技術(shù)領(lǐng)導(dǎo)者將ChatGPT視為人工智能的代名詞。但ChatGPT并非唯一的大型語言模型，對(duì)于某些軟件項(xiàng)目或領(lǐng)域而言，它甚至可能不是最佳選擇。新的競爭對(duì)手幾乎每天都在涌現(xiàn)，看起來每一個(gè)都想成為下一代人工智能工具。

某些模型是否比其他模型更好？或許是的。但所有這些模型都有缺陷或弱點(diǎn)，在使用過程中會(huì)逐漸發(fā)現(xiàn)這些弱點(diǎn)。生成式人工智能乍看起來令人驚嘆，但隨著時(shí)間推移，它難以預(yù)測的一面會(huì)開始顯現(xiàn)出來。

語言模型基準(zhǔn)測試

受模型的范圍和使用方式的影響，科學(xué)地衡量生成式人工智能的回答質(zhì)量很困難。數(shù)據(jù)科學(xué)家可以輸入成千上萬甚至數(shù)百萬個(gè)測試問題并評(píng)估回答，但如果測試集只關(guān)注一種類型的問題，那評(píng)估結(jié)果的準(zhǔn)確性也是受限的。也就是說，查閱類似Hugging Face的Open LLM Leaderboard這樣的資源是有趣的，但未必準(zhǔn)確。

盡管找到一種精確的方式來評(píng)估LLM（大型語言模型）的難度很大，但至少在它們之間進(jìn)行切換現(xiàn)在并不困難了。像OpenLLM或FastChat等項(xiàng)目使得在不同的API和接口之間連接各種模型變得更簡單。您可以將這些模型拼接在一起，有時(shí)甚至可以并行運(yùn)行這些模型。

不能忽視的重要問題是成本。雖然每個(gè)研發(fā)團(tuán)隊(duì)都享受著關(guān)注和投資的激增，但構(gòu)建一個(gè)大型語言模型可能需要幾個(gè)月甚至幾年的時(shí)間。團(tuán)隊(duì)首先組合訓(xùn)練數(shù)據(jù)，然后通過高耗能硬件進(jìn)行數(shù)據(jù)處理。最后，他們生成模型。如何將這項(xiàng)工作變現(xiàn)并持續(xù)發(fā)展是一個(gè)不斷演變的問題。

一些組織正在嘗試將結(jié)果開源化，而其他人則愉快地依賴于具有自己計(jì)費(fèi)模型的服務(wù)。開源LLM可以是一份真正的禮物，但前提是您能夠處理部署模型和保持其運(yùn)行所需的工作。

以下是14個(gè)非ChatGPT的大型語言模型示例。它們可能適合您的項(xiàng)目，也可能不適合。了解真相的唯一方法就是向它們發(fā)送提示并仔細(xì)評(píng)估結(jié)果。

Llama

這是一個(gè)基礎(chǔ)的LLM，由Facebook（現(xiàn)在的Meta）創(chuàng)建，并將其作為其所宣稱的”對(duì)開放科學(xué)的承諾“的一部分而發(fā)布出來。任何人都可以下載Llama并將其作為創(chuàng)建更精細(xì)調(diào)整模型的基礎(chǔ)，用于特定應(yīng)用程序（Alpaca和Vicuna都是基于Llama構(gòu)建的）。該模型還提供四種不同規(guī)模的版本。較小的版本只有70億個(gè)參數(shù)，已經(jīng)在意想不到的地方使用。甚至有一位開發(fā)者聲稱已經(jīng)使用只有4GB RAM的Llama在Raspberry Pi上運(yùn)行。

Alpaca

一些斯坦福大學(xué)的研究人員使用Meta的Llama 7B，并將其訓(xùn)練成了一組與ChatGPT等指令遵循模型相似的提示。這個(gè)微調(diào)過程產(chǎn)生了Alpaca 7B，這個(gè)模型讓普通人也可以通過提問和給予指示來獲取Llama LLM中編碼的知識(shí)。據(jù)估計(jì)，這種輕量級(jí)LLM可以在不到600美元的硬件上運(yùn)行。

Alpaca 7B的創(chuàng)建者正在分發(fā)訓(xùn)練集和構(gòu)建它的代碼，任何人都可以復(fù)制該模型或基于不同數(shù)據(jù)集創(chuàng)建新模型。

Vicuna

Llama的另一個(gè)”后裔“是來自LMSYS.org的Vicuna。Vicuna團(tuán)隊(duì)收集了來自ShareGPT的70,000個(gè)不同對(duì)話的訓(xùn)練集，并特別關(guān)注創(chuàng)建多輪交互和指令遵循能力。Vicuna提供Vicuna-13b或Vicuna-7b兩個(gè)版本，它是基本交互式聊天中價(jià)格競爭最激烈的開放解決方案之一。

NodePad

并非所有人都對(duì)LLMs生成的“語言準(zhǔn)確”的文本感到著迷。NodePad的創(chuàng)建者認(rèn)為，文本質(zhì)量往往會(huì)分散用戶注意力，使其無法仔細(xì)檢查底層事實(shí)。具有良好用戶界面的LLMs“往往無意中會(huì)美化結(jié)果，使用戶更難以判斷這些問題?！盢odePad旨在培養(yǎng)探索和構(gòu)思的能力，而不是產(chǎn)生用戶只會(huì)草率瀏覽的完美寫作樣本。這個(gè)LLM生成的結(jié)果呈現(xiàn)為節(jié)點(diǎn)和連接，就像許多“思維導(dǎo)圖工具”中所見，而不像成品寫作。用戶可以利用模型的百科全書知識(shí)來獲得偉大的創(chuàng)意，而不會(huì)陷入演示中迷失方向。

Orca

第一代大規(guī)模語言模型通過增加規(guī)模不斷取得成功。然而，微軟團(tuán)隊(duì)的研究人員開發(fā)的Orca模型打破了這種趨勢。該模型僅使用了130億個(gè)參數(shù)，使其能夠在普通計(jì)算機(jī)上運(yùn)行。Orca的開發(fā)者通過改進(jìn)訓(xùn)練算法來使用“解釋軌跡”、“逐步思考過程”和“指令”來實(shí)現(xiàn)這一壯舉。與其只要求AI從原始材料中學(xué)習(xí)不同，Orca被賦予了一個(gè)旨在進(jìn)行教學(xué)的訓(xùn)練集。換句話說，就像人類一樣，當(dāng)AI不被投入到深水區(qū)時(shí)，它們學(xué)習(xí)得更快。初步結(jié)果很有希望，微軟團(tuán)隊(duì)提供了基準(zhǔn)測試數(shù)據(jù)，表明該模型的性能與規(guī)模更大的模型相當(dāng)。

Jasper

Jasper的創(chuàng)建者不想構(gòu)建一個(gè)無所不知的模型，他們想要一個(gè)專注于內(nèi)容創(chuàng)作的模型。系統(tǒng)并非僅提供無限制的聊天會(huì)話，而是提供了50多個(gè)針對(duì)特定任務(wù)設(shè)計(jì)的模板，例如撰寫房地產(chǎn)列表或?yàn)閬嗰R遜等網(wǎng)站編寫產(chǎn)品特點(diǎn)。付費(fèi)版本專門面向希望以一致語調(diào)創(chuàng)建營銷文案的企業(yè)。

Claude

Anthropic創(chuàng)建了Claude，旨在成為一個(gè)有用的助手，可以處理企業(yè)的許多基于文本的任務(wù)，包括研究和客戶服務(wù)等。輸入一個(gè)提示，輸出一個(gè)答案。Anthropic特意允許長提示，以鼓勵(lì)更復(fù)雜的指令，使用戶對(duì)結(jié)果擁有更多控制權(quán)。Anthropic目前提供兩個(gè)版本：名為Claude-v1的完整模型和更便宜、簡化的版本Claude Instant，后者價(jià)格顯著較低。前者適用于需要更復(fù)雜、結(jié)構(gòu)化推理的工作，而后者在分類和審查等簡單任務(wù)中速度更快、效果更好。

Cerebras

當(dāng)專用硬件和通用模型共同演化時(shí)，您可以獲得非?？焖俸透咝У慕鉀Q方案。Cerebras在Hugging Face上提供其LLM的各種規(guī)模，從小型（1.11億個(gè)參數(shù)）到大型（130億個(gè)參數(shù)），供那些想要在本地運(yùn)行它的用戶選擇。然而，許多人可能希望使用云服務(wù)，這些云服務(wù)在Cerebras自己的芯片級(jí)集成處理器上運(yùn)行，該處理器經(jīng)過優(yōu)化，可以高效處理大規(guī)模訓(xùn)練集。

Falcon

United Arab Emirates的科技創(chuàng)新研究院（Technology Innovation Institute，簡稱TII）開發(fā)了全尺寸的Falcon-40b和較小的Falcon-7b模型。他們使用來自RefinedWeb的大量通用實(shí)例對(duì)Falcon模型進(jìn)行訓(xùn)練，重點(diǎn)改善了推理能力。然后，他們選擇以Apache 2.0許可證發(fā)布該模型，使其成為最開放的可供實(shí)驗(yàn)無限制使用的模型之一。

ImageBind

許多人認(rèn)為Meta是一家主導(dǎo)社交媒體的大公司，但它也是開源軟件開發(fā)領(lǐng)域的強(qiáng)大力量?，F(xiàn)在人們對(duì)人工智能的興趣正在蓬勃發(fā)展，所以公司開始分享自己的許多創(chuàng)新并不令人意外。ImageBind是一個(gè)旨在展示人工智能如何同時(shí)創(chuàng)建多種不同類型數(shù)據(jù)的項(xiàng)目，包括文本、音頻和視頻。換句話說，生成式人工智能可以將整個(gè)想象世界拼接在一起，只要你允許它這樣做。

Gorilla

你可能已經(jīng)聽說過使用生成式人工智能來編寫代碼的方法。結(jié)果在表面上看起來令人印象深刻，但仔細(xì)檢查后會(huì)發(fā)現(xiàn)存在深層次的缺陷。語法可能是正確的，但API調(diào)用都是錯(cuò)誤的，甚至可能指向不存在的函數(shù)。Gorilla是一個(gè)旨在更好地處理編程接口的LLM。它的創(chuàng)建者從Llama開始，然后針對(duì)直接從文檔中獲取的更深入的編程細(xì)節(jié)進(jìn)行了微調(diào)。Gorilla團(tuán)隊(duì)還提供了自己基于API的一系列測試指標(biāo)以測試成功率。這對(duì)于尋求依靠AI進(jìn)行編碼輔助的程序員來說是一個(gè)重要的補(bǔ)充。

Ora.ai

Ora是一個(gè)允許用戶創(chuàng)建針對(duì)特定任務(wù)進(jìn)行優(yōu)化的定制聊天機(jī)器人。LibrarianGPT將嘗試使用書中的直接段落回答任何問題。例如，卡爾·薩根教授是一個(gè)機(jī)器人，可以引用薩根的所有著作，使他可以生活在數(shù)十億年的時(shí)間里。您可以創(chuàng)建自己的機(jī)器人，也可以使用其他人已經(jīng)創(chuàng)建的數(shù)百個(gè)機(jī)器人之一。

AgentGPT

AgentGPT是另一個(gè)將應(yīng)用程序所需的所有代碼拼接在一起的工具。它旨在創(chuàng)建可以處理諸如規(guī)劃度假或編寫某種類型游戲代碼等工作的代理。技術(shù)堆棧的許多源代碼都可在GPL 3.0下獲得。還提供了作為服務(wù)運(yùn)行的版本。

FrugalGPT

FrugalGPT并不是一種不同的模型，而是一種尋找回答特定問題最便宜的模型的策略。開發(fā)FrugalGPT的研究人員認(rèn)識(shí)到，許多問題并不需要最大、最昂貴的模型。他們的算法從最簡單的模型開始，并按照級(jí)聯(lián)的方式逐步選擇更復(fù)雜的語言模型，直到找到一個(gè)合適的答案。

FrugalGPT旨在通過為每個(gè)具體問題選擇最合適的模型來優(yōu)化資源使用，從而在不降低準(zhǔn)確性和效果的情況下降低成本。研究人員的實(shí)驗(yàn)證明，這種謹(jǐn)慎的方法可能節(jié)省高達(dá)98%的成本，因?yàn)樵S多問題實(shí)際上并不需要復(fù)雜的模型。

作者 | GENERATIVE AI INSIGHTS

原文鏈接 | https://www.infoworld.com/article/3700869/14-llms-that-arent-chatgpt.html

責(zé)任編輯：劉芯來源： InforWorld

ChatGPT LLM 大型語言模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="6xnli"></sub>
<s id="6xnli"><li id="6xnli"></li></s>