自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

除了ChatGPT,還有14個(gè)你不可不知的大模型

譯文
人工智能 自然語言處理
以下是14個(gè)非ChatGPT的大型語言模型示例。它們可能適合您的項(xiàng)目,也可能不適合。了解真相的唯一方法就是向它們發(fā)送提示并仔細(xì)評(píng)估結(jié)果。

許多老板將人工智能視為未來,許多技術(shù)領(lǐng)導(dǎo)者將ChatGPT視為人工智能的代名詞。但ChatGPT并非唯一的大型語言模型,對(duì)于某些軟件項(xiàng)目或領(lǐng)域而言,它甚至可能不是最佳選擇。新的競爭對(duì)手幾乎每天都在涌現(xiàn),看起來每一個(gè)都想成為下一代人工智能工具。

某些模型是否比其他模型更好?或許是的。但所有這些模型都有缺陷或弱點(diǎn),在使用過程中會(huì)逐漸發(fā)現(xiàn)這些弱點(diǎn)。生成式人工智能乍看起來令人驚嘆,但隨著時(shí)間推移,它難以預(yù)測的一面會(huì)開始顯現(xiàn)出來。

語言模型基準(zhǔn)測試

受模型的范圍和使用方式的影響,科學(xué)地衡量生成式人工智能的回答質(zhì)量很困難。數(shù)據(jù)科學(xué)家可以輸入成千上萬甚至數(shù)百萬個(gè)測試問題并評(píng)估回答,但如果測試集只關(guān)注一種類型的問題,那評(píng)估結(jié)果的準(zhǔn)確性也是受限的。也就是說,查閱類似Hugging Face的Open LLM Leaderboard這樣的資源是有趣的,但未必準(zhǔn)確。

盡管找到一種精確的方式來評(píng)估LLM(大型語言模型)的難度很大,但至少在它們之間進(jìn)行切換現(xiàn)在并不困難了。像OpenLLM或FastChat等項(xiàng)目使得在不同的API和接口之間連接各種模型變得更簡單。您可以將這些模型拼接在一起,有時(shí)甚至可以并行運(yùn)行這些模型。

不能忽視的重要問題是成本。雖然每個(gè)研發(fā)團(tuán)隊(duì)都享受著關(guān)注和投資的激增,但構(gòu)建一個(gè)大型語言模型可能需要幾個(gè)月甚至幾年的時(shí)間。團(tuán)隊(duì)首先組合訓(xùn)練數(shù)據(jù),然后通過高耗能硬件進(jìn)行數(shù)據(jù)處理。最后,他們生成模型。如何將這項(xiàng)工作變現(xiàn)并持續(xù)發(fā)展是一個(gè)不斷演變的問題。

一些組織正在嘗試將結(jié)果開源化,而其他人則愉快地依賴于具有自己計(jì)費(fèi)模型的服務(wù)。開源LLM可以是一份真正的禮物,但前提是您能夠處理部署模型和保持其運(yùn)行所需的工作。

以下是14個(gè)非ChatGPT的大型語言模型示例。它們可能適合您的項(xiàng)目,也可能不適合。了解真相的唯一方法就是向它們發(fā)送提示并仔細(xì)評(píng)估結(jié)果。

Llama

這是一個(gè)基礎(chǔ)的LLM,由Facebook(現(xiàn)在的Meta)創(chuàng)建,并將其作為其所宣稱的”對(duì)開放科學(xué)的承諾“的一部分而發(fā)布出來。任何人都可以下載Llama并將其作為創(chuàng)建更精細(xì)調(diào)整模型的基礎(chǔ),用于特定應(yīng)用程序(Alpaca和Vicuna都是基于Llama構(gòu)建的)。該模型還提供四種不同規(guī)模的版本。較小的版本只有70億個(gè)參數(shù),已經(jīng)在意想不到的地方使用。甚至有一位開發(fā)者聲稱已經(jīng)使用只有4GB RAM的Llama在Raspberry Pi上運(yùn)行。

Alpaca

一些斯坦福大學(xué)的研究人員使用Meta的Llama 7B,并將其訓(xùn)練成了一組與ChatGPT等指令遵循模型相似的提示。這個(gè)微調(diào)過程產(chǎn)生了Alpaca 7B,這個(gè)模型讓普通人也可以通過提問和給予指示來獲取Llama LLM中編碼的知識(shí)。據(jù)估計(jì),這種輕量級(jí)LLM可以在不到600美元的硬件上運(yùn)行。

Alpaca 7B的創(chuàng)建者正在分發(fā)訓(xùn)練集和構(gòu)建它的代碼,任何人都可以復(fù)制該模型或基于不同數(shù)據(jù)集創(chuàng)建新模型。

Vicuna

Llama的另一個(gè)”后裔“是來自LMSYS.org的Vicuna。Vicuna團(tuán)隊(duì)收集了來自ShareGPT的70,000個(gè)不同對(duì)話的訓(xùn)練集,并特別關(guān)注創(chuàng)建多輪交互和指令遵循能力。Vicuna提供Vicuna-13b或Vicuna-7b兩個(gè)版本,它是基本交互式聊天中價(jià)格競爭最激烈的開放解決方案之一。

NodePad

并非所有人都對(duì)LLMs生成的“語言準(zhǔn)確”的文本感到著迷。NodePad的創(chuàng)建者認(rèn)為,文本質(zhì)量往往會(huì)分散用戶注意力,使其無法仔細(xì)檢查底層事實(shí)。具有良好用戶界面的LLMs“往往無意中會(huì)美化結(jié)果,使用戶更難以判斷這些問題?!盢odePad旨在培養(yǎng)探索和構(gòu)思的能力,而不是產(chǎn)生用戶只會(huì)草率瀏覽的完美寫作樣本。這個(gè)LLM生成的結(jié)果呈現(xiàn)為節(jié)點(diǎn)和連接,就像許多“思維導(dǎo)圖工具”中所見,而不像成品寫作。用戶可以利用模型的百科全書知識(shí)來獲得偉大的創(chuàng)意,而不會(huì)陷入演示中迷失方向。

Orca

第一代大規(guī)模語言模型通過增加規(guī)模不斷取得成功。然而,微軟團(tuán)隊(duì)的研究人員開發(fā)的Orca模型打破了這種趨勢。該模型僅使用了130億個(gè)參數(shù),使其能夠在普通計(jì)算機(jī)上運(yùn)行。Orca的開發(fā)者通過改進(jìn)訓(xùn)練算法來使用“解釋軌跡”、“逐步思考過程”和“指令”來實(shí)現(xiàn)這一壯舉。與其只要求AI從原始材料中學(xué)習(xí)不同,Orca被賦予了一個(gè)旨在進(jìn)行教學(xué)的訓(xùn)練集。換句話說,就像人類一樣,當(dāng)AI不被投入到深水區(qū)時(shí),它們學(xué)習(xí)得更快。初步結(jié)果很有希望,微軟團(tuán)隊(duì)提供了基準(zhǔn)測試數(shù)據(jù),表明該模型的性能與規(guī)模更大的模型相當(dāng)。

Jasper

Jasper的創(chuàng)建者不想構(gòu)建一個(gè)無所不知的模型,他們想要一個(gè)專注于內(nèi)容創(chuàng)作的模型。系統(tǒng)并非僅提供無限制的聊天會(huì)話,而是提供了50多個(gè)針對(duì)特定任務(wù)設(shè)計(jì)的模板,例如撰寫房地產(chǎn)列表或?yàn)閬嗰R遜等網(wǎng)站編寫產(chǎn)品特點(diǎn)。付費(fèi)版本專門面向希望以一致語調(diào)創(chuàng)建營銷文案的企業(yè)。

Claude

Anthropic創(chuàng)建了Claude,旨在成為一個(gè)有用的助手,可以處理企業(yè)的許多基于文本的任務(wù),包括研究和客戶服務(wù)等。輸入一個(gè)提示,輸出一個(gè)答案。Anthropic特意允許長提示,以鼓勵(lì)更復(fù)雜的指令,使用戶對(duì)結(jié)果擁有更多控制權(quán)。Anthropic目前提供兩個(gè)版本:名為Claude-v1的完整模型和更便宜、簡化的版本Claude Instant,后者價(jià)格顯著較低。前者適用于需要更復(fù)雜、結(jié)構(gòu)化推理的工作,而后者在分類和審查等簡單任務(wù)中速度更快、效果更好。

Cerebras

當(dāng)專用硬件和通用模型共同演化時(shí),您可以獲得非??焖俸透咝У慕鉀Q方案。Cerebras在Hugging Face上提供其LLM的各種規(guī)模,從小型(1.11億個(gè)參數(shù))到大型(130億個(gè)參數(shù)),供那些想要在本地運(yùn)行它的用戶選擇。然而,許多人可能希望使用云服務(wù),這些云服務(wù)在Cerebras自己的芯片級(jí)集成處理器上運(yùn)行,該處理器經(jīng)過優(yōu)化,可以高效處理大規(guī)模訓(xùn)練集。

Falcon

United Arab Emirates的科技創(chuàng)新研究院(Technology Innovation Institute,簡稱TII)開發(fā)了全尺寸的Falcon-40b和較小的Falcon-7b模型。他們使用來自RefinedWeb的大量通用實(shí)例對(duì)Falcon模型進(jìn)行訓(xùn)練,重點(diǎn)改善了推理能力。然后,他們選擇以Apache 2.0許可證發(fā)布該模型,使其成為最開放的可供實(shí)驗(yàn)無限制使用的模型之一。

ImageBind

許多人認(rèn)為Meta是一家主導(dǎo)社交媒體的大公司,但它也是開源軟件開發(fā)領(lǐng)域的強(qiáng)大力量?,F(xiàn)在人們對(duì)人工智能的興趣正在蓬勃發(fā)展,所以公司開始分享自己的許多創(chuàng)新并不令人意外。ImageBind是一個(gè)旨在展示人工智能如何同時(shí)創(chuàng)建多種不同類型數(shù)據(jù)的項(xiàng)目,包括文本、音頻和視頻。換句話說,生成式人工智能可以將整個(gè)想象世界拼接在一起,只要你允許它這樣做。

Gorilla

你可能已經(jīng)聽說過使用生成式人工智能來編寫代碼的方法。結(jié)果在表面上看起來令人印象深刻,但仔細(xì)檢查后會(huì)發(fā)現(xiàn)存在深層次的缺陷。語法可能是正確的,但API調(diào)用都是錯(cuò)誤的,甚至可能指向不存在的函數(shù)。Gorilla是一個(gè)旨在更好地處理編程接口的LLM。它的創(chuàng)建者從Llama開始,然后針對(duì)直接從文檔中獲取的更深入的編程細(xì)節(jié)進(jìn)行了微調(diào)。Gorilla團(tuán)隊(duì)還提供了自己基于API的一系列測試指標(biāo)以測試成功率。這對(duì)于尋求依靠AI進(jìn)行編碼輔助的程序員來說是一個(gè)重要的補(bǔ)充。

Ora.ai

Ora是一個(gè)允許用戶創(chuàng)建針對(duì)特定任務(wù)進(jìn)行優(yōu)化的定制聊天機(jī)器人。LibrarianGPT將嘗試使用書中的直接段落回答任何問題。例如,卡爾·薩根教授是一個(gè)機(jī)器人,可以引用薩根的所有著作,使他可以生活在數(shù)十億年的時(shí)間里。您可以創(chuàng)建自己的機(jī)器人,也可以使用其他人已經(jīng)創(chuàng)建的數(shù)百個(gè)機(jī)器人之一。

AgentGPT

AgentGPT是另一個(gè)將應(yīng)用程序所需的所有代碼拼接在一起的工具。它旨在創(chuàng)建可以處理諸如規(guī)劃度假或編寫某種類型游戲代碼等工作的代理。技術(shù)堆棧的許多源代碼都可在GPL 3.0下獲得。還提供了作為服務(wù)運(yùn)行的版本。

FrugalGPT

FrugalGPT并不是一種不同的模型,而是一種尋找回答特定問題最便宜的模型的策略。開發(fā)FrugalGPT的研究人員認(rèn)識(shí)到,許多問題并不需要最大、最昂貴的模型。他們的算法從最簡單的模型開始,并按照級(jí)聯(lián)的方式逐步選擇更復(fù)雜的語言模型,直到找到一個(gè)合適的答案。

FrugalGPT旨在通過為每個(gè)具體問題選擇最合適的模型來優(yōu)化資源使用,從而在不降低準(zhǔn)確性和效果的情況下降低成本。研究人員的實(shí)驗(yàn)證明,這種謹(jǐn)慎的方法可能節(jié)省高達(dá)98%的成本,因?yàn)樵S多問題實(shí)際上并不需要復(fù)雜的模型。

作者 | GENERATIVE AI INSIGHTS

原文鏈接 | https://www.infoworld.com/article/3700869/14-llms-that-arent-chatgpt.html

責(zé)任編輯:劉芯 來源: InforWorld
相關(guān)推薦

2024-03-21 08:57:39

語言軟件開發(fā)

2014-06-20 14:35:48

浪潮數(shù)據(jù)

2022-08-17 15:09:08

區(qū)塊鏈加密貨幣NFT

2015-07-21 05:55:12

2021-01-28 10:17:54

人工智能AI機(jī)器學(xué)習(xí)

2010-06-11 14:46:38

可路由協(xié)議

2019-01-28 11:35:45

媒體營銷

2011-05-04 14:55:22

耗材打印機(jī)

2020-09-28 07:56:16

Python3.9Python開發(fā)

2023-09-20 09:00:00

2023-09-22 12:14:33

2023-11-13 14:19:57

Golang編程語言

2021-08-12 16:02:22

Jupyter NotPython命令

2022-02-16 08:01:45

網(wǎng)絡(luò)安全趨勢

2015-01-15 09:34:28

2020-11-30 13:12:04

Linux文本命令

2015-06-10 10:56:50

iOS開發(fā)技巧

2023-06-15 11:01:43

Java工具開源

2015-07-28 16:48:04

云計(jì)算性能測試云服務(wù)

2021-03-02 10:19:13

技術(shù)趨勢IT主管企業(yè)發(fā)展
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)