自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<s id="ttklf"></s>

<acronym id="ttklf"><cite id="ttklf"></cite></acronym>

<nobr id="ttklf"></nobr>

<pre id="ttklf"><rp id="ttklf"></rp></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」

發(fā)布于 2024-6-24 08:14

瀏覽

0收藏

當我們在談論「開源」時，我們到底在談論什么？

在軟件時代，「開源」的概念并不模糊。我們可以非常清楚自信地說，Linux是開源的，Windows是閉源的。

更具體地說，曾經(jīng)的「開源」是指能夠訪問、修改源代碼，并對程序的使用或發(fā)行不加限制。

但進入AI時代，這個概念變得愈發(fā)模糊。關于人工智能模型的「開源」到底如何界定，社區(qū)和行業(yè)專家仍未達成一致。

成立于1998年的Open Source Initiative（OSI）就始終在主持一個在線論壇，方便對開源AI模型的定義進行公開討論。

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

他們在官方網(wǎng)站上表示：「對于開源代碼和使用許可的傳統(tǒng)觀點不再適用于AI組件，已經(jīng)不足以保證使用、研究、共享和修改系統(tǒng)的自由。」

OSI的開源AI定義草案從2022年發(fā)起，已經(jīng)修改到了版本0.0.8，最新一版中宣稱，開源AI系統(tǒng)應該提供以下三個方面的信息：

訓練數(shù)據(jù)的詳細信息，包括數(shù)據(jù)集、數(shù)據(jù)來源、數(shù)據(jù)范圍和特征、獲取和數(shù)據(jù)選擇方式、標注程序、數(shù)據(jù)清理方法等，以便技術人員可以用相同或相似的數(shù)據(jù)復現(xiàn)模型的效果
用于訓練和運行的源代碼，包括支持庫以及預處理、訓練、驗證和測試、推理、模型架構(gòu)等多步驟的代碼
模型參數(shù)，包括訓練階段中間關鍵的檢查點（checkpoint）以及最終的優(yōu)化器狀態(tài)

這相比我們平常認知中的「開放源代碼」已經(jīng)擴展了不少內(nèi)容。

最近，荷蘭的兩位學者也注意到了AI行業(yè)「開源」這個定義的模糊性，于是發(fā)表了一篇論文討論這個問題。

文章已被ACM下轄的FAccT會議（Fairness, Accountability and Transparency）接收，并得到了Nature的報道。

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

論文地址：https://dl.acm.org/doi/10.1145/3630106.3659005

本文創(chuàng)建了一個排行榜，用于識別最「開放」和最「不開放」的模型，并譴責了大公司「掛羊頭賣狗肉」的行為。

共同一作Dingemanse表示，一些大公司聲稱自己的模型開源并從中獲益，卻試圖盡可能少地披露模型信息。論文將這種行為幽默地比喻為open-washing（源于「洗白」white-washing一詞）。

這篇論文也得到了同行的認可，Mozilla基金會可信AI方面的高級研究員Abeba Birhane稱贊這項研究「戳破了當前開源討論中的大量炒作和廢話」。

大公司open-washing，開源≠開放

給模型貼上「開源」的標簽，不僅對社區(qū)和開發(fā)者有不可抗拒的誘惑力，也能在法律和商業(yè)層面帶來豐厚回報。

將模型開源的行為，似乎讓研發(fā)團隊顯得更加嚴謹、透明，而且看起來不那么鉆營于短期利益，而是致力于整個AI行業(yè)的長遠發(fā)展。

此外，歐盟今年通過的人工智能法案也對開源的通用模型有一定的豁免，沒有那么高的透明度要求，讓它們承擔「較少且尚未定義」的義務。

在這樣的背景下，許多LLM都是頂著「開源」光環(huán)出道的，標志之一就是使用博客文章發(fā)布模型。

論文發(fā)現(xiàn)，大公司發(fā)布模型的博客文章中會包含精心設計的表格，并在MMLU、HumanEval、TruthQA等基準上進行打分測試。

這讓發(fā)布者保留了科學研究的光環(huán)，但又巧妙避免了真正發(fā)布科研論文時需要面臨的詳細審查與同行評審，從而不必被迫披露不想公開的數(shù)據(jù)。

那么到底應該用什么樣的標準定義「開源」？

論文提出，鑒于GenAI系統(tǒng)的復雜性，最有效的方法將是把「開放性」視為一個復合且分級的概念。

「復合」體現(xiàn)在由多個因素組成，其中每個因素都可以單獨進行評估；「分級」是因為每個維度都能以不同的程度實現(xiàn)開放，不能賦以「開放/封閉」這樣簡單的二元劃分。

于是，對46個聲稱「開源」或「開放」的大模型以及眾多小型模型，作者進行了多維度的評估與對比，在14個參數(shù)上進行了三分類：開放（open）、部分開放（partially open）還是封閉（closed）。

專注于開放技術的非營利公司OpenUK的CEO認為，在分析開放程度時，使用這種滑動尺度取代簡單粗暴的分類，是更加實際且有用的方法。

14個參數(shù)涵蓋了3個方面——

可用性：包括代碼、數(shù)據(jù)、模型權重、指令微調(diào)的數(shù)據(jù)、微調(diào)后的權重
文檔：源代碼、模型架構(gòu)的說明文檔，模型卡（model card）、數(shù)據(jù)表（data sheet）、是否發(fā)布了預印本和經(jīng)過同行評審的論文
訪問與許可：是否把模型放到公開代碼庫上（如PyPI）作為軟件包發(fā)行，是否提供API訪問，以及模型的許可證

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

綠色表示開放，黃色表示部分開放，紅色表示封閉

評估結(jié)果

于是有了下面這種文本生成模型的開放性概覽圖，幾乎囊括了你能叫上來名字的所有模型。

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

可以看到，前十名中除了BLOOMZ和OLMo，幾乎沒有我們認識的模型。這是因為較小的團隊希望通過高標準的公開和透明，來彌補模型在規(guī)模和性能方面的不足。

Allen AI發(fā)布的OLMo系列以及BigScience的Bloom可以說是開源的典范，排在前兩名，接近完全開放的狀態(tài)。

這兩個模型的研發(fā)團隊都在竭盡所能地提供訓練數(shù)據(jù)、代碼、文檔和整個模型的pipeline。值得注意的是，Allen AI與Big Science都是非營利機構(gòu)。

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

這種做法實在是少數(shù)中的少數(shù)。相比之下，三分之一的系統(tǒng)選擇只提供模型權重，但其他方面幾乎不公開任何細節(jié)

。

那么科技巨頭的表現(xiàn)如何呢？

ChatGPT無疑排名倒數(shù)第一，Cohere、谷歌、微軟等大型玩家都吊在車尾，包括被Meta包裝成開源模型的LLaMA。

在14個維度中，有兩項格外讓人擔憂：一是所有模型幾乎都沒有發(fā)布嚴謹?shù)摹⒔?jīng)過同行評審的論文，二是訓練數(shù)據(jù)的整體不透明性。

除了文本模型，論文也對文生圖模型進行了評估。

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

在這個排行榜上，OpenAI的DALL-E倒數(shù)第一也在意料之內(nèi)，但Stable Diffusion的表現(xiàn)尤為突出，也幾乎公開了所有信息，相比文本模型榜首的OLMo開放程度更高。

為什么論文只給概覽圖不給評分？是作者在水工作量嗎？

完全不是。對于「評分」這個問題，論文有進一步的考量和闡述。

對同一個概覽圖結(jié)果，用不同的派生方法和權重，你就能得到不同的評分。

換言之，評分是可以被操縱的。

ACM最新論文戳破大公司「開源」謊言，GenAI時代到底如何定義「開源模型」-AI.x社區(qū)

給所有維度分配相同的權重，并分別用1分、0.5分、0分賦給開放、部分開放、封閉三個結(jié)果，就能得到圖2中基于梯度測量的累積性分數(shù)。

想要從分數(shù)轉(zhuǎn)換成分類標簽，可以設置不同的權重和閾值，用不同的方法劃分評分空間就會得到不同的結(jié)果，比如圖3和圖4。

我們目前所面臨的現(xiàn)實，更加接近上面圖5中的情況，也就是讓唯一的指標「一葉障目」，只通過是否有開放許可證或者是否公開了模型權重，判斷系統(tǒng)的開放性。

安全AGI，需要不盲目的開放

應不應該開放？對這個頗有爭議的問題，作者在論文最后給出了自己的觀點。

在完全共享模型每個組件和所有數(shù)據(jù)的「激進式開放」，和被稀釋到極其微弱的「順勢療法開放」（如只公開模型權重）之間，還存在著許多條道路。

完全開放并不是最完美的解決方案，比如AI的不正當使用、有害數(shù)據(jù)的泄露，都是不能忽視的問題。

開放性有不同的程度和維度，對生成式AI的監(jiān)管應該鼓勵有意義的開放。比如訓練和微調(diào)數(shù)據(jù)，有可能在公眾審查和專業(yè)審核的目光下變得更加安全。

但是，在大多數(shù)情況下，開放依舊要好過封閉，這對于系統(tǒng)的風險分析（公眾需要知道）、可審查性（評估人員需要知道）、科學可復現(xiàn)性（科研工作者需要知道）以及法律責任（用戶需要知道）都有重要意義。

對評估人員而言，設計更好的評估框架，得出有意義、基于證據(jù)、多維度的開放性判斷，避免被操縱、偏頗的指標，能夠幫助我們做出更好的決定。

本文轉(zhuǎn)自新智元，作者：新智元

原文鏈接:??https://mp.weixin.qq.com/s/yekGPLIlf1UACdIdVulU1w??

標簽

贊

收藏

回復

舉報

回復

相關推薦

大模型融合！最新「進化算法」全自動組合開源模型，刷榜多項基準測試

duhorse ? 1933瀏覽 ? 0回復
Meta公司開源大數(shù)據(jù)模型SAM實戰(zhàn)演練

51CTO內(nèi)容精選 ? 2741瀏覽 ? 0回復
清華大學最新深度時序模型綜述+5k star開源代碼！

海因斯DK ? 4260瀏覽 ? 0回復
Llama3.1系列模型正式開源，最大405B，閉源模型的統(tǒng)治時代將迎來結(jié)束？

NLP工作站 ? 2218瀏覽 ? 0回復
比OpenAI的Whisper快50%，最新開源語音模型

Aceryt ? 2381瀏覽 ? 0回復
將端側(cè)大模型進行到底-MiniCPM3-4B開源

NLP工作站 ? 2548瀏覽 ? 0回復
被神化的o1模型，規(guī)劃能力到底如何？

大語言模型論文跟蹤 ? 2627瀏覽 ? 0回復
OpenAI最新論文驗證該方法可行性！

51CTO技術棧 ? 2060瀏覽 ? 0回復
開源大模型如何治理？斯坦福基礎模型研究中心給您支招

AIGC最前線 ? 2642瀏覽 ? 0回復
OpenAI犯了大公司病

51CTO技術棧 ? 1647瀏覽 ? 0回復
DeepSeek-VL2開源，VLM邁入MoE時代！

xuxiangda ? 2811瀏覽 ? 0回復
自家的大模型秘方開源到底！國產(chǎn)大模型雄起

51CTO技術棧 ? 2307瀏覽 ? 0回復
如何使用模型上下文協(xié)議構(gòu)建自定義工具

51CTO內(nèi)容精選 ? 1968瀏覽 ? 0回復
五分鐘讀懂Manus平替：深度解析OpenManus 如何重新定義Multi Agent?

AI博物院 ? 3855瀏覽 ? 0回復
剛剛，OpenAI 開源了兩個 Agent 項目，手搓 Manus 時代來襲

玄姐聊AGI ? 1833瀏覽 ? 0回復
媲美OpenAI-o3，剛剛開源模型DeepCoder，訓練方法、數(shù)據(jù)集大公開

Aceryt ? 963瀏覽 ? 0回復
Deepseek新論文！如何讓AI自己學會更公平地打分？

石映飛云 ? 1175瀏覽 ? 0回復
GenAI 時代，數(shù)據(jù)唾手可得，但真正的挑戰(zhàn)已經(jīng)轉(zhuǎn)變...

Baihai_IDP ? 608瀏覽 ? 0回復
面對開源大模型浪潮，基礎模型公司如何持續(xù)盈利？

Baihai_IDP ? 748瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

DeepSeek第五天開源猛料，3FS并行文件系統(tǒng)榨干SSD！6.6 TiB/s吞吐量堪比光速 2025-02-28 12:53:18發(fā)布
剛剛，DeepSeek開源DeepEP通信庫，千億MoE訓推顛覆級創(chuàng)新！FP8狂飆，帶飛GPU 2025-02-25 12:24:42發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：打開黑盒神經(jīng)網(wǎng)絡！港大推出全新「會說話」的推薦系統(tǒng)大模型XRec，從黑盒預測到可解釋

下一篇：快手「可靈」再進化！視頻續(xù)寫可達3分鐘讓全球網(wǎng)友炸鍋

社區(qū)精華內(nèi)容

目錄

<em id="rkfp6"><tfoot id="rkfp6"></tfoot></em>