開源AI與專有AI的角力
IBM和Meta的合作伙伴和合作伙伴包括AMD、英特爾、NASA、CERN、Hugging Face、甲骨文、Linux基金會、紅帽、哈佛大學(xué)和其他教育和研發(fā)機(jī)構(gòu)。
根據(jù)定義,軟件開發(fā)項(xiàng)目向公眾開放以供使用、修改或分發(fā),允許工程師、開發(fā)人員等進(jìn)行協(xié)作,稱為開源。技術(shù)咨詢公司Nisum負(fù)責(zé)洞察和分析的全球?qū)嵺`主管Ravi Narayanan表示,開放源代碼“促進(jìn)了社區(qū)合作和透明度,加快了創(chuàng)新,并降低了開發(fā)成本”。
開源AI包括訓(xùn)練語料庫、訓(xùn)練語料庫清理和準(zhǔn)備、訓(xùn)練中使用的代碼、訓(xùn)練模型、推理代碼和輸出中的護(hù)欄代碼,netTalk Connect和NOOZ.AI的首席技術(shù)官Garry M.Paxinos向Spiceworks News&Insights解釋道,它還包括平臺、工具、數(shù)據(jù)集和API。
開放源碼與非開放源碼AI開發(fā)人員的區(qū)別
AI模型和底層硬件可能是當(dāng)今最熱門的AI資產(chǎn)??紤]到開源模式遠(yuǎn)不如私人模式先進(jìn)和有能力,AI聯(lián)盟、OpenAI、微軟、NVIDIA、谷歌、DeepMind、亞馬遜、Anthorpic、特斯拉和其他多家AI巨頭明顯沒有列出的公司名單,說明了開源和非開源的分歧。
今年6月,在特拉維夫大學(xué)的一次討論中,一位聽眾問OpenAI首席執(zhí)行官Sam Altman和前OpenAI首席科學(xué)家Ilya Sutskever,開源大型語言模型是否可以在沒有額外技術(shù)進(jìn)步的情況下與GPT-4匹敵。
“我是在浪費(fèi)時(shí)間安裝超過130億美元的Stable Vicuna嗎?告訴我,我是在浪費(fèi)時(shí)間嗎?”開源AI研究人員伊沙伊·格林問道,這讓奧特曼無言以對,薩茨克弗也有12秒說不出話來。以下是Sutskever的回答:
“對于開源與非開源模型的問題,你不會想要用黑白的二進(jìn)制術(shù)語來思考它,比如,有一個(gè)永遠(yuǎn)不會被重新發(fā)現(xiàn)的秘密來源。我要說的是,GPT-4是否會被開源模式復(fù)制——也許有一天會這樣,但當(dāng)它會這樣做的時(shí)候,公司里會有一個(gè)更強(qiáng)大的模式,因此,開源模式和他們的私人模式之間總是會有差距。這一次,這一差距甚至可能還在擴(kuò)大。制造一個(gè)這樣的神經(jīng)網(wǎng)絡(luò)所需的努力、工程和研究的數(shù)量不斷增加,因此,即使有開放源碼的模型,它們也會越來越少地由一小群敬業(yè)的研究人員和工程師生產(chǎn),而且它將來自一家公司、一家大公司的天意?!?nbsp;
QuickBl創(chuàng)始人兼首席執(zhí)行官內(nèi)特·麥克利奇認(rèn)為,強(qiáng)大的資金支持可以幫助公司獲得技術(shù)領(lǐng)先優(yōu)勢,從而獲得競爭優(yōu)勢。Gramener高級副總裁桑迪普·雷迪·馬魯評估說,“如今開源和閉源的AI模型之間至少存在3倍的差距。AI建模得益于強(qiáng)大的計(jì)算能力、巨大的數(shù)據(jù)粒度以及對可以用它做什么的最小障礙?!?nbsp;
盡管如此,納拉亞南說,“開源模式仍然可以發(fā)揮自己的優(yōu)勢。開放源碼和封閉源碼AI模型各有優(yōu)勢,由于其固有的特點(diǎn)和方法,通常在不同的領(lǐng)域出類拔萃。這些模式之間的技術(shù)差距各不相同:開源模式往往引領(lǐng)創(chuàng)新和社區(qū)驅(qū)動的改進(jìn),而專有模式可能提供獨(dú)特的、專門的能力和強(qiáng)大的支持?!?nbsp;
AI聯(lián)盟
Meta和IBM正在帶頭建立AI聯(lián)盟,利用他們的專業(yè)知識和資源,推動AI領(lǐng)域的標(biāo)準(zhǔn)化和道德框架,這與他們塑造AI未來、確保他們在不斷發(fā)展的格局中的影響力以及培養(yǎng)人們對AI技術(shù)的信任的目標(biāo)是一致的,Narayanan說,“對于Meta來說,這是關(guān)于將AI更深入地整合到社交平臺和數(shù)字互動中,而IBM則專注于增強(qiáng)其企業(yè)AI解決方案和服務(wù)?!?nbsp;
Meta被認(rèn)為是一家無視用戶隱私的賺錢企業(yè),現(xiàn)在處于開源AI開發(fā)的前沿。然而,對于一家開創(chuàng)開源先河的公司來說,Meta要求開發(fā)者/用戶提交下載請求,并要求提供其Llama 2型號的出生日期等細(xì)節(jié),這是很奇怪的。
值得稱贊的是,下載鏈接在注冊后幾分鐘內(nèi)就到達(dá)了我的收件箱。也許Meta的過去是其最大的敵人,讓人懷疑該公司的意圖。此外,Meta使其許可過程變得如此簡單和快速,考慮到它的開發(fā)是禁止公眾進(jìn)入的,Llama 2看起來像是一個(gè)開源模型,而它實(shí)際上不能被稱為開源模型。因此,為什么Meta是AI聯(lián)盟的先鋒,這是值得懷疑的。
Meta對開源AI開發(fā)的積極作用也可以被認(rèn)為是偶然的。帕西諾斯補(bǔ)充道:“通過觀察Meta Llama模型被泄露后發(fā)生的事情,然后Meta以Llama 2的形式正式發(fā)布,人們可以看到將訓(xùn)練過的模型開源的有用之處。一旦訓(xùn)練過的模型被泄露,就會有大量的開源項(xiàng)目和模型使用Llama和/或?qū)δP瓦M(jìn)行微調(diào)。”
MacLeitch說,Meta和IBM對開源的接受和貢獻(xiàn)可能是他們“挑戰(zhàn)GenAI領(lǐng)域最大的參與者,并創(chuàng)建一個(gè)與AI相關(guān)的公司和工具的替代生態(tài)系統(tǒng)”的目標(biāo)的一部分。
雷迪·馬魯表示同意。他認(rèn)為,AI聯(lián)盟中的企業(yè)的目標(biāo)有兩個(gè):
- 創(chuàng)造商業(yè)AI模型的替代方案。他認(rèn)為,正如軟件開發(fā)的歷史所表明的那樣,開源最終會占據(jù)上風(fēng)。
- 參與的企業(yè)希望將自己與該領(lǐng)域的早期領(lǐng)導(dǎo)者區(qū)分開來。
我個(gè)人對結(jié)盟持懷疑態(tài)度。盡管它們可能是有用和有益的,但我曾在幾個(gè)技術(shù)委員會工作過,在這些委員會中,非常大的公司付錢讓高級員工參加,主要目的是放慢委員會的工作。我擔(dān)任過一些小組委員會的主席,其中就發(fā)生了這種情況。
支持(和反對)開源AI模型開發(fā)的理由
私人AI的開發(fā)和模式可能不利于創(chuàng)新。加州大學(xué)伯克利分校計(jì)算、數(shù)據(jù)科學(xué)和社會學(xué)院院長詹妮弗·查耶斯指出:“追求開放創(chuàng)新創(chuàng)造了一個(gè)公平的競爭環(huán)境,讓每個(gè)人都能分享GenAI的好處?!?nbsp;
MacLeitch告訴記者,靈活性、根據(jù)需求定制和修改的能力,以及它們得到同行審查的事實(shí),從而提供了更高的安全性是開源AI最顯著的優(yōu)勢。
Narayanan補(bǔ)充說:“開源AI是創(chuàng)新和可訪問性的催化劑,打破了較小實(shí)體的障礙,并為快速技術(shù)進(jìn)步創(chuàng)造了一個(gè)合作環(huán)境,它提供了顯著的成本優(yōu)勢,減少了開發(fā)和運(yùn)營費(fèi)用,并促進(jìn)了透明度,這對符合道德的AI發(fā)展和建立對AI系統(tǒng)的信任至關(guān)重要?!?nbsp;
GenAI的好處,或一般的AI,是企業(yè)努力提高生產(chǎn)率、獲得競爭優(yōu)勢并為最終用戶設(shè)計(jì)創(chuàng)新的新產(chǎn)品和服務(wù)的關(guān)鍵方面。然而,伴隨著人們對AI技術(shù)危險(xiǎn)的根深蒂固的擔(dān)憂,包括它對消費(fèi)者隱私的影響,它制造偏見和歧視網(wǎng)絡(luò)安全的傾向,以及它與人類互動的不明確性。
白宮關(guān)于AI使用的行政命令注意到了開源模型,稱它們是兩用基礎(chǔ)模型,其權(quán)重公開,這項(xiàng)行政命令寫道:“當(dāng)軍民兩用基金會模型的權(quán)重被廣泛獲得時(shí)——比如當(dāng)它們被公開發(fā)布在互聯(lián)網(wǎng)上——可能會給創(chuàng)新帶來巨大的好處,但也會帶來巨大的安全風(fēng)險(xiǎn),比如該模型中的保障措施被移除?!?nbsp;
商務(wù)部長吉娜·雷蒙多預(yù)計(jì)將在2024年7月之前向總統(tǒng)提交一份關(guān)于政策和監(jiān)管建議的報(bào)告,此前他與私營部門、學(xué)術(shù)界、公民社會和其他方面就開放模式的潛在好處、風(fēng)險(xiǎn)和影響進(jìn)行了磋商。
“濫用的可能性很大,包括倫理問題和社會危害。開源AI項(xiàng)目經(jīng)常面臨不一致的質(zhì)量和維護(hù)挑戰(zhàn),影響了它們的可靠性。此外,它們還構(gòu)成了嚴(yán)重的安全漏洞和復(fù)雜的合規(guī)問題,特別是在知識產(chǎn)權(quán)和許可方面?!?nbsp;
具體地說,麥克利奇解釋說:“除了傳播虛假信息外,開源AI算法還可以用來創(chuàng)建深度假冒和其他在線詐騙工具。在極端情況下,開源AI可以被用來創(chuàng)造自主武器?!?nbsp;
帕西諾斯接著指出了為什么AI的危險(xiǎn)是這項(xiàng)技術(shù)固有的原因。
“這些危險(xiǎn)有一個(gè)更深層次的哲學(xué)問題,許多危險(xiǎn)實(shí)際上都是心理上的,我們感到關(guān)切的是,模型可能會在其輸出中出現(xiàn)許多偏差。雖然這些偏見確實(shí)令人擔(dān)憂,但在許多方面,它們反映了我們的歷史。我們是否正在失去理解偏見的能力,從而從錯(cuò)誤中吸取教訓(xùn)?同時(shí),根據(jù)領(lǐng)域的不同,了解這些偏見可能有助于我們做出更好的決策——特別是在敵對環(huán)境中工作時(shí)。”
“雖然利他主義是一個(gè)有價(jià)值的目標(biāo),但我們也必須現(xiàn)實(shí)地看待人性,并適當(dāng)?shù)靥幚硭?。同時(shí)確保我們的‘護(hù)欄’不會在我們的AI系統(tǒng)內(nèi)制造隱藏的沖突。“。
在美國和世界其他地區(qū),關(guān)于AI發(fā)展的護(hù)欄或法律條款的蝸牛般的發(fā)展,以及與之相關(guān)的責(zé)任,給這個(gè)新興領(lǐng)域帶來了不確定性。AI開發(fā)者和公司呼吁對AI進(jìn)行監(jiān)管,并提出參與這一過程。
這提出了另一個(gè)問題——他們的參與是否會影響這一過程,并使監(jiān)管向有利于他們的方向傾斜?
對AI立法的影響
無論如何,AI立法注定會發(fā)生。各企業(yè)正在確保他們能夠?qū)⒋蜃约旱睦妗?nbsp;
可以預(yù)期,AI聯(lián)盟將在制定AI立法方面發(fā)揮重要作用。作為與知名大學(xué)合作的數(shù)十億美元的公司,聯(lián)盟當(dāng)然擁有影響政策的財(cái)政資源和政治影響力。
Narayanan補(bǔ)充說:“AI聯(lián)盟憑借其集體專業(yè)知識和行業(yè)影響力,可以顯著影響AI立法。通過提供明智的見解和建議,他們可以形成政策框架,確保法規(guī)在技術(shù)上知情,并與行業(yè)能力和需求保持一致。他們的參與可以導(dǎo)致更平衡、更有效、更有利于創(chuàng)新的AI法規(guī)?!?nbsp;
另一方面,帕西諾斯預(yù)計(jì),通過立法對AI進(jìn)行監(jiān)管將扼殺創(chuàng)新。此外,他質(zhì)疑它的廣泛適用性,無論是從事開源還是專有AI開發(fā)的企業(yè)。
“問題是,哪些‘行為者’會遵守立法,哪些不會,它是否會使遵循指導(dǎo)方針的國家落后于不遵循指導(dǎo)方針的國家的發(fā)展?”
在處理護(hù)欄時(shí),誰來決定什么是安全的內(nèi)容,什么不是?它是否像錯(cuò)誤信息和虛假信息的定義一樣武斷和反復(fù)無常?言論自由的概念是如何受到影響的?看看建國前后的報(bào)紙和出版物,很明顯,與錯(cuò)誤信息作斗爭的是更好的信息,而不是審查制度?!耙庖姟笔裁磿r(shí)候會變成錯(cuò)誤信息?有可能犯下思想犯罪嗎?
在更深的層面上,AI在什么時(shí)候才有權(quán)享有言論自由和表達(dá)自由?有趣的時(shí)代…- Garry Paxinos,netTalk Connect和NOOZ.AI的CTO。
專有AI開發(fā)的優(yōu)勢
盡管AI開發(fā)的不透明本質(zhì)到目前為止一直是常態(tài),但專有的AI開發(fā)確實(shí)提供了一些好處,包括:
- 保護(hù)知識產(chǎn)權(quán)
- 可以提供更好的用戶體驗(yàn)
- 輕松的投資機(jī)會
- 質(zhì)量始終如一
- 企業(yè)與目標(biāo)保持一致