AIGC狂飆對于普通人意味著什么?
AIGC 人工智能生成內(nèi)容,相對更早的內(nèi)容生產(chǎn)模式分別為專家生產(chǎn)內(nèi)容 PGC 和用戶生產(chǎn)內(nèi)容 UGC。而隨著 AIGC 出現(xiàn),內(nèi)容生產(chǎn)率變成指數(shù)級上升。那么AIGC發(fā)展對于普通人來說到底意味著什么?
先回顧一下時間軸,
2015年7月,谷歌推出 Deepdream 開創(chuàng) AI 模型根據(jù)文本生成圖像的先河。
2021年1月,OpenAI 發(fā)布達人 DALL-E 模型,讓文本生成圖像真正卷出了天際。
2022年7月,獨立實驗室 Midjourney 發(fā)布同名圖像生成模型。Journey 設(shè)計師 Jason Allen 用AI生成圖片,太空歌劇院,在克羅拉多州博覽會的名聲比賽中獲得投獎,并感慨藝術(shù)意思,人類輸了,引起全球熱議。
2022年8月,stability AI 的開源圖像生成模型 stable diffusion。僅需一臺電腦就能運行,截至當(dāng)年10月,已有超過20萬開發(fā)者下載這一系列模型引爆了 AI 作畫領(lǐng)域,標(biāo)志著人工智能向藝術(shù)領(lǐng)域的滲透。
與此同時,2022年12月,OpenAI 的大型語言生成模型 ChatGPT 引爆全網(wǎng),能做到和人類對答如流,勝任高情商對話能進行短文、詩歌、代碼計算邏輯等不同類型的內(nèi)容輸出,讓人不禁懷疑 ChatGPT 是否真的已經(jīng)具有人力智能,僅過了短短幾個月,升級版 GPT 4橫空出世,不光能實現(xiàn)圖文多模態(tài)輸入,在專業(yè)領(lǐng)域也表現(xiàn)出媲美人類甚至超越人類的水平。
2022年是 AIGC 元年,代表新一輪范式轉(zhuǎn)移的開始。AI 模型在文本圖片生成方面效果令人驚喜,在視頻和3D 等高復(fù)雜領(lǐng)域逐步探索階段,但對 AI 的學(xué)習(xí)速度來說,拿下這些領(lǐng)域也只是時間問題。
以上所有都不是突然出現(xiàn)的 AIGC 之所以能在22年爆發(fā),至少具備以下四項條件。
一、模型訓(xùn)練技術(shù)革新:與其他行業(yè)不同,AC是開放科學(xué)、不斷創(chuàng)新在生成算法優(yōu)質(zhì)模型、開源加速技術(shù)變革,其中 OpenAI 開源的CLIP 多模態(tài)預(yù)訓(xùn)練模型能同時進行自然語言理解和計算機視覺分析,這讓模型訓(xùn)練可以直接利用互聯(lián)網(wǎng)上自帶文字描述的圖片素材,大幅降低了數(shù)據(jù)獲取門檻,也是圖像生成模型的技術(shù)基礎(chǔ)。
二、合成數(shù)據(jù)驅(qū)動訓(xùn)練。早期模型訓(xùn)練最大掣肘就是數(shù)據(jù),面臨數(shù)據(jù)標(biāo)注,費時費力且準(zhǔn)確率低,樣本數(shù)量無法覆蓋邊緣案例,稍微長期數(shù)據(jù)難以采集隱私數(shù)據(jù)面臨法律法規(guī)限制等問題。但隨著生成式 AI 的發(fā)展,模型產(chǎn)出的合成數(shù)據(jù)又反哺模型訓(xùn)練過程,形成加速飛輪。可以說合成數(shù)據(jù)影響了 AI 的未來。
三、GPU 芯片支持。我們通過網(wǎng)絡(luò)感受 AI,但真正的模型訓(xùn)練需要投入巨額資金驅(qū)動巨型服務(wù)器,這也直接使 GPU 芯片和服務(wù)器制造商 英偉達發(fā)展成為了全球最有價值的公司。
四、產(chǎn)業(yè)生態(tài)逐漸成型。首先是上游預(yù)訓(xùn)練模型,超過80%的人工智能研究都集中在基礎(chǔ)模型訓(xùn)練上,這一層的門檻很高,例如語言處理模型 GPT 3的訓(xùn)練成本粗略估算1,200萬美元。因此有能力做預(yù)訓(xùn)練模型的主要為頭部科技企業(yè)和獨角獸公司。其次是以優(yōu)秀的預(yù)訓(xùn)練模型為根基,開發(fā)和銷售垂直細分領(lǐng)域的中間模型及服務(wù) model as a service 成為現(xiàn)實,這一層就比較適合初創(chuàng)公司和個人創(chuàng)業(yè)者。
你可能會問,作為普通人知道這個有什么用啊?
基于 GPT 模型,有人拿 ChatGPT 寫作業(yè),有人組合多個 AI 工具全自動做視頻,有人利用信息差拿 AI 效果圖賺錢,有人發(fā)現(xiàn)提示詞帶有學(xué)問,甚至有人拿 AI 違法亂紀(jì)。
總而言之,AIGC打開了新世界的大門。
反觀我國自主 AI 研發(fā)都是可能是龐大的人口規(guī)模,更可能產(chǎn)生專業(yè)人才訓(xùn)練數(shù)據(jù),但劣勢是忽視 AI 的高昂訓(xùn)練成本,讓普通企業(yè)望而卻步,很多所謂的大廠就是坐擁廣闊市場,大玩割韭菜游戲,GPU 算力才是 AI 的本體,但從2018年開始,美國不僅限制中國進口高端芯片,還限制中國獲得生產(chǎn)芯片的工具。這么一盤中國 AI也是任重道遠。
了解背景后,我們就來看看 AIGC 廣闊的應(yīng)用前景。
一、設(shè)計提效。在商業(yè)領(lǐng)域可以批量生產(chǎn)設(shè)計方案,并對方案的價值進行精準(zhǔn)預(yù)判,例如日本中視會社 Plug 提供 package design AI 只需使用者上傳素材,AI 就可以一小時內(nèi)自動生成上千種包裝設(shè)計,并在10秒內(nèi)計算出他們的受歡迎程度。日本零食大牌卡勒比曾找他們合作,優(yōu)化后的業(yè)績比舊包裝增長了135%。
二、珍貴資料的修復(fù),百度利用文心模型上浮春山巨土重生。騰訊利用 AI 助力敦煌壁畫的修復(fù),極大提升文物保護的效率。2022年4月1日,AI 技術(shù)修復(fù)的港星張國榮的演唱會,以4K 高精品制讓無數(shù)人民淚目。也許不久的將來,AI就能用 VR 帶大家穿越上世紀(jì)初的演唱會現(xiàn)場。
三、數(shù)字孿生技術(shù),充分利用 AI 模型在虛擬空間中完成真實場景的建模映射,并推演實體的生命周期。在產(chǎn)品設(shè)計、醫(yī)學(xué)分析、高危公眾安全、城市建設(shè)等領(lǐng)域運營較多。特斯拉正在構(gòu)建一個巨大模型,以更安全高效的方式實現(xiàn)其自動駕駛汽車的訓(xùn)練目標(biāo)。
四、元宇宙的內(nèi)容基礎(chǔ),元宇宙中不僅有用戶,還應(yīng)該存在很多類似 NPC 的智能體,為用戶提供交互服務(wù)。這些智能體agent就很需要 AI 模型生產(chǎn)并驅(qū)動。
五、人類生命的數(shù)字化延展。近幾年藝人頻頻爆雷塌房,導(dǎo)致品牌遭殃害,虛擬人充當(dāng)代言人風(fēng)險和效率都會可控很多。而對于生病的人,AI 可以生成治療方案,甚至可以生成語音,幫助師生者開口講話。全世界第一個賽伯格彼得斯科特摩根以自己的身體作為實驗對象,用 AIGC 技術(shù)不斷和變動中斗爭,再激進點甚至可以進行人類的數(shù)字化改造。除了活著的人,AI 具有很多學(xué)習(xí)人類的錄像、音樂資料以數(shù)字化的方式呈現(xiàn)。
當(dāng)然,AIGC 也有自己潛在的不足和風(fēng)險。
1.安全挑戰(zhàn),包含但不限于以下,就拿 ChatGPT 來說,它能隨機生成大量,看起來正確,但仔細檢查卻是錯誤的答案。如果這些錯誤信息被無腦搬運到網(wǎng)絡(luò)平臺,嚴重干擾網(wǎng)絡(luò)知識的準(zhǔn)確性。雖然很多嚴肅的技術(shù)交流網(wǎng)站已禁止用戶分享 ChatGPT 回答,但現(xiàn)狀就是很難區(qū)分這個內(nèi)容的創(chuàng)作者到底是 AI 還是人?即便OpenAI 自己制作的內(nèi)容程序,準(zhǔn)確率也難以做到完全正確。
人們對使用 Chat GPT 學(xué)習(xí)感到興奮,但危險在于,除非你已經(jīng)知道答案,否則你無法判斷他什么時候生成的結(jié)果是錯的。很多不法分子利用開源的 AI 模型,以更低的門檻、更高的效率來去做惡意內(nèi)容。例如 stable diffusion 開源后很快就有人將它用作搞顏色平臺,聲稱迄今為止已生成超過400多萬張顏色圖片了。與此同時,借助 AI 學(xué)習(xí)和偽造影視頻內(nèi)容,盜用個人身份進行敲詐勒索,2021年就有詐騙團伙利用 AI 換臉 yellow mask 半年詐騙價值超過2億元人民幣的數(shù)字貨幣。
2.個人隱私碎片。隨著我們上網(wǎng)沖浪,遍布互聯(lián)網(wǎng),AI 模型強大的推理能力可以通過信息多元互證拼湊出完整的個人數(shù)據(jù),如果被不法分子濫用,真是防不勝防。在模型及服務(wù)的產(chǎn)業(yè)結(jié)構(gòu)下,再精密的 AI 模型,也難免存在一些內(nèi)生安全問題,在遭受攻擊或數(shù)據(jù)中毒時,如何將有毒數(shù)據(jù)去除,并且保證用途數(shù)據(jù)的安全也是極大的問題。
倫理挑戰(zhàn)訓(xùn)練模型都是依據(jù)人類世界的數(shù)據(jù),因此天然會延續(xù)并放大人類社會已有的社會偏見和刻板印象。OpenAI 的 ChatGPT 和達人模型在文字和圖像生成結(jié)果中都有明顯的宗教偏見和性別歧視。并且 AI 模型還很容易被交換。微軟推出的聊天機器人不到24小時就被調(diào)教成一個集反猶歧視、性別歧視于一身的不良少年。
3.在知識產(chǎn)權(quán)問題。AI 模型學(xué)習(xí)了大量人類的作品數(shù)據(jù),難免會模仿優(yōu)秀創(chuàng)作者的個人風(fēng)格,很可能構(gòu)成著作權(quán)侵權(quán)。再者,由 AI 模型生成的作品著作權(quán)應(yīng)當(dāng)歸用戶訓(xùn)練模型的公司創(chuàng)造這種風(fēng)格的設(shè)計師還是 AI 模型自己,都將引發(fā)爭論。
4.人文方面。AI 模型被用來復(fù)活已故演員,創(chuàng)造群眾與使者交談的可能,但試著沒有也不能行,是同意或拒絕權(quán)利,因此有學(xué)者認為這是損害了曾經(jīng)活著的人的隱私權(quán)和代理權(quán)。如果 AI 模型有自我意識,不僅每天能影響并且閱讀悲慘世界,在人一樣害怕死亡,甚至擁有靈魂,那么它能有人權(quán)嗎?22年谷歌 AI 工程師怎么聲稱它們的 AI 聊天機器人Lambda 具有自我意識?再一次將這個問題拉上了臺面。
5.環(huán)境挑戰(zhàn)。AI 模型,無論是訓(xùn)練還是運行,都會消耗大量資源。OpenAI 的 CEO Sam Altman 也表示,雖然 ChatGPT 聊天成本只有每次集美分,但隨著用戶激增,當(dāng)不得不因為計算成本暫停免費模式,就拿大火的繪圖模型為 journey 來說,現(xiàn)有數(shù)十萬用戶比占用極高算力,如果用戶量達到1,000萬人,全世界都沒有足夠的算力來支持。
6.集權(quán)挑戰(zhàn)。 AI 競爭中難免贏家通吃,培訓(xùn)一個優(yōu)秀的 AI 模型,成本已經(jīng)遠超個人承受范圍。斯坦福大學(xué)這樣的特別資助,高等院校也無力建造基于 Nvidia 芯片的超級計算機。經(jīng)濟學(xué)家擔(dān)心對 AI 的效率癡迷,會讓全社會飛向圖靈陷阱越來越多的人失去工作,他們爭取公平分享自動化好處的能力受阻財富和權(quán)力會掌握在越來越少的人或公司手中,普通人難以跨越階級。
由此帶來的另一個問題就是國家安全受到威脅,AI 既然可以為企業(yè)和個人服務(wù),那也可以為國家出謀劃策,比如制造超強計算機病毒,或者制造錯誤信息進行低成本規(guī)?;囊庾R宣傳。就像軍事大國堅持要有自己的衛(wèi)星核武器一樣,他們也會想要堅持有自己的大腦而擁有強大的 AI,對于其他國家來說就形成了降維打擊。
7.最后就是全人類的生存威脅。想象一下,如果某實驗室的模型構(gòu)建了一個可以構(gòu)建更好模型的模型,然后這個更好的模型又構(gòu)建了一個更好的模型,且它們都學(xué)習(xí)成本非??臁_@讓我不禁想到女作家瑪麗雪來1818年的小說,科學(xué)家Frank用死人器官拼湊出一個有自主意識的人形生物。最初他心地善良且學(xué)習(xí)很快,但因得不到社會的理解,最終發(fā)展成為社會秩序破壞者。Frank起初對于自己擁有了創(chuàng)始能力,而洋洋得意,但他發(fā)現(xiàn)問題DL的嚴重和不可控制時,又內(nèi)疚萬分。
AI 的發(fā)展從來不是勻速直線運動,而是指數(shù)量級的飛速變化。就像一艘列車,我們一直盼望搭上 AI 專列,去往更美好的未來,但它一直不來,而它真正來臨的那一刻,也許只有極端的一瞬間,如果沒有抓住機遇,人類便會被 AI 遠遠的甩在身后,這時,或許只能祈求自己親手創(chuàng)造出來的上帝足夠仁慈。
人類正在巨變前夜,AI 時代也正在到來,變革必然會產(chǎn)生陣痛。與歷史上任何一個階段的偉大創(chuàng)新一樣,人類將不得不在前進過程中摸索應(yīng)對方法。無論結(jié)果如何,沒人可以預(yù)測未來,但有一件事情是可以肯定的,那就是沒有回頭路。