ChatGPT等不會(huì)很快接管人類工作,易出錯(cuò),AI也不會(huì)免費(fèi)打工
ChatGPT 等大模型的相繼發(fā)布,讓很多人倍感壓力,害怕 AI 會(huì)很快接管他們的工作。對(duì)此,OpenAI 也曾發(fā)表過(guò)一項(xiàng)研究,表明 ChatGPT 的影響涵蓋所有收入階層,且高收入工作可能面臨更大的風(fēng)險(xiǎn)。事實(shí)到底如何呢?
我們應(yīng)該將所有的工作,即使是那些令人滿意的工作都實(shí)現(xiàn)自動(dòng)智能化嗎?
這是未來(lái)生命研究所 (Future of Life Institute) 最近提出的幾個(gè)問(wèn)題之一,該研究所呼吁暫停大型人工智能實(shí)驗(yàn),目前埃隆?馬斯克 (Elon Musk) 、Steve Wozniak 和 Andrew Yang 等 1 萬(wàn)多人均已簽署了該倡議。盡管可能有一些炒作的意味,但它聽(tīng)起來(lái)仍十分嚴(yán)重 —— 然而,人工智能究竟如何被用于實(shí)現(xiàn)所有工作的自動(dòng)智能化呢?先不考慮這是否可取 —— 試想,它真的可能嗎?
麻省理工學(xué)院連接科學(xué)研究所研究員 Douglas Kim 表示:我認(rèn)為真正的障礙是,我們從 OpenAI 和谷歌 Bard 看到的通用人工智能功能的涌現(xiàn),與早期互聯(lián)網(wǎng)普遍可用或云基礎(chǔ)設(shè)施服務(wù)可用的情況類似。它還沒(méi)有像提到的那樣,為數(shù)億工作者的普遍使用做好準(zhǔn)備。
即使研究人員也無(wú)法跟上 AI 創(chuàng)新的步伐
Douglas Kim 指出,雖然革命性的技術(shù)可以迅速傳播,但在被證明為有用、易于使用的應(yīng)用程序之前,它們通常無(wú)法得到廣泛運(yùn)用。他指出,生成式 AI 將需要特定的商業(yè)應(yīng)用,才能超越早期采用者的核心受眾。
Augment 公司 AI 負(fù)責(zé)人 Matthew Kirk 也持相似觀點(diǎn):「我認(rèn)為 AI 行業(yè)正在發(fā)生的事情與互聯(lián)網(wǎng)早期發(fā)生的事情類似。當(dāng)時(shí)的互聯(lián)網(wǎng)各種觀點(diǎn)非常混亂,沒(méi)有標(biāo)準(zhǔn)。人類需要時(shí)間和合作來(lái)確定人們遵循的標(biāo)準(zhǔn)。即使是像測(cè)量時(shí)間這樣平凡的事情也非常復(fù)雜?!?/span>
標(biāo)準(zhǔn)化是人工智能發(fā)展的痛點(diǎn)。用于訓(xùn)練模型和微調(diào)結(jié)果的方法是保密的,這使得有關(guān)它們是如何運(yùn)作這一基本問(wèn)題難以解答。OpenAI 一直在吹捧 GPT-4 通過(guò)眾多標(biāo)準(zhǔn)化測(cè)試的能力 —— 但模型是真正理解了測(cè)試,還是僅僅只是訓(xùn)練重現(xiàn)正確答案呢?對(duì)于它能夠處理新奇任務(wù)的能力,這又意味著什么呢?研究人員似乎無(wú)法就此答案達(dá)成一致,也無(wú)法就可能用于得出結(jié)論的方法達(dá)成一致。
對(duì)比 GPT 3.5 和 GPT 4 的標(biāo)準(zhǔn)化測(cè)試成績(jī)圖表
OpenAI 的 GPT-4 可以在很多標(biāo)準(zhǔn)化測(cè)試中取得好成績(jī)。它是真正理解了它們,還是接受了正確答案的訓(xùn)練?
即使可以就標(biāo)準(zhǔn)達(dá)成一致,設(shè)計(jì)和生產(chǎn)廣泛使用在基于 GPT -4 等大語(yǔ)言模型 (LLMs) 或其他生成式 AI 系統(tǒng)的 AI-powered 工具所需的物理硬件也可能是一個(gè)挑戰(zhàn)。Optiver 全球研究基礎(chǔ)設(shè)施負(fù)責(zé)人 Lucas A. Wilson 認(rèn)為,AI 行業(yè)正在進(jìn)行一場(chǎng)軍備競(jìng)賽,以生產(chǎn)出盡可能復(fù)雜的大型語(yǔ)言模型(LLM)。這反過(guò)來(lái)又迅速增加了訓(xùn)練模型所需的計(jì)算資源。
和人類一樣,AI 也不會(huì)免費(fèi)工作
與此同時(shí),開(kāi)發(fā)人員必須找到應(yīng)對(duì)限制的方法。從零開(kāi)始訓(xùn)練一個(gè)強(qiáng)大的大型語(yǔ)言模型(LLM)可以帶來(lái)獨(dú)特的機(jī)會(huì),但這只適用于資金充足的大型組織。實(shí)現(xiàn)一項(xiàng)可以運(yùn)用現(xiàn)有模型的服務(wù)要便宜得多 (例如,Open AI 的 ChatGPT-3.5 Turbo 對(duì) API 訪問(wèn)的定價(jià)約為每 1000 個(gè)英語(yǔ)單詞 0.0027 美元)。但當(dāng)人工智能驅(qū)動(dòng)的服務(wù)變得流行時(shí),成本仍然會(huì)增加。無(wú)論哪種情況,推出可無(wú)限制使用的 AI 都是不現(xiàn)實(shí)的,這將迫使開(kāi)發(fā)者做出艱難的選擇。
Hidden Door,一家通過(guò)構(gòu)建 AI 平臺(tái)來(lái)制作敘事型游戲的初創(chuàng)公司,其首席執(zhí)行官兼聯(lián)合創(chuàng)始人 Hilary Mason 表示:「一般來(lái)說(shuō),依靠 AI 創(chuàng)立的初創(chuàng)公司應(yīng)該對(duì)所有特定供應(yīng)商應(yīng)用程序編程接口(API)的依賴都持非常謹(jǐn)慎的態(tài)度。我們也可以構(gòu)建不必讓 GPU 成為核心的架構(gòu),但這需要相當(dāng)多的經(jīng)驗(yàn)。」
Hidden Door 正在開(kāi)發(fā)用于幫助用戶運(yùn)用人工智能來(lái)制作獨(dú)特?cái)⑹麦w驗(yàn)的軟件。這是一個(gè)用于生成敘事游戲的 AI-powered 屏幕截圖工具。它包括用戶可以選擇的多個(gè) character 和 prompt。
大多數(shù)基于生成式 AI 構(gòu)建的服務(wù)都會(huì)對(duì)每月生成的內(nèi)容量設(shè)有一個(gè)固定的上限。這些專業(yè)服務(wù)費(fèi)用對(duì)于企業(yè)來(lái)說(shuō)可能會(huì)增加成本,從而拖慢人們工作任務(wù)智能自動(dòng)化的步伐。即使是擁有大量資源的 OpenAI,也會(huì)根據(jù)當(dāng)前的負(fù)載限制 ChatGPT 的付費(fèi)用戶:截至本文撰寫時(shí),它所設(shè)置的上限是每 3 小時(shí) 25 次 GPT-4 查詢。因而,對(duì)于任何想要依賴 ChatGPT 工作的人來(lái)說(shuō),這都是一個(gè)巨大問(wèn)題。
AI-powered 工具的開(kāi)發(fā)人員還面臨著一個(gè)和計(jì)算機(jī)本身一樣古老的挑戰(zhàn) —— 設(shè)計(jì)一個(gè)好的用戶界面。一個(gè)能夠完成許多任務(wù)的強(qiáng)大 LLM(大型語(yǔ)言模型)應(yīng)該是一個(gè)無(wú)與倫比的工具,但是如果使用它的人無(wú)從下手,那么它完成任務(wù)的能力就無(wú)關(guān)緊要了。Kirk 指出,雖然 ChatGPT 是易于使用的,但當(dāng)用戶需要專注于特定的任務(wù)時(shí),通過(guò)聊天與 AI 交互的開(kāi)放性可能被證明會(huì)令人無(wú)所適從。
Kirk 說(shuō):「我從過(guò)往經(jīng)歷中了解到,讓工具完全開(kāi)放往往會(huì)給用戶帶去困惑,而非幫助。你可以把它想象成一個(gè)有著無(wú)窮無(wú)盡門廊的大廳。大多數(shù)人都會(huì)困惑重重,手足無(wú)措,呆在原地。我們?nèi)杂兄T多工作要做,來(lái)確定為用戶展示最優(yōu)的那扇門「。Mason 也有類似的觀察,他補(bǔ)充說(shuō):「就像 ChatGPT 主要是對(duì) GPT-3 的 UX 優(yōu)化一樣,我認(rèn)為我們僅僅只是剛開(kāi)始創(chuàng)造出 UI 設(shè)計(jì)中的隱喻,我們還需要在產(chǎn)品中有效地運(yùn)用 AI 模型?!?/span>
訓(xùn)練使用 AI 本身就是一項(xiàng)工作
幻覺(jué)(hallucination),作為 LLM 一個(gè)特殊的問(wèn)題,早已引發(fā)了爭(zhēng)議,它還嚴(yán)重阻礙到了為敏感且重要的工作構(gòu)建 AI 工具的進(jìn)程。LLM 有一種令人難以置信的能力,它可以生成獨(dú)特的文本,講述笑話,編造關(guān)于虛構(gòu)人物的事跡。然而,當(dāng)精確性和準(zhǔn)確性成為任務(wù)的關(guān)鍵時(shí),這個(gè)技能卻變成了一種障礙,因?yàn)?LLM 經(jīng)常會(huì)將不存在的虛假消息來(lái)源或不正確的陳述當(dāng)作事實(shí)。
Kim 表示:在某些受到嚴(yán)格監(jiān)管的行業(yè) (銀行、保險(xiǎn)、醫(yī)療保健),公司的特定職能部門都很難調(diào)和好非常嚴(yán)格的數(shù)據(jù)隱私和防止歧視的其他監(jiān)管要求之間的關(guān)系。在這些受監(jiān)管的行業(yè),你不能讓 AI 犯那種在寫課程論文時(shí)還可以看得過(guò)去的錯(cuò)誤。
企業(yè)可能會(huì)爭(zhēng)先雇傭那些具備 AI 工具專業(yè)知識(shí)的員工。人工智能安全和研究公司 Anthropic 最近因?yàn)橐粍t招聘廣告上了頭條,他們?cè)谡衅敢幻?prompt 工程師和圖書管理員時(shí),注明需要應(yīng)聘者在完成其它本職工作以外,可負(fù)責(zé)建立 “一個(gè)具備高質(zhì)量 prompt 或 prompt 鏈的圖書館,以完成各種任務(wù)”。薪水 17.5 萬(wàn)到 33.5 萬(wàn)美元。
然而,Wilson 看到了有效使用 AI 工具所需的專業(yè)知識(shí)與 AI 承諾提供的效率之間的矛盾。
「如何招聘人才來(lái)從事為 LLMs 提供培訓(xùn)的全新工作,以解放那些早已專注于更復(fù)雜或更抽象工作任務(wù)的員工呢?」Wilson 問(wèn)道。「我還沒(méi)有看到一個(gè)明確的答案?!?/span>
盡管存在這些問(wèn)題,但利用人工智能增強(qiáng)工作仍可能是值得的。計(jì)算機(jī)革命顯然就是如此:盡管許多人需要訓(xùn)練才能使用 Word 和 Excel 工具,但很少有人會(huì)提出打字機(jī)或圖表紙可以作為更好的替代。正如未來(lái)生命研究所的信中所擔(dān)憂的那樣,「我們用自動(dòng)化取代所有工作,包括令人滿意的工作」。雖然這樣的未來(lái)至少還需要半年多的時(shí)間,但人工智能革命現(xiàn)在正在拉開(kāi)帷幕,而且從今天起的十年里,人工智能革命的畫卷將會(huì)不斷展開(kāi)。