GenAI如何影響現實世界的人類工作
對于生成式人工智能(GenAI)取代人類工作的潛力,人們一直存在很多恐懼、不確定性和懷疑。大型語言模型(LLM)在提示時回答問題和處理數字任務的能力引起了人們的注意,無論是好是壞。但LLM取代人類員工的可能性有多大?Indeed的一項新研究揭示了這個問題。
求職網站Indeed最近進行了一項測試,以確定LLM在處理基本工作技能方面的效果。Indeed招聘實驗室注冊了OpenAI最新的LLM項目GPT-4o,并要求它執(zhí)行Indeed數據庫中追蹤的2800多種工作技能,從賬戶管理和保險索賠等辦公室工作,到公交車司機和廚師等偏重體力的工作。
對于每一項工作技能,Indeed招聘實驗室設置了一種方法來衡量LLM任務完成程度。他們?yōu)槊總€任務創(chuàng)建了復雜的1000字提示,這需要大量的試驗和錯誤。在最終確定最佳提示后,招聘實驗室的工作人員將該提示用GPT-4o運行了15次,然后匯總結果。GPT-4o被要求在每個提示下評估自己的能力,最終結果由人類研究人員驗證。
招聘實驗室將實驗重點放在三個主要領域,包括GenAI提供與該技能相關的理論知識的能力;GenAI使用技能解決問題的能力;以及GenAI在使用該技能中的重要性的確定。GPT-4o以五分制分析了自己在給定作業(yè)中利用這些屬性的能力。研究人員將結果制成表格,并于上周發(fā)表在一篇名為《工作中的人工智能:為什么GenAI更有可能支持員工而不是取代他們》的論文中。
這個標題是對Indeed在GenAI實驗中一個很大發(fā)現。該報告的作者Annina Hering和Arcenis Rojas寫道,在2800項人類工作技能中,沒有一項“很可能”被GPT-4o或任何其他LLM所取代。事實上,Indeed發(fā)現近69%的技能“不太可能”或“非常不可能”被GenAI取代。
顯然,需要動手執(zhí)行或應用體力的工作,如公共汽車司機或急診室護士,不會被GenAI取代(自動駕駛公共汽車和機器人輔助手術正在發(fā)展,但它們也需要更多的技術,而不僅僅是GenAI)。考慮到這份報告中涉及的一半以上的工作需要某種形式的體力勞動, GenA I完全取代人類的前景看起來相當渺茫。
但這并不是說沒有好處。Hering和Rojas寫道,即使是公交車司機或護士這樣的工作,GenAI也可以幫助完成其中重復性的任務,比如文件編制,這將“讓員工重新專注于這些角色所需的核心技能”。
研究人員得出的結論是,“隨著GenAI的不斷改進,如果工作場所和/或工作規(guī)范發(fā)生某些變化”,大約29%的工作崗位“有可能”被GenAI取代。研究人員寫道,GenAI影響最大的工作是“更為刻板的辦公室工作”。
橫跨三個領域的研究核心——理論知識;解決問題;以及物理工作技能——GenAI最擅長的是理論知識,其次是解決問題的能力。事實上,理論知識是GenAI給自己5分的唯一屬性,這是最高分,這要歸功于LLM對網絡上大量信息的廣泛培訓,以及使用搜索引擎的能力。
GPT-4o在解決問題方面得分也不錯。在評估的70%的技能中,它給自己打了3分,在其中28%的任務中,它表示自己“有可能”取代人類。它也得到了幾個45分,并認為自己“很可能”取代人類完成3%的任務。
人工智能最有可能在辦公室工作和主要在計算機上完成的工作中取代人類。例如,研究人員得出的結論是,GenAI“有可能”或“很有可能”取代人類,取代軟件開發(fā)工作崗位上超過71%的常見技能。同樣,報告稱,在典型的會計職業(yè)中,GenAI “有可能”或“有可能”取代人類掌握78%的技能。
在需要解決更多問題而不是理論知識的工作中,GenAI不太可能取代人類。這是GenAI開發(fā)人員和數據科學家可能希望集中精力的領域。“如果GenAI模型在更多的工作中提高了解決更多技能問題的能力,那么在這些工作中,最終可能被取代的技能比例也會上升?!?/span>
公司可以做一些事情來幫助他們?yōu)镚enAI做準備。例如,在會計領域,對電子記錄保存和數字化的投資將大大有助于公司成功使用GenAI。
微調一個人與GenAI的互動也可以產生更好的結果。例如,一個松散的提示符可以被LLM以多種方式解釋,每次被問到它時,它可能會給出不同的答案。更高級的任務將需要更好的快速寫作和快速工程技能,才能最大限度地利用GenAI。
GenAI似乎至少會取代人類工人現在所做的一些任務,隨著行業(yè)和職位的不同而有很大的變化。然而,Indeed的研究人員并不認為GenAI在不久的將來會大規(guī)模取代人類,原因很簡單,因為目前的GenAI沒有人類就無法運作?!凹词笹enAI進化并學會完成要求苛刻的任務,監(jiān)督、指導和糾正GenAI輸出的人類也不會輕易被取代?!?/span>