Sora無法替代人類!亞馬遜工程師斷言:實際工作沖突不可能靠AI解決
這一周,OpenAI視頻AI工具Sora一出現(xiàn),可謂是炸翻了天。
「飯碗保不住了」的恐懼,真實地擊中了許多人。
圖片
不過,亞馬遜的一位工程師Cameron Gould則認為,其實并不必對AI如此懼怕,它并不會導致我們失去工作。
為什么?原因如下。
Prompt的自相矛盾
首先,生成式AI應用在創(chuàng)意內(nèi)容時,生成的一般是圖像、視頻以及一般的非虛構(gòu)內(nèi)容。
給一個生成式AI模型prompt,就像照看一個惡毒的孩子,他的唯一目標,就是通過「從字面上理解你所說的一切」來惹惱你。
你必須用詞準確,不能在不重要的細節(jié)上浪費一個字符,因為這可能就會使結(jié)果向完全不同的方向傾斜。
但是同時,你又需要提供盡可能多的詳細信息,讓模型不會誤解你。
這種自相矛盾的操作,簡直太糟糕了!
跟計算機進行單向?qū)υ?,試圖理解它為什么沒能產(chǎn)生自己想要的結(jié)果,能讓人產(chǎn)生一種連續(xù)3小時撞墻的沖動……
圖片
Gould表示,在自己作為軟件工程師的職業(yè)生涯中,其實已經(jīng)習慣了和計算機的這種單向?qū)υ?,但生成式AI給他的體驗,絕對更糟。
它不是一種可預測的編程語言,擁有冪等的函數(shù)。
圖片
它完全是一個黑匣子,幾乎每次都可以在相同的輸入下,產(chǎn)生完全不同的結(jié)果。
即使在prompt里要求AI要保持一致性,它也未必會聽你的。
市值數(shù)十億的公司,就曾受到這一現(xiàn)實的困擾。
最近,加拿大一家法庭裁定,加拿大航空公司必須向其中一名乘客支付賠償金,因為聊天機器人提供了誤導性建議,導致該乘客為機票支付了近一倍的費用。
圖片
速度確實快,但……
當然,盡管在一致性方面存在缺陷,但生成式AI可以幫我們快速產(chǎn)出東西來。
圖片
比如上面這張圖,就是用生成式AI創(chuàng)建的,只花了幾秒鐘就做出來了。
所以,AI可以讓我們比藝術家出圖的速度更快,這件事是有可能的。
而Sora也讓普羅大眾就可以用比以往快許多倍的方式,生成更復雜的媒體素材。
所以,由于現(xiàn)在一個人可以做幾個人的工作,我們真的不需要那么多的藝術家、軟件工程師、撰稿人了嗎?
不,它的細節(jié)不對
答案并沒有那么簡單。
使用生成式AI創(chuàng)作藝術時,可能你時常會想:「不,這不是我想要的?!?/span>
這也是在論壇上常常出現(xiàn)的觀點。
有人會反駁說:這是因為你的prompt缺乏細節(jié),你需要給出更具體的prompt。
這個觀點確實有道理。
圖片
我們自己的圖片和票房收入超過1億美元的專業(yè)電影,有何不同?
我們自己的個人博客,和專業(yè)的全職作家的博客,有何不同?
我們自己做的游戲視頻標題,和30小時的AAA視頻游戲標題,有何不同?
答案就是細節(jié)。
AI生圖
正是細節(jié),將業(yè)余愛好者和專業(yè)人士區(qū)分開。
如果想使用生成式AI來創(chuàng)作與專業(yè)內(nèi)容一樣令人印象深刻的作品,我們將需要一個包含大量細節(jié)的提示。
此外,還需要大量的試驗和錯誤,才能讓模型產(chǎn)生我們想要的東西。
生成式AI只是一種工具,類似于自動完成、編譯器、拼寫檢查器或任何其他輔助工具。
它不會為你做任何工作,除非是它自己的苦差事。
讓我們回到Sora的例子。
它只能生成無聲的視頻。其中沒有音頻,沒有對話,沒有一個對象可以說話,或者發(fā)出聲音。
圖片
但如果我們想用它拍電影,就需要用它——
生成腳本?
閱讀劇本?
生成視頻以配合腳本?
究竟是現(xiàn)代電影的哪些方面,讓電影變得有趣呢?
突然間,我們就需要集成一堆不同的生成式AI工具,才能完成工作。
當然,OpenAI有一個名為Jukebox的音樂生成工具,它可以在視頻中添加音樂,但卻無法添加對話。
圖片
在一段視頻中,該如何添加對話呢?這項任務聽起來太艱巨了。
我們不僅需要生成一個特定場景的視頻,還需要讓場景中角色的嘴部動作和臺詞保持一致。
此外,視頻生成器還需要知道單詞是怎樣說出的。不僅僅是語氣,還有節(jié)奏。
想象一下,要解決全部這些細節(jié),需要多大的人力才能解決?
細節(jié),變得相當困難。
在每一個步驟的每一個級別上,都有大量會影響實質(zhì)性后果的細節(jié)。
圖片
Gould表示,自己最近讀到一篇非常喜歡的博文《現(xiàn)實擁有驚人的細節(jié)量》。
圖片
現(xiàn)實的細節(jié)是無限的,然而AI模型的token卻是有限的。
它只能帶你走這么遠,之后,我們就需要依靠其他人來完成工作。
目前為止,人類仍然做著最繁重的工作。
圖片
殖民宇宙的一些重要細節(jié)
更少的細節(jié),更多的變化
專注于細節(jié),聽起來實在是太累了。
如果讓你保持簡單,會發(fā)生什么呢?如果你只需要提供很短的描述,只用幾分鐘就可以寫出來?
最終,你會得到多樣化的結(jié)果,大部分與你的想法完全不一致。
你需要在成百甚至上千個結(jié)果中,才能找到你想要的那一個,因為prompt太通用了。
你可能永遠都找不到一個能用的結(jié)果。
如果prompt太簡單,模型天馬行空的想象力,會提供無限的排列供你選擇。
比如輸入這個prompt——「一個男人」,你會得到各式各樣的男人。
圖片
但實際上,我想要的是一個藍頭發(fā)、棕色眼睛、留著小胡子、穿著一件黑色夾克、戴著兜帽的男人。
如果只輸入「一個男人」作為提示,需要多長的時間才能找到確切的輸出呢?
深度和廣度之間有一個平衡點,你可以最大限度地減少你的努力。
這就需要對細節(jié)進行大量批判性思考,并進行大量搜索。
AI不會取代我們
所以,為什么說AI不會取代我們?
因為,企業(yè)并不是為了解決生成圖像、視頻剪輯這類小問題而存在的。
企業(yè)是為利益相關者解決更大型、更復雜的問題。
解決這些問題最困難的部分,就是后勤工作。
解決大型、復雜的問題需要一大群問題解決者的時間和精力,而所有這些問題解決者又需要由其他問題解決者組織起來,以保持事情的進展。
如果隨機抓來兩個人,讓他們自我管理、自我組織工作,很可能他們的標準和時間表會不一致。
如果你要讓他們一起工作,你就得設立標準,讓他們在同樣的時間工作,并且產(chǎn)生相同質(zhì)量的結(jié)果。
凝聚力是一種力量,你需要做一些工作,讓獨立的單位保持一致。
一個團隊單獨運行,可以順利完成任務;但是當我們把多個團隊引入單個環(huán)境中時,就會出現(xiàn)很多沖突。
圖片
多個相互依賴的團隊朝著一個目標努力時,需要一定的凝聚力,才能完成有意義的事。
這項「凝聚力」工作其實很復雜,經(jīng)常需要解決人際沖突,而這些沖突通常是不合邏輯的、情緒化的。
顯然,AI無法解決這種類型的沖突。
總結(jié)來說就是——
- 企業(yè)通過為很多人/企業(yè)解決大問題來賺錢
- 大問題很難解決,因為涉及很多團隊
- 我們需要精心策劃如何統(tǒng)籌這些團隊,來解決人際沖突,并保持凝聚力
- 在解決人際沖突方面,人是最可靠的資源
很顯然,機器人根本無法勝任這些工作,它們的表現(xiàn)會很糟糕。
AI不會搶走你的工作
當我們仔細看一下目前生成式AI的現(xiàn)狀,這個事實是顯而易見的——
目前沒有任何方法,可以讓工作自動化。
提示界面和模型缺乏自主性和批判性思維,導致了關鍵的局限性。
沒錯,生成式AI的確可以讓我們提高工作效率,但也就僅此而已。
圖片
這句話已經(jīng)被越來越多人所贊同:AI不會搶走你的工作。
真正會對你造成威脅的,是會比你更熟練地使用AI工具的人。
生成式AI是幫助你加快速度的絕佳資源,但它不會完全自動化你的工作。
你要做的,就是把它們添加到你的工具箱,熟練地掌握它們。
參考資料: