1年智能體落地,3年獲普利策獎,6年或引發(fā)危機!Django之父6大預測
AI發(fā)展日新月異,可謂「亂花漸欲迷人眼」,很難預測未來的世界到底如何。
而Web框架Django之父Simon Willison,這一次他走出舒適區(qū),大膽跨界預測未來AI發(fā)展趨勢!
在近日的播客中,他預測了未來1、3、6年不同階段的AI發(fā)展以及可能的結果。
參加完播客之后,Simon Willison把對未來的預測擴展為博客文章。
主要預測如下:
1. 一年內,除了編程和科研智能體,其他智能體難以落地。
2. 三年內,某人將在GenAI工具輔助下,拿下普利策獎;在日常工作,記者熟練利用LLM,處理數據;在個人數據保護上,法律取得實質性進展。
3. 六年后,AI將簡化藝術創(chuàng)作,解放人類的藝術創(chuàng)意。但如果AGI取代大部分人類的工作,可能會引發(fā)大規(guī)模社會動蕩,后果不堪設想。
一年內智能體預測:第一部分
在2024年,Simon評論到「智能體」還沒有真正發(fā)生。
Simon認為,在2025年將看到更多關于智能體的炒作,但結果將讓大多數「智能體」的粉絲感到失望。
在智能體(Agent)上,Simon預見將有大量資金被白白浪費。
「旅行智能體」不會成功
如果問十個人,你會得到十個稍微不同的答案——Simon收集并用AI總結了不同的答案。
鏈接:https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654
為了簡化論證,Simon選了一個他認為不會實現的定義:可以代表用戶去半自主行動的AI助手。
Simon把這個定義稱為「旅行智能體」式的智能體,因為當描述「智能體」時,不知為何,人們總會聯想到預定航班、酒店以及規(guī)劃行程。
讓當前的LLM做出重要決策——比如花錢買什么——是一個非常糟糕的主意。
它們不可靠,但更重要的是,它們太容易受騙了。
如果你給AI助手一張信用卡,并放任它的行動,你要確保,在第一個聲稱提供最佳優(yōu)惠的網站上, 它不會馬上點擊「購買」按鈕!
因為點擊一下「購買」,就能把你的銀行賬戶信息轉給黑客,從而掏空你的「錢包」。
而現在還無法避免這一點。
之所以還沒有看到LLM驅動的智能體,就是因為可靠性。
Simon對這點深信不疑,盡管自從ChatGPT首次發(fā)布以來,這個想法就吸引了大量關注。
接下來的12個月,發(fā)布的模型中,只要有一個能完全避免這一點,Simon都會喜出望外。
因為他認為解決受騙問題非常難,難得出奇。
一年內:編程和科研智能體行得通
Simon相信有兩類「智能體」確實可行,而且事實已經證明它們確實有效。
編程助手
第一類是編程助手——讓LLM寫代碼、執(zhí)行并根據結果修改代碼,不斷循環(huán)。
在2023年3月或4月,Simon第一次看到這種模式:OpenAI用Code Interpreter演示了這一點。
ChatGPT可以利用Python解決問題:它會編寫代碼,并在安全沙箱中(可能是Kubernetes)執(zhí)行代碼,然后根據輸出或錯誤信息判斷目標是否已達到。
這種模式非常好,在2023年初的模型(最初使用的是GPT-4)中效果非常好,今天依然如此。
在同年10月,Claude也發(fā)布了自己的版本(Claude Analysis,使用在瀏覽器中運行的JavaScript),Mistral和Gemini也有類似的功能,還有許多其他工具實現了相同的模式。
科研助手
第二類智能體是科研助手——LLM能夠多次搜索,收集信息,并將其整合成答案或者撰寫報告。
在這一領域,Perplexity和ChatGPT Search已經運作了一段時間,但Simon印象最深刻的是Google Gemini的Deep Research工具。
比如,他向Deep Research提出這樣的問題:
Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。
找到其他的棲息地。
Gemini會起草計劃,利用、谷歌搜索訪問幾十個網站,然后整合報告(并附上重要的引用),描述發(fā)現的內容。
它給出的計劃是:
Pillar Point Harbor是北美西海岸最大的棕色鵜鶘棲息地之一。找到北美西海岸其他大的棕色鵜鶘棲息地。
1. 查找北美西海岸棕色鵜鶘棲息地的列表。
2. 查找關于棕色鵜鶘棲息地及其大小的研究論文或文章。
3. 查找來自鳥類觀察組織或政府機構關于棕色鵜鶘棲息地的信息。
4. 將(3)中找到的棲息地大小與Pillar Point Harbor棲息地的大小進行比較。
5. 查找與棕色鵜鶘棲息地和其種群相關的新聞文章或最新報告。
它挖掘了大量的細節(jié),包括2016-2019年太平洋棕色鵜鶘調查報告中的PDF文件,而Simon最關心的就是這些——其中包含的列表讓他很滿意:
十大超級棲息地(通常棲息超過500只鵜鶘的地方):
- 阿拉米達防波堤(Alameda Breakwater),加利福尼亞州(3,183)
- 支柱點港(Pillar Point Harbor),加利福尼亞州(1,481)
- 東沙島(East Sand Island),俄勒岡州(1,121)
- 阿諾新月州立公園(Ano Nuevo State Park),加利福尼亞州(1,068)
- 薩利納斯河口(Salinas River mouth),加利福尼亞州(762)
- 博利納斯瀉湖(Bolinas Lagoon),加利福尼亞州(755)
- 莫羅巖(Morro Rock),加利福尼亞州(725)
- 莫斯蘭?。∕oss landing),加利福尼亞州(570)
- 克雷森特城港(Crescent City Harbor),加利福尼亞州(514)
- Tomales鳥巖(Bird Rock Tomales),加利福尼亞州(514)
Simon才知道,他所在的支柱點港(Pillar Point Harbor)是第二大棲息地!
對Simon來說,利用當前的LLM,完全可以自己構建科研助手。
它們能夠驅動工具,能提出相對淺顯的研究計劃(尋找新聞文章和研究論文)。而且如果搜索并收集到適當的上下文,它們就能合成合理的答案。
Google尤其擅長此道:他們擁有全球最大的網站搜索索引,而且Gemini模型的上下文可以包含200萬token。
Simon預計Deep Research會越來越好,并且吸引來大量競爭者。
三年后:AI輔助拿下普利策獎
Simon做了一個有點自利(self-serving)的預測:認為三年之內,有人將因由生成式AI工具輔助的調查報道而獲得普利策獎。
但并不是說LLM會寫這篇文章!
他依然認為,讓LLM代替人寫文章,是最無趣的應用之一。
之所以稱這個預測是自利的,是因為Simon希望他能推動這一事件的發(fā)生!
他開源了數據新聞工具套件Datasette,還在不斷增加AI功能。
比如,利用LLM來數據增強;從非結構化文本中,提取結構化數據并轉化為表格。
他的夢想是這些工具——或者類似的工具——能夠被用于獲獎的調查報道。
他之所以選擇三年這個時間,就是因為讓人們普遍了解如何負責任地、有效地使用這些工具,并將應用于實際工作,需要這么長時間。
LLM并不是新聞業(yè)的天然的契合點:記者尋求真相,而LLM通常容易產生幻覺,捏造事實。
但是,記者也非常擅長從不可信的來源中提取有用信息——這也是新聞工作的重要部分。
一下兩個領域,他認為LLM特別適合新聞業(yè):
- 結構化數據提取。如果利用《信息自由法》,成功獲得了1萬份PDF文件,那么需要有人或某些工具來閱讀這些文件,并找到暗藏的故事。而LLM非常擅長處理大量信息,并整理出有意義的內容。它們可以生成線索,幫助找出值得深入調查的故事。
- 編程輔助。編寫代碼、分析數據是現代數據新聞的重要部分——從SQL查詢到數據清理腳本、定制網絡抓取工具或可視化工具,都可以幫助從雜亂的信息中找到有價值的信號。但大多數報社并沒有程序員團隊:Simon認為在三年內,將圍繞這種模式構建足夠強大的工具,能讓非程序員記者在報道過程輕松使用這些工具。
Simon希望他自己能夠開發(fā)這類工具!
所以他對未來三年的具體預測是:有人將憑借少量的LLM輔助贏得普利策獎。
更普遍的預測是:三年后,大多數專業(yè)消息人士將LLM作為日常工作流的一部分,而且使用方式也越來越復雜,但大家卻習以為常、熟視無睹。
三年后:隱私法將落地
另一個三年后的預測涉及隱私立法。
定向廣告和人們粘貼到模型的數據到底會發(fā)生什么,已經引起了人們的杯弓蛇影(往往是有理由的),而且還在不斷增長。
Simon曾寫過,蘋果通過監(jiān)聽手機麥克風來定向廣告,是「無法根除的陰謀論」。
過去, 他也曾寫過關于AI信任危機的文章:許多人拒絕相信模型并不會基于他們的輸入數據進行訓練,而且背后的公司已經反復否認。
他認為,AI行業(yè)本身將從立法中受益匪淺,特別是在明確用戶提交數據訓練方面,而更一般的科技行業(yè),也亟需在數據保留和定向廣告等方面制定更嚴格的規(guī)則。
在未來四年,Simon不指望美國聯邦政府能通過相關立法,但預計,在州級或國際層面,會看到更多具有實際執(zhí)行力的隱私法規(guī)。
Simon希望不要因此產生新一代的cookie同意條款。
六年后的烏托邦:令人稱奇的藝術
對于六年后的預測,Simon選擇了兩個對立的預測,一個樂觀的,一個悲觀的。
他認為六年足夠長,人類會找到利用AI技術的方法,創(chuàng)作出真正偉大的藝術作品。
Simon不認為GenAI用于藝術創(chuàng)作——如圖像、視頻和音樂——能像基于文本的LLM那樣,得到同等的尊重。
生成式藝術工具很有趣,但它們對輸出缺乏精細的控制。
這大大限制了它們的實用性,現在這些工具只能生成一些供個人消遣的內容。
更重要的是,它們缺乏社會認同。整體社會氛圍上,大家對AI生成的藝術觀感不好。許多有才華的藝術家,強烈反對這些工具,甚至在社會中,「AI」這一術語也開始變成某種意義上的貶義詞。
圖像和視頻模型也是AI訓練數據倫理爭論的核心,原因很簡單:未經允許,沒有藝術家愿意看到他們的作品,被用來訓練模型,然后這些模型反過來直接與他們競爭!
Simon認為六年的時間足夠讓這一切塵埃落定——讓社會找到真正提升人類表達方式的可行方法。
讓他興奮的是,真正有才華、有遠見、有創(chuàng)意的藝術家,將利用這六年內演變出的工具,創(chuàng)作出有意義的藝術作品。而且這些工具不可或缺,否則這些藝術就不可能實現。
在播客中,Simon談到了《瞬息全宇宙》(Everything Everywhere All at Once),這部電影贏得了2023年七項奧斯卡獎項。
電影的視覺特效團隊,核心只有五個人。
試想如果能使用六年后才出現的GenAI工具,他們能做出什么樣的作品!
自從播客錄制以后,Simon從Swyx那里了解到,Runway ML已包含在《瞬息全宇宙》的工具集中:
Evan Halleck曾在這支團隊,他利用Runway的AI工具節(jié)省時間,自動化了編輯的繁瑣環(huán)節(jié)。特別是在電影的巖石場景中,他使用Runway的轉描機技術(rotoscoping)快速、干凈地剪輯巖石,同時沙子和灰塵在鏡頭周圍移動。這把原本需要幾天的工作縮短到了幾分鐘。
Simon在播客中預測,使用GenAI工具的電影,將在六年內獲得奧斯卡獎。
這樣看來他已經遲了八年!
六年后的反烏托邦:大規(guī)模社會動蕩
2031年的悲觀預測則是關于「AGI」的,AGI這個術語一直在不斷被重新定義。
此前就有報道,微軟和OpenAI現在將AGI定義為能夠創(chuàng)造1000億美元利潤的系統(tǒng)!
如果假設AGI能夠執(zhí)行目前人類承擔的幾乎全部的崗位,那么很難不看到潛在的負面后果。
奧特曼可能嘗試過全民基本收入。但美國現在連全民醫(yī)保問題都無法解決,更何況全民基本收入!
當大多數工作被機器取代時,很難想象未來的經濟怎么能為大多數人服務。
所以,他為2031年做的悲觀預測是:如果這種形式的AGI到來,那么它將帶來極其糟糕的經濟后果和大規(guī)模的社會動蕩。
他心目中的AI烏托邦是能夠增強當前人類能力的AI工具。
這正是迄今為止利用LLM所做的事。
他理想中的狀態(tài)是這些工具不斷改進,最終使人類能夠完成更加宏偉的工作。
如果有一種AGI能實現這種烏托邦,他愿意全力以赴。
作者介紹
Simon Willison是一位英國程序員,Lanyrd社交會議目錄的聯合創(chuàng)始人,以及Web框架Django的聯合創(chuàng)造者。
2010年末,他作為聯創(chuàng)推出了社交會議目錄Lanyrd,后被收購。
2019年-2020年,他在斯坦福大學擔任約翰·S·奈特研究員(JSK fellow),開始構建服務于數據新聞學的、開源的工具生態(tài)系統(tǒng)。
從2002年,他開始堅持在個人博客上發(fā)表文章。