Claude團隊:用400萬條對話分析AI對經(jīng)濟的長期影響
基于400萬條Claude真實對話數(shù)據(jù),Anthropic重磅發(fā)布全新報告!
在今天,哪些職業(yè)用AI最多?他們都用AI干什么?
這些有關(guān)AI在各經(jīng)濟領(lǐng)域應(yīng)用情況的問題,報告用實實在在的統(tǒng)計數(shù)據(jù)全回答了。
這一次,他們不僅推出The Anthropic Economic Index(用來理解AI對經(jīng)濟影響的指數(shù)),還公開了第一篇論文,里面包含大量觀察結(jié)論:
- 目前AI使用場景最多的是軟件和寫作;
- AI應(yīng)用也呈現(xiàn)出“二八定律”,約4%的職業(yè)在75%的任務(wù)中高度使用AI;
- 是否使用AI與經(jīng)濟水平高度相關(guān),中高收入最為普遍,最高和最低都要低得多;
- 當前AI更多承擔(dān)輔助功能,不過自動執(zhí)行任務(wù)已經(jīng)漸趨成熟(43%);
……
與此同時,Anthropic宣布開源上述用于分析的數(shù)據(jù)集,以方便其他研究人員進一步得出發(fā)現(xiàn)。
報告一經(jīng)發(fā)布,迅速引起熱議。
看完上述消息,網(wǎng)友們終于舒了一口氣!
AI對經(jīng)濟的影響,總算不用全靠猜測了。
AI還只是某種選擇而非必需品
還是先來看第一篇公開論文的具體內(nèi)容。
概括而言,通過對Claude平臺400萬+匿名對話數(shù)據(jù)的分析,Anthropic構(gòu)建起了衡量AI在經(jīng)濟活動中使用模式的框架,以此揭示AI在不同任務(wù)、職業(yè)中的應(yīng)用情況,并最終探討了其對經(jīng)濟的影響。
展開來說,如下圖框架所示,研究團隊使用Clio工具(Anthropic開發(fā)的自動化分析工具)對大量對話進行分析,目標是將對話映射到職業(yè)類別上。
由于美國勞工部ONET數(shù)據(jù)庫包含近20,000個獨特的任務(wù)陳述,導(dǎo)致直接分類難度較大,因此研究人員構(gòu)建了一個分層的任務(wù)樹結(jié)構(gòu)。
也就是說,先由Claude篩選出職業(yè)相關(guān)對話,接著借助樹狀搜索,讓Claude依據(jù)對話內(nèi)容從任務(wù)層次結(jié)構(gòu)頂層向下遍歷選擇,最終完成對話與具體ONET任務(wù)的映射。
而根據(jù)上述映射和分析,研究發(fā)現(xiàn)了AI在不同職業(yè)類別中的使用差異。
首先,由于軟件開發(fā)、數(shù)據(jù)分析等工作高度適配AI技術(shù),因此計算機和數(shù)學(xué)相關(guān)職業(yè)的AI使用率最高,占所有查詢的37.2%,整體TOP 6如下:
與之相反,偏傳統(tǒng)的農(nóng)林牧漁行業(yè)與AI最遠。
進一步分析不同職業(yè)的AI使用深度,可以看出,約36%的職業(yè)在四分之一任務(wù)中會使用AI,而僅有約4%的職業(yè)會在四分之三任務(wù)中使用。
換句話說,少部分人大量使用AI,大多數(shù)人采取“適量”姿態(tài),整體上AI還只是一種選擇而非必需品。
其次,收入情況也和AI使用率息息相關(guān)。
數(shù)據(jù)顯示,AI在中高收入的工作中(如程序員)使用最為普遍;低收入(如服務(wù)員)和非常高收入(如麻醉師)的工作中AI使用率則又要低得多,呈現(xiàn)中間多、兩邊少的形態(tài)。
接下來,研究觀察了人們更喜歡與AI協(xié)作,還是讓AI自動化執(zhí)行任務(wù)。
結(jié)果發(fā)現(xiàn)人機協(xié)作仍占據(jù)主位,約占57%;不過以智能體為代表的自動化執(zhí)行也不容小覷,目前已經(jīng)占比43%。
這也意味著,“2025屬于Agents(智能體)”這句話的含金量還在上升。
BTW,Anthropic這次還透露了Claude 3.5 Sonnet和Claude 3 Opus模型之間的任務(wù)使用模式的比較分析。
顯而易見,最新模型Sonnet 3.5被更多用于編碼和技術(shù)任務(wù),而Opus更多用于創(chuàng)意寫作和教育內(nèi)容開發(fā)。
以上為論文主要發(fā)現(xiàn)。另外值得一提的是,官方還特意強調(diào)了分析所存在的局限性。
無法確定所有這些任務(wù)都是在工作中完成;
人們可能從不同途徑使用Claude,(當前僅統(tǒng)計官方平臺)協(xié)同使用這一項可能被低估;
由于Claude不支持圖片生成,可能遺漏部分重要使用場景。
不過接下來,Anthropic將繼續(xù)推進這一研究。對此,他們同步公開了上述分析所使用的數(shù)據(jù)集,并邀請經(jīng)濟學(xué)家、政策專家和研究人員開展合作。
而且還順勢搞了波招聘,為公司社會影響團隊招研究科學(xué)家和研究工程師。
全網(wǎng)催更Claude新模型
除了討論報告本身,保留節(jié)目是,網(wǎng)友們紛紛借此開啟了催更模式。
Sonnet 4怎么還不來??
更有網(wǎng)友犀利辣評,Anthropic將發(fā)布除新模型之外的一切。(doge)
回顧Anthropic更新Claude模型的頻率,不難發(fā)現(xiàn)新模型可能要等到今年上半年。
(表格由AI整理,內(nèi)容經(jīng)過驗證)
更具體的說法,來自創(chuàng)始人Dario Amodei在今年一月底的一次訪談,他透露Anthropic正在開發(fā)一些新的大模型,有望在未來3-6個月內(nèi)發(fā)布。
嗯,保守估算一下,也就是今年5~8月份了。
另外他當時還劇透了,新模型會采取不同于其他公司的策略,讓推理能力與模型的其他能力更加協(xié)調(diào)統(tǒng)一。
正在開發(fā)的還有一個“虛擬協(xié)作者”(Virtual Collaborator)。
這是一個可以在計算機上執(zhí)行各種任務(wù)(如寫代碼、測試、交流、撰寫文檔等)的AI系統(tǒng),用戶可以與它進行長時間的任務(wù)導(dǎo)向交互。
至于圖像和視頻生成則不是Anthropic的研發(fā)重點,未來如果確有必要的話,也會選擇“拿來主義”,與專業(yè)的圖像生成公司合作。
那就狠狠期待一波了~