不要叫我程序員,我是「AI工程師」,馬斯克:開始卷自然語言編程
ChatGPT 出現(xiàn)后,人們預(yù)測「所有行業(yè)都要通過 AI 進(jìn)行重塑」,有些工作會(huì)被代替,也有工作會(huì)改變形式。作為把 AI 造出來的程序員,他們的職業(yè)會(huì)變成什么樣?
最近,事情看起來有了譜,一群工程師和學(xué)者喊出了「AI 工程師」的概念,獲得了眾多響應(yīng):
圖片
由于 GPT-4 等大語言模型展現(xiàn)出的通用化且強(qiáng)大的能力,我們的工作方式或許很快就會(huì)轉(zhuǎn)變成和 AI 協(xié)同工作,跟上人工智能的步伐本身就是一項(xiàng)全職工作。
據(jù)說,這個(gè)「AI 工程師」處于全棧工程師和機(jī)器學(xué)習(xí)工程師之間,占據(jù)后端工程師的一部分,專注于大模型的構(gòu)建?,F(xiàn)在它還處于定義階段,不過看大家熱烈討論的樣子,距離落地應(yīng)該不遠(yuǎn)了,畢竟 ChatGPT 革命的速度就是這么快。
想法一出,AI 領(lǐng)域大 v 們迅速有了點(diǎn)評(píng)。OpenAI 科學(xué)家、前特斯拉 AI 和自動(dòng)駕駛主管 Andrej Karpathy 表示贊同。「大模型創(chuàng)建了一個(gè)全新的抽象和專業(yè)層,到目前為止,我把它稱為『提示工程師』,但現(xiàn)在不止是提示的問題。」
另外他指出四個(gè)要點(diǎn):
- 過去的機(jī)器學(xué)習(xí)工作通常要從頭開始訓(xùn)練算法,而結(jié)果一般性能有限。
- 大模型訓(xùn)練與傳統(tǒng)機(jī)器學(xué)習(xí)有很大不同,前者系統(tǒng)工作量很大,進(jìn)而分裂出一種新角色,專注于在超級(jí)計(jì)算機(jī)上對 Transformer 進(jìn)行大規(guī)模訓(xùn)練。
- 從數(shù)字上看,AI 工程師的數(shù)量可能會(huì)比機(jī)器學(xué)習(xí)工程師 / 大模型工程師多得多。
- 你無需接受任何訓(xùn)練就可以成功擔(dān)任這一角色。
圖片
馬斯克看完以后也說了:
圖片
職位需求大,有重要意義且門檻低,看起來讓人既興奮又焦慮。
在討論中,也有人提出了「認(rèn)知工程師」、「AI 系統(tǒng)工程師」等名稱作為候選,英偉達(dá) AI 科學(xué)家 Jim Fan 認(rèn)為這種新興的職業(yè)應(yīng)該被稱為「無梯度工程師」—— 從傳統(tǒng)工具 1.0,到神經(jīng)網(wǎng)絡(luò) 2.0,再到無梯度架構(gòu)的 3.0,我們終于等來了 GPT 系列自我訓(xùn)練的 4.0 版本。
圖片
對此,威斯康星大學(xué)助理教授 Sebastian Raschka 表示,這僅適用于通用助理,對于大多數(shù)業(yè)務(wù),你也不需要「通用」。
名稱和定義給了很多,讓我們看看這個(gè)「AI 工程師」到底是什么樣的職位?
在基礎(chǔ)模型的突破性能力和開源大模型、API 的推動(dòng)下,我們正在見證應(yīng)用人工智能十年一次的轉(zhuǎn)變。
在 2013 年需要花費(fèi)五年時(shí)間和一個(gè)研究團(tuán)隊(duì)才能完成的人工智能任務(wù),現(xiàn)在只需要 API、文檔和 2023 年一個(gè)空閑的下午即可完成。
圖片
然而,細(xì)節(jié)決定成敗 —— 應(yīng)用和產(chǎn)品化人工智能的挑戰(zhàn)無窮無盡:
- 模型上,有從最大的 GPT-4 和 Claude 模型,到開源的 Huggingface、LLaMA 和其他模型;
- 工具上,從最流行的鏈接、檢索和矢量搜索工具(如 LangChain、LlamaIndex 和 Pinecone)到新興的自主代理領(lǐng)域(如 Auto-GPT 和 BabyAGI);
- 技術(shù)上,每天新提交的論文、模型和技術(shù)的數(shù)量隨著興趣和資金的增加而呈指數(shù)級(jí)增長,以至于了解這一切幾乎已是一項(xiàng)全職工作。
若認(rèn)真嚴(yán)肅地對待此種情況,這應(yīng)該被認(rèn)為是一份全職工作。因此,軟件工程將催生出一個(gè)新的子學(xué)科,專門研究人工智能的應(yīng)用并有效地運(yùn)用新興的堆棧,就像「站點(diǎn)可靠性工程師」(SRE)、「開發(fā)運(yùn)營工程師」、「數(shù)據(jù)工程師」和「分析工程師」的出現(xiàn)一樣。
這個(gè)角色的全新(也是最不令人敬畏的)版本似乎是:人工智能工程師。
我們知道,每家創(chuàng)業(yè)公司都有某種討論 AI 使用的 Slack 頻道,很快這些渠道將從非正式團(tuán)體轉(zhuǎn)變?yōu)檎綀F(tuán)隊(duì)。目前,成千上萬的軟件工程師正致力于生產(chǎn) AI API 和 OSS 模型,無論是在上班時(shí)間還是晚上和周末,在公司 Slacks 或獨(dú)立 Discords 中,這一切都將專業(yè)化并集中在一個(gè)頭銜上:AI 工程師。
這可能是未來十年需求最高的工程工作。
人工智能工程師將隨處可見,從微軟和谷歌等科技巨頭,到 Figma、Vercel 和 Notion 這樣領(lǐng)先的初創(chuàng)公司,獨(dú)立開發(fā)者,如 Simon Willison、Pieter Levels 和 Riley Goodside。他們在 Anthropic 進(jìn)行的工程實(shí)踐,每年可以賺取 30 萬美元,在 OpenAI 構(gòu)建軟件,每年能賺取 90 萬美元。他們利用周末空閑時(shí)間在 AGI House 思考想法,并在 Reddit 的 /r/LocalLLaMA 專區(qū)上分享技巧。
他們的共同點(diǎn)是,幾乎可以在一夜之間就能把人工智能的進(jìn)步轉(zhuǎn)化為數(shù)百萬人使用的實(shí)際產(chǎn)品。而在其中,你看不到一個(gè)博士學(xué)位的頭銜。在交付人工智能產(chǎn)品時(shí),你需要的是工程師,而不是研究人員。
AI 工程師與 ML 工程師的大反轉(zhuǎn)
在 Indeed 網(wǎng)站上的一組數(shù)據(jù)表明,機(jī)器學(xué)習(xí)工程師的職位數(shù)量是 AI 工程師職位數(shù)量的 10 倍,但相比較而言,AI 領(lǐng)域的增長速率更快一些,有預(yù)測認(rèn)為這種比例將在五年內(nèi)發(fā)生反轉(zhuǎn),即 AI 工程師將會(huì)是 ML 工程師的數(shù)倍。
圖片
HN Who’s Hiring(其是 Hacker News 上的一個(gè)月度帖子,它提供了一個(gè)平臺(tái),供雇主發(fā)布招聘信息) 不同類別的月度就業(yè)趨勢
一直以來,關(guān)于 AI 和 ML 之間差異的爭論無休無止,但又小心謹(jǐn)慎。我們也很清楚,職位為普通的軟件工程師完全可以構(gòu)建起 AI 軟件。然而,最近大家又在圍繞另一個(gè)問題展開討論,即在 Hacker News 的一個(gè)熱帖「如何進(jìn)入 AI 工程」引起了大家的廣泛興趣,這則熱門帖子也說明了市場上仍然存在的基本限制原則,對每個(gè)職位的區(qū)分還是很細(xì)的。
圖片
Hacker News 上 2023 年 6 月一個(gè)帖子的截圖:「如何進(jìn)入 AI 工程」的熱門投票答案。
直到現(xiàn)在,還有很多人認(rèn)為 AI 工程是 ML 工程或數(shù)據(jù)工程的一種形式,所以當(dāng)有人詢問如何進(jìn)入某一領(lǐng)域時(shí),他們傾向于推薦相同的先決條件,如在上面的回答中,很多人推薦了吳恩達(dá)(Andrew Ng)的 Coursera 課程。但那些高效的 AI 工程師中沒有一個(gè)人完成過吳恩達(dá)在 Coursera 上的課程,他們也不熟悉 PyTorch,也不知道數(shù)據(jù)湖(Data Lake)和數(shù)據(jù)倉庫(Data Warehouse)之間的區(qū)別。
在不久的將來,沒有人會(huì)建議通過閱讀 Transformer 的論文《Attention is All You Need》來開始學(xué)習(xí) AI 工程,就像你不會(huì)通過閱讀福特 T 型車的設(shè)計(jì)圖紙來開始學(xué)習(xí)駕駛一樣。當(dāng)然,理解基本原理和技術(shù)的歷史進(jìn)展是有幫助的,它可以幫你找到提高思路和效率的方法。但有時(shí)你也可以通過使用產(chǎn)品,以實(shí)際經(jīng)驗(yàn)來了解它們的特性。
AI 工程師與 ML 工程師的反轉(zhuǎn)不會(huì)在一夜之間發(fā)生,對于擁有良好的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)背景的人來說,Prompt 工程和 AI 工程可能會(huì)在很長一段時(shí)間內(nèi)不被看好。然而,隨著時(shí)間的推移,需求和供應(yīng)的經(jīng)濟(jì)規(guī)律將會(huì)占上風(fēng),人們對 AI 工程觀點(diǎn)也會(huì)改觀。
為什么 AI 工程師會(huì)興起?
在模型層面,現(xiàn)在很多基礎(chǔ)模型是少樣本學(xué)習(xí)器,具有很強(qiáng)的上下文學(xué)習(xí)以及零樣本遷移能力,模型展現(xiàn)出來的性能往往超越了訓(xùn)練模型的最初意圖。換句話說,創(chuàng)建這些模型的人并不完全知道模型的能力范圍。而那些非 LLM(大語言模型)專家的人可以通過與模型更多地交互,并將其應(yīng)用于研究所低估的領(lǐng)域來發(fā)現(xiàn)和利用這些能力。
在人才層面,微軟、谷歌、Meta 以及大型基礎(chǔ)模型實(shí)驗(yàn)室已經(jīng)壟斷了稀缺的研究人才,他們提供了「AI 研究即服務(wù)」的 API。你可能無法雇傭這種研究人員,但你可以租用他們的服務(wù)?,F(xiàn)在全球大約有 5000 名 LLM 研究人員、5000 萬名軟件工程師。這一供應(yīng)限制決定了處于「中間」類別的 AI 工程師將會(huì)崛起,從而滿足人才需求。
硬件層面,各大科技公司、機(jī)構(gòu)等大量囤積 GPU,當(dāng)然,OpenAI、微軟是第一個(gè)這樣做的,但 Stability AI 通過強(qiáng)調(diào)他們的 4000 個(gè) GPU 集群開啟了初創(chuàng)公司的 GPU 競爭戰(zhàn)。
圖片
此外,一些新的初創(chuàng)公司開始崛起,如 Inflection(13 億美元)、Mistral(1.13 億美元)、Reka(5800 萬美元)、Poolside(2600 萬美元)和 Contextual(2000 萬美元)已經(jīng)普遍開始籌集巨額種子輪融資,以擁有自己的硬件設(shè)施。
美國科技行業(yè)的高管和投資者 Nat Friedman 甚至宣布了他們的 Andromeda 計(jì)劃,該計(jì)劃是一座價(jià)值 1 億美元、擁有 10 exaflop 計(jì)算能力的 GPU 集群,專門為其投資的初創(chuàng)公司提供支持。在 API 領(lǐng)域的另一側(cè),將會(huì)有更多的 AI 工程師能夠使用模型,而不僅僅是訓(xùn)練模型。
效率方面,與其要求數(shù)據(jù)科學(xué)家、機(jī)器學(xué)習(xí)工程師在訓(xùn)練單個(gè)特定領(lǐng)域模型并投入生產(chǎn)之前進(jìn)行繁瑣的數(shù)據(jù)收集工作,產(chǎn)品經(jīng)理、軟件工程師可以通過與 LLM 進(jìn)行交互,構(gòu)建和驗(yàn)證產(chǎn)品想法。
圖片
假設(shè)后者(數(shù)據(jù)、ML 工程師)的數(shù)量是前者(AI 工程師)的 100 到 1000 倍,而通過與 LLM 交互的工作方式會(huì)讓你比傳統(tǒng)的機(jī)器學(xué)習(xí)快 10 到 100 倍。因此,AI 工程師將能夠以比以往便宜 10000 倍的方式驗(yàn)證 AI 產(chǎn)品。
軟件層面,會(huì)出現(xiàn) Python 到 JavaScript 的變化。傳統(tǒng)上,數(shù)據(jù)和 AI 領(lǐng)域以 Python 為中心,而第一批 AI 工程工具(如 LangChain、LlamaIndex 和 Guardrails)也以 Python 為主。然而,JavaScript 開發(fā)者的數(shù)量至少應(yīng)與 Python 開發(fā)者數(shù)量相當(dāng),因此現(xiàn)在的工具越來越多地向這個(gè)方向擴(kuò)展,從 LangChain.js 和 Transformers.js 到 Vercel 的新 AI SDK。JavaScript 的市場總體規(guī)模的擴(kuò)大和機(jī)遇是令人矚目的。
每當(dāng)一個(gè)有著完全不同的背景、使用完全不同的語言、生產(chǎn)完全不同的產(chǎn)品、使用完全不同的工具的子群體出現(xiàn)時(shí),他們最終會(huì)分裂成自己的群體。
代碼在軟件 2.0 到軟件 3.0 演進(jìn)中的作用
6 年前,Andrej Karpathy 撰寫了一篇非常有影響力的文章,描述了軟件 2.0,將精確建模邏輯的經(jīng)典堆棧手寫編程語言與近似邏輯的機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的新堆棧進(jìn)行對比。文章表明軟件能夠解決更多問題,而這些問題是人類無法建模的。
今年,Karpathy 繼續(xù)發(fā)表文章指出,最熱門的新編程語言是英語,因?yàn)樯墒?AI 的提示可以理解為人類設(shè)計(jì)的代碼,很多情況下是英語,并由 LLM 解釋,最終填補(bǔ)了他的圖表中的灰色區(qū)域。
圖片
注:軟件 1.0(Software 1.0)的經(jīng)典堆棧是用 Python、C++ 等語言編寫的。軟件 2.0 是用神經(jīng)網(wǎng)絡(luò)權(quán)重編寫的,沒有人參與這段代碼的編寫過程,因?yàn)闄?quán)重有很多。
去年,Prompt Engineering 成為一個(gè)流行的話題,人們開始將 GPT-3 和 Stable Diffusion 應(yīng)用于工作。人們嘲笑 AI 創(chuàng)業(yè)公司為 OpenAI 包裝器,并對 LLM 應(yīng)用程序易受提示注入和反向提示工程的問題感到擔(dān)憂。
但 2023 年很重要的一個(gè)主題是關(guān)于重新確立人類編寫的代碼的作用,從超過 2 億美元的巨頭 Langchain 到由英偉達(dá)支持的 Voyager,顯示出代碼生成和重用的重要性。Prompt Engineering 既被過度炒作又具有持久性,但在軟件 3.0 應(yīng)用程序中重新出現(xiàn)的軟件 1.0 范式既是一個(gè)巨大的機(jī)遇,也為大量的創(chuàng)業(yè)公司創(chuàng)造了新的空間:
圖片
隨著人類工程師學(xué)會(huì)利用 AI,AI 越來越多地接手工程工作,未來,當(dāng)我們回頭看時(shí),分辨出兩者之間的區(qū)別已經(jīng)很困難了。