2023人工智能工程五大新方向
除了LLM的大量增加,AI開發(fā)工具也有了擴(kuò)展。我們來看一下今年AI開發(fā)中的五個關(guān)鍵趨勢。
譯自Top 5 AI Engineering Trends of 2023,作者 Richard MacManus 是The New Stack的高級編輯,專注于Web和應(yīng)用程序開發(fā)趨勢的報道。此前,他于2003年創(chuàng)辦了ReadWriteWeb,并將其發(fā)展成為全球最有影響力的科技新聞?wù)局弧脑缙?..
使用大語言模型(LLM)進(jìn)行應(yīng)用程序開發(fā),是今年技術(shù)發(fā)展中的最大趨勢之一。這始于公司通過 OpenAI 的專有模型使用其 API,但到 2023 年底,有大量不同的 LLM 可供選擇,包括開發(fā)人員可以直接訪問的開源 LLM,而不是依賴 API。
與 LLM 的激增一樣,也有大量用于將 LLM 集成到應(yīng)用中的開發(fā)工具。作為我們查看 AI 工程今年五大關(guān)鍵趨勢的一部分,我們將討論此問題及更多內(nèi)容。
1. AI 工程師的出現(xiàn)
首先也是最重要的,開發(fā)人員現(xiàn)在有了一個新的職業(yè)選擇:AI 工程師。
根據(jù)其主要宣傳者 Shawn " @swyx" Wang 介紹,AI 工程師是“提示工程師”的下一步。今年早些時候,他創(chuàng)建了一個簡潔的圖表,展示了 AI 工程師在更廣泛的 AI 和開發(fā)生態(tài)系統(tǒng)中的位置:
圖片
通過 swyx。
AI 工程師的角色仍然非常新。截至 2023 年底,它意味著使用 LLM 和相關(guān)工具的開發(fā)人員,例如 LangChain 框架和向量數(shù)據(jù)庫。
在 10 月我對 Shawn Wang 在舊金山聯(lián)合主持的AI 工程師峰會上的采訪中,他將 AI 工程師的角色比作是移動專家。
“所以,把AI看作一個平臺,就像移動工程一樣,對吧?就像,你只專注于移動堆棧。我不想碰它,因為移動很復(fù)雜。你參加所有移動會議,了解所有移動技術(shù),還知道爭論。但當(dāng)我需要處理任何移動問題時,我就來找你,你知道如何解決?!?/p>
他補(bǔ)充說,所有開發(fā)人員都應(yīng)該至少了解一下什么是AI工程,就像十到十五年前移動工程變得流行時他們至少了解了移動工程的范圍一樣。
2. LLM堆棧的演進(jìn)
今年AI工程中的一個相關(guān)趨勢是這一新角色的技術(shù)堆棧的出現(xiàn)。關(guān)于堆棧包含什么,有不同的意見,但我喜歡VC公司安德森·霍洛維茨(a16z)的以下圖表:
圖片
對于AI工程師來說,編排層可能是最重要的,因為這是他們的應(yīng)用程序?qū)⑦B接到LLMs的地方。這就是“提示工程”的地方,基本上是一種查詢LLMs的方法,以使這些系統(tǒng)為應(yīng)用程序提供有用的信息。在2023年,類似LangChain和LlamaIndex的工具出現(xiàn),以幫助開發(fā)人員進(jìn)行提示工程和其他LLM集成。
值得注意的是LangChain名稱中的“Chain”一詞,它表明它可以與其他工具進(jìn)行互操作 - 不僅僅是各種LLMs,還有其他開發(fā)框架。例如,今年五月,Cloudflare宣布LangChain支持其Workers框架。
3. 開源LLMs
今年在AI工程領(lǐng)域最具影響力的發(fā)展,可以說是開源LLMs的興起。在OpenAI在11月份幾乎因一場董事會政變而瀕臨崩潰后,擁有選擇的另類、非專有LLMs變得尤為重要。
我與大多數(shù)AI工程師的交流中得知,他們認(rèn)為OpenAI的LLMs仍然優(yōu)于其他LLMs。然而,開源模型正在迅速趕超。Meta于7月宣布的LLama 2目前在斯坦福的HELM(語言模型的整體評估)基準(zhǔn)排行榜上居首。
圖片
LLama 2規(guī)格;來自Meta
當(dāng)Meta在2月份首次宣布LLama時,它以非商業(yè)許可向研究界發(fā)布了模型權(quán)重。而其他強(qiáng)大的LLMs,如GPT,通常只能通過有限的API訪問。
“所以你必須通過OpenAI并訪問API,但你實際上不能,比如說,下載模型或在你的電腦上運(yùn)行它,” Lightning AI 的Sebastian Raschka在五月向我解釋道。“基本上你不能進(jìn)行任何自定義?!?/p>
換句話說,LLama對于開發(fā)人員來說更加靈活。隨著我們進(jìn)入2024年,這對于當(dāng)前LLMs的領(lǐng)導(dǎo)者,如OpenAI和Google,可能具有潛在的顛覆性。
4. 向量數(shù)據(jù)庫
今年在LLM開發(fā)的數(shù)據(jù)方面最大的影響力無疑是向量數(shù)據(jù)庫的使用。
微軟將向量數(shù)據(jù)庫定義為“一種將數(shù)據(jù)存儲為高維向量的數(shù)據(jù)庫類型,這些向量是特征或?qū)傩缘臄?shù)學(xué)表示。” 數(shù)據(jù)以一種稱為“嵌入”的技術(shù)存儲為向量。
在今年早些時候的《The New Stack》上的一篇投稿中,Mark Hinkle使用倉庫的類比來解釋向量數(shù)據(jù)庫的用例?!跋胂笠幌?,將向量數(shù)據(jù)庫視為一個巨大的倉庫,而AI則是熟練的倉庫管理員,” Hinkle寫道?!霸谶@個倉庫中,每個物品(數(shù)據(jù))都存儲在一個箱子(向量)中,整齊地組織在多維空間的貨架上?!?然后,AI可以根據(jù)它們的相似性檢索或比較物品。據(jù)Hinkle稱,向量數(shù)據(jù)庫“非常適用于推薦系統(tǒng)、異常檢測和自然語言處理等應(yīng)用?!?/p>
像Pinecone這樣的新型數(shù)據(jù)庫解決方案或Chroma等開源項目在今年在向量數(shù)據(jù)庫領(lǐng)域開辟了有利可圖的市場。但市場上現(xiàn)在有許多向量數(shù)據(jù)庫的選擇,包括一些現(xiàn)有的數(shù)據(jù)庫公司為其產(chǎn)品添加這一功能。例如,Redis在其Redis Enterprise產(chǎn)品中提供了向量數(shù)據(jù)庫功能。
5. AI代理
也許在AI工程領(lǐng)域最具爭議的趨勢之一就是AI代理軟件,比如AutoGPT,該軟件于三月底發(fā)布。AI代理是使用LLMs執(zhí)行各種任務(wù)的自動化軟件片段。
十月份的AI工程師峰會上,我感覺到一些演講者對這些自動化代理的能力過于自信。也許甚至有些傲慢,因為代理的一般理念似乎是將人類排除在外。但如果你曾經(jīng)與銀行或電話公司等機(jī)構(gòu)的自動聊天機(jī)器人打過交道,有可能你希望在聊天的另一端是一個人類。
Voxel51的機(jī)器學(xué)習(xí)工程師Jacob Marks在LinkedIn的一篇文章中這樣表達(dá):“AI代理遠(yuǎn)未達(dá)到其充分潛力。部分原因是很難為這些代理創(chuàng)建健壯的評估。AutoGPT正經(jīng)歷重大波動。”
也許2024年是Auto-GPT和其他AI代理軟件嶄露頭角的時候。但目前,正如OpenAI聯(lián)合創(chuàng)始人Andrej Karpathy在四月警告的那樣,風(fēng)險在于AI代理可能“失控”。
結(jié)論
在AI工程領(lǐng)域,這一年是創(chuàng)新的繁忙之年。盡管存在明顯的問題,無論是技術(shù)上的(見AI代理)還是商業(yè)上的(見OpenAI董事會),我們可以期待來年生成式AI方面取得更大的進(jìn)展。OpenAI正受到Meta和Google等公司的積極挑戰(zhàn),所有跡象都表明底層技術(shù)將繼續(xù)飛速改進(jìn)。就在這周,Google發(fā)布了Gemini,聲稱在大多數(shù)測試中勝過了ChatGPT。對于LLM霸權(quán)的爭奪將持續(xù)到2024年。
此外,LLM應(yīng)用生態(tài)系統(tǒng)可能會成熟,像LangChain和Pinecone這樣的年輕公司不斷擴(kuò)張。明年我們可能還會看到政府介入進(jìn)行監(jiān)管,因此一切可能并不會一帆風(fēng)順。
無論2024年會帶來什么,202年對于AI工程領(lǐng)域來說都是一個狂野的一年 — 也許會被記為互聯(lián)網(wǎng)歷史上的一個關(guān)鍵時刻。