ChatGPT分享-如何開發(fā)一個LLM應用
1?背景?
ChatGPT引起巨大的業(yè)界震撼,各行各業(yè)都在討論大語言模型、通用人工智能。AI經(jīng)歷了五十多年的發(fā)展,現(xiàn)在正處于產(chǎn)業(yè)結(jié)構(gòu)水平化發(fā)展的關鍵時期。這一變化源于NLP領域范式的轉(zhuǎn)變,從“預訓練+微調(diào)”向“預訓練、提示、預測”模式演進。在這一新模式下,下游任務適應預訓練模型,使得一個大型模型能適用于多個任務。這一變化為AI產(chǎn)業(yè)的水平化分工奠定了基礎,大型語言模型成為基礎設施,Prompt Engineering公司層出不窮,專注于連接用戶和模型。AI產(chǎn)業(yè)的分工初步形成,包括底層基礎設施(云服務商)、大型模型、Prompt Engineering平臺和終端應用。隨著AI產(chǎn)業(yè)變革,開發(fā)者可以充分利用大型語言模型(LLM)和Prompt Engineering來開發(fā)創(chuàng)新應用。
2Prompt-Ops下的應用
目前要開發(fā)一個基于LLM的應用,我們面臨最大的工程上的問題是什么?
- 大語言模型不能聯(lián)網(wǎng),無法獲取最新的信息
- 大語言模型沒有我們私有的數(shù)據(jù),無法回答垂直方向的問題
- 大語言模型的開放API(text-davinci-003)沒有像ChatGPT那樣優(yōu)秀的上下文能力
- 大語言模型無法驅(qū)動其他工具。
2.1 Langchain等工程框架解決了這些工程上的問題
以Langchain為例簡單來說:LangChain是 LLM 底層能力的封裝,是一種 Prompt Engineering或者說是Prompt-Ops。
- 它可以接入各種不同LLM的服務,抽象了各種大語言模型的調(diào)用
- 它可以創(chuàng)建各種PromptTemplate,實現(xiàn)定制化的Prompt模版
- 它可以創(chuàng)建鏈來組合調(diào)用PromptTemplate
- 它可以通調(diào)用各種工具,實現(xiàn)GPT-3目前不擅長的事情,比如搜索/數(shù)學/鏈接私有數(shù)據(jù)庫/Python代碼
- 它可以使用代理, 驅(qū)動LLM 來確定采取哪些行動以及采取何種順序。動作可以是使用工具并觀察其輸出,也可以是返回給用戶。
- 它可以通過它的Memory模塊,來實現(xiàn)對話歷史的建模。
2.2 一些Langchain的開發(fā)例子
2.2.1 結(jié)合搜索的GPT
這是一個用ChatGPT和LangChain開發(fā)的Demo對比的例子,輸入的都是“誰是周杰倫的老婆?她當前的年齡乘以0.23是多少?”??梢钥闯鯟hatGPT或者GPT-3.5因為沒有搜索能力,回答的結(jié)果是錯誤的。右邊用LangChain結(jié)合OpenAI的GPT-3.5的API則輸出了正確的結(jié)果,他會逐步去搜索獲得正確信息,得出正確結(jié)果,而且中間的過程是框架自動處理的,我除了輸入問題沒有其他操作。
2.2.2 將自然語言轉(zhuǎn)為Python代碼并自行糾錯
這是一個非常令人震驚的例子,在這個流程中,它自己發(fā)現(xiàn)函數(shù)未定義的報錯并自行糾正。
2.2.3 使用GPT-3 + Statmuse + Langchain查詢NBA數(shù)據(jù)
Fuzzy API composition: querying NBA stats with GPT-3 + Statmuse + Langchain
使用Langchain與體育數(shù)據(jù)搜索網(wǎng)站相結(jié)合,提問復雜的數(shù)據(jù)問題并得到準確的回復。例如:“波士頓凱爾特人隊在這個 2022-2023 賽季的 NBA 賽季場均防守得分是多少?與他們上賽季的平均水平相比,百分比變化如何?”
2.2.4 連接Python REPL打開瀏覽器播放音樂
一個蠻科幻的場景,我用Langchain接入了Python REPL工具,輸入“給我放一首歌”,它導入了webBrowser包,調(diào)用代碼打開了瀏覽器,給我播放了一首 《never gonna give you up》
2.2.5 連接私有數(shù)據(jù)
連接私有數(shù)據(jù)對第三方企業(yè)做LLM應用來說非常重要。下面舉幾個例子
- LangchainJs的文檔,結(jié)合了Langchain:AI-powered search for LangchainJS Documentation,你可以直接問文檔內(nèi)容、技術細節(jié)。
- 數(shù)據(jù)庫產(chǎn)品 Supabase也做了同樣的事情,將自己的文檔與ChatGPT相連接,使得開發(fā)者可以很方便的詢問/查找自己遇到的技術問題。https://supabase.com/docs
- 政府信息問答的一個例子:Co-pilot for government
法律公文和政策條款一般都非常復雜繁瑣,這個demo中將舊金山政府的信息用Langchain與GPT結(jié)合,做到詢問其中細節(jié)能獲得準確回復的效果。
2.3 結(jié)合私有數(shù)據(jù)問答
LLM應用與私有數(shù)據(jù)交互非常重要,我看到無數(shù)人在問一些ChatGPT無法回答的問題了:問認不認識誰、問自己公司業(yè)務細節(jié)、問各種可能不包含在預訓練數(shù)據(jù)集里的東西。這些都已用Langchain和LlaMaIndex來解決。試想一下,將私有數(shù)據(jù)與LLM相結(jié)合,將改變數(shù)據(jù)原有的訪問方式,通過問答能很自然地獲取到自己需要的信息,這是比當前的搜索/打標分類都要高效的數(shù)據(jù)交互方式。
2.3.1 如何構(gòu)建一個基于私有數(shù)據(jù)的LLM問答系統(tǒng)
向量數(shù)據(jù)庫現(xiàn)在看起來是構(gòu)建LLM App中很關鍵的一個組件。首先 LLM 的預訓練和微調(diào)過程不可能包含我們所期待的私有數(shù)據(jù),因此如何將LLM關聯(lián)到私有數(shù)據(jù)成為一個很關鍵的需求。而且LLM的“接口”-自然語言通常不是像Key-Value的映射那樣精確地。而且在這一階段我們希望LLM去理解我們的知識庫,而不是簡單的在其中搜索相同的字符串,我們希望詢問關于我們知識庫的細節(jié),并給出一定理解后的答案(以及來源),這樣匹配向量這樣的搜索方式是一個非常合適且關鍵的解決方案。還有一個關鍵點是,LLM在每次調(diào)用是按token計費(即文本量),并且目前的接口的上下文有著4096 tokens的限制。,因此面對龐大的數(shù)據(jù),我們也不可能將所有的數(shù)據(jù)一次性傳給LLM。因此才有了第一張圖那個流程圖的結(jié)構(gòu)。本地預先將我們私有的數(shù)據(jù)轉(zhuǎn)成向量存在Qdrant里,用戶問答時,將用戶的問題轉(zhuǎn)為向量,然后去Qdrant里進行搜索(相似性匹配)得到Top K個結(jié)果,然后將這些結(jié)果(注意這里的結(jié)果已經(jīng)是自然語言了)傳給LLM進行總結(jié)輸出。
2.3.2 結(jié)合私有數(shù)據(jù)問答的抽象流程
這里使用Langchain社區(qū)博客的流程圖為例
私有數(shù)據(jù)分割成小于LLM上下文的分塊,創(chuàng)建向量后存入向量數(shù)據(jù)庫
將問題計算向量后在向量數(shù)據(jù)庫進行相似性搜索,算出相關性較高的top k個結(jié)果后拼接prompt送往LLM獲得答案。
2.3.3 重要組件
- OpenAI Ada模型:text-embedding-ada-002模型可以快速編碼一個1536維的向量,我們可以使用這個向量來計算文本之間的相似性。
- Langchain / LLamaIndex:Langchain包含多種文本拆分器與文檔連接器,方便將文件進行拆分并且在向量數(shù)據(jù)庫中索引;LlamaIndex 可以從向量存儲加載數(shù)據(jù),類似于任何其他數(shù)據(jù)連接器。然后可以在 LlamaIndex 數(shù)據(jù)結(jié)構(gòu)中使用此數(shù)據(jù)。
- 向量數(shù)據(jù)庫,選型比較多:Chroma / FAISS / Milvus / PGVector / Qdrant / Pinecone等等。
2.3.4 OpenAI私有部署與成本的問題
再來聊聊最近那個OpenAI私有部署的新聞,如果用Langchain來做鏈接,面對龐大的私有數(shù)據(jù),用一個embedding模型(OpenAI的ada)計算輸入問題向量,用Qdrant等向量數(shù)據(jù)庫來管理私有數(shù)據(jù)的向量和向量搜索,用Langchain來做中間的鏈接雖然可以解決問題,但是token的消耗卻是不容忽視的成本問題。私有部署+微調(diào)可能能解決大部分前面提到的問題??赡苁怯绣X大公司用Model instance和fine-tuning,小公司獨立開發(fā)者用Langchain等框架。更未來OpenAI的LLM服務能力外溢,可能不需要Prompt了,甚至把Langchain的功能都能包括了,LLM應用的開發(fā)接入也許只需要一個接口調(diào)用。
2.4 2023年的LLM應用技術棧
2023 用來簡單搭建 AI Demo 的最新技術棧:
- 托管: Vercel
- 前端: Next.js
- 后端: Vercel with flask
- 數(shù)據(jù)庫: Supabase
- AI 模型: OpenAI / Replicate / Hugging Face
- LLM框架層: LangChain / LLaMaIndex
- 向量存儲/搜索: Pinecone / FAISS
2.5 Prompt-Ops 目前最大的問題
一些關于 Langchain 這類Prompt-Ops這類工具的反對觀點:stream.thesephist.com主要問題是在這類工具/框架,將自然語言作為代碼和LLM的連接,使用非確定性語言本身作為控制流,有點瘋狂。而且本身評估模型輸出效果現(xiàn)在是個很麻煩的事,沒有很好的解決方案,很多都是維護一個巨大的電子表格,靠人去評估。(也有用LLM評估LLM的方案,還比較早期)所以要投入生產(chǎn),真實面對用戶而不是作為twitter演示可能還有很多工作要做。
詳細說說測試環(huán)節(jié)面臨的巨大挑戰(zhàn)。假如你的產(chǎn)品有一套研發(fā)階段效果很好的prompt,交給測試后,可能測試上百條上千條就能看出問題了。由于效果無法保證,真正推出給c端用戶會面臨很大的挑戰(zhàn)。而且沒有用微調(diào)服務或者model instance的話,如果OpenAI更新了模型,你的生產(chǎn)環(huán)境的prompt可能需要全部重新測試一下效果。你的prompt也需要和代碼一樣按版本來管理,不管有沒有prompt變更,每個版本上線前都需要進行回歸測試。沒有好的自動化評估方案的話,大量的case都需要測試人工來看會耗費非常多的人力。
結(jié)合私有數(shù)據(jù)的LLM應用目前開發(fā)起來在工程上已經(jīng)有很多不錯的方案了,很容易跑出效果不錯的demo,但還是需要非常謹慎對待這樣一種應用。畢竟我們不只是要做一個在社交媒體或者Leader面前演示的項目。提供給用戶輸入的是一個對話框,自然語言寬泛到即使你測試上萬條結(jié)果也可能出現(xiàn)意想不到的結(jié)果,畢竟像new bing和chatGPT這樣的產(chǎn)品也會被Prompt Injection。面對這種不確定性,工程上如何去避免,測試如何去覆蓋都是一個成熟產(chǎn)品待解決或者說還有很多工作可以做的問題。
但我覺得也不必完全否定這類Prompt-Ops工具/框架,畢竟現(xiàn)階段確實能做出很多不錯的demo來驗證想法。
3未來可能的一些產(chǎn)品形態(tài)
聊聊ChatGPT API開放后LLM應用可能的形態(tài)。
- 對話聊天,是最直觀的應用方式,在API上做好對話歷史的管理。
- 虛擬角色聊天,在基礎對話聊天上,對API的prefix_message上做一些角色定義的prompt,可以實現(xiàn)類似Character.ai的效果。更深入可能是作為游戲角色、虛擬人、XR助手等。
- 類似Notion的文本輔助撰寫工具,目前Notion、FlowUs都做了類似的應用。未來各家社區(qū)的發(fā)布器集成也是一個趨勢,減低用戶發(fā)布門檻,提升發(fā)布質(zhì)量。
- 數(shù)據(jù)總結(jié)性工具,實現(xiàn)Chat-Your-Data,提供文檔的輸入給用戶,讓用戶可以與自己提供的數(shù)據(jù)聊天,本質(zhì)只涉及到互聯(lián)網(wǎng)公開的數(shù)據(jù)與用戶私有的數(shù)據(jù)。
- 大企業(yè)的Chat-Your-Data,各家大公司在原有業(yè)務基礎上,結(jié)合大企業(yè)的私有數(shù)據(jù),提供更優(yōu)質(zhì)的服務。比如結(jié)合用戶點評的大眾點評,能夠用“想去放neo-soul和R&B音樂的酒吧”,比如我們的商詳頁,能夠總結(jié)所有用戶對這個商品的評價,并且可以讓用戶對這個商品的資料進行問答。
- 與政務、醫(yī)療、教育等領域結(jié)合,融合線上機構(gòu)官網(wǎng)、線下大屏,提供更好的市民服務。
- 與其他工具比如IFTTT或者各種私有協(xié)議相結(jié)合,實現(xiàn)LLM可以訪問更多的工具和系統(tǒng),舉個例子:iot場景,Office Copilot。
LLM應用實際是一種新的人機交互方式,能夠讓用戶用自然語言與我們目前的系統(tǒng)溝通,很多應用甚至可以簡化到只有一個聊天窗口。
4總結(jié)
目前來說由于通用大模型訓練/部署的高成本來說,產(chǎn)業(yè)水平化分工的條件基本成熟,世界上并不需要很多個大模型,做LLM的應用將會是中小型企業(yè)和個人開發(fā)者的必然選擇。新形態(tài)的編程/工程范式需要工程師去及時學習理解。目前的開源技術棧已經(jīng)能滿足大部分產(chǎn)品的需求,可以嘗試快速實踐demo來驗證想法。
參考資料:
- https://blog.langchain.dev/tutorial-chatgpt-over-your-data/
Tutorial: ChatGPT Over Your Data
- https://qdrant.tech/articles/langchain-integration/
Question Answering with LangChain and Qdrant without boilerplate
- https://mp.weixin.qq.com/s/VZ6n4qlDx4bh41YvD1HqgQ
Atom Capital:深入探討ChatGPT帶來的產(chǎn)業(yè)變革