編輯 | 言征
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
企業(yè)部署GenAI需要RAG,而RAG需要向量數(shù)據(jù)庫(kù),向量數(shù)據(jù)庫(kù)已經(jīng)成為企業(yè)部署人工智能的核心要素。但這還遠(yuǎn)遠(yuǎn)不夠,企業(yè)級(jí)別的RAG要復(fù)雜得多。
1.向量數(shù)據(jù)庫(kù)并非真正的難點(diǎn)
克里斯·拉蒂默(Chris Latimer)是初創(chuàng)公司Vectorize的首席執(zhí)行官兼聯(lián)合創(chuàng)始人,他曾在DataStax工作數(shù)年,期間協(xié)助領(lǐng)導(dǎo)了該數(shù)據(jù)庫(kù)供應(yīng)商的云端工作。他反復(fù)遇到的一個(gè)問題是,對(duì)于實(shí)現(xiàn)企業(yè)RAG而言,向量數(shù)據(jù)庫(kù)并非真正的難點(diǎn)所在。問題的難點(diǎn)在于,如何將以各種方式存在的非結(jié)構(gòu)化數(shù)據(jù)優(yōu)化并導(dǎo)入向量數(shù)據(jù)庫(kù),以便為生成式人工智能(AI)提供良好的支持。
正因如此,拉蒂默僅在十個(gè)月前創(chuàng)立了Vectorize,旨在幫助解決這一挑戰(zhàn)。
現(xiàn)在,該公司聲稱在由True Ventures領(lǐng)投的種子輪融資中籌集了360萬美元。與此同時(shí),該公司還宣布其企業(yè)RAG平臺(tái)已正式推出。Vectorize平臺(tái)能夠?qū)崿F(xiàn)代理式RAG方法,提供近乎實(shí)時(shí)的數(shù)據(jù)能力。
Vectorize專注于AI的數(shù)據(jù)工程方面。該平臺(tái)幫助公司為在向量數(shù)據(jù)庫(kù)和大型語(yǔ)言模型中使用數(shù)據(jù)做好準(zhǔn)備并進(jìn)行維護(hù)。Vectorize平臺(tái)還通過直觀的界面,使企業(yè)能夠快速構(gòu)建RAG數(shù)據(jù)管道。另一項(xiàng)核心功能是RAG評(píng)估功能,它允許企業(yè)測(cè)試不同的方法。
“我們不斷看到人們?cè)谒麄兊纳墒紸I項(xiàng)目開發(fā)周期結(jié)束時(shí)發(fā)現(xiàn),項(xiàng)目并未取得良好效果,”Vectorize的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克里斯·拉蒂默在接受VentureBeat獨(dú)家采訪時(shí)表示?!八麄?yōu)橄蛄繑?shù)據(jù)庫(kù)獲取的上下文對(duì)大型語(yǔ)言模型來說并非最有用的,它仍在產(chǎn)生幻覺或誤解數(shù)據(jù)?!?/p>
2.Vectorize如何融入企業(yè)RAG架構(gòu)
Vectorize本身并不是一個(gè)向量數(shù)據(jù)庫(kù)。相反,它是一個(gè)將非結(jié)構(gòu)化數(shù)據(jù)源連接到現(xiàn)有向量數(shù)據(jù)庫(kù)(如Pinecone、DataStax、Couchbase和Elastic)的平臺(tái)。
拉蒂默解釋說,Vectorize會(huì)吸收并優(yōu)化來自不同源的數(shù)據(jù),以供向量數(shù)據(jù)庫(kù)使用。該平臺(tái)將提供一個(gè)生產(chǎn)就緒的數(shù)據(jù)管道,負(fù)責(zé)數(shù)據(jù)攝取、同步、錯(cuò)誤處理以及其他數(shù)據(jù)工程的最佳實(shí)踐。
Vectorize本身也不是一種向量嵌入技術(shù)。將數(shù)據(jù)(無論是文本、圖像還是音頻)轉(zhuǎn)換為向量的過程,就是向量嵌入的全部?jī)?nèi)容。Vectorize幫助用戶評(píng)估不同的嵌入模型和數(shù)據(jù)分塊方法,以確定最適合企業(yè)特定用例和數(shù)據(jù)的配置。
拉蒂默解釋說,Vectorize允許用戶從任意數(shù)量的不同嵌入模型中進(jìn)行選擇。這些不同的模型可能包括OpenAI的ada,甚至是Snowflake正在采用的Voyage AI嵌入。
“我們確實(shí)會(huì)考慮將數(shù)據(jù)向量化的創(chuàng)新方法,以確保您獲得最佳結(jié)果,”拉蒂默說,“但最終,我們認(rèn)為其價(jià)值在于為企業(yè)和開發(fā)人員提供一個(gè)生產(chǎn)就緒的解決方案,讓他們不必再擔(dān)心數(shù)據(jù)工程方面的問題?!?/p>
3.利用代理式AI驅(qū)動(dòng)企業(yè)RAG落地
Vectorize的一項(xiàng)關(guān)鍵創(chuàng)新是其“代理式RAG”方法。該方法將傳統(tǒng)的RAG技術(shù)與AI代理功能相結(jié)合,使應(yīng)用程序能夠更自主地解決問題。
代理式RAG也并非一個(gè)假設(shè)性的概念。Vectorize的早期用戶之一、AI推理硅芯片初創(chuàng)公司Groq就已經(jīng)在使用它。Groq最近籌集了6.4億美元資金。Groq正在利用Vectorize的代理式RAG功能來驅(qū)動(dòng)一個(gè)AI支持代理。該代理可以自主利用Vectorize數(shù)據(jù)管道提供的數(shù)據(jù)和上下文來解決客戶問題。
“如果客戶的問題之前已經(jīng)被問過并得到了回答,那么我們希望這個(gè)代理能夠解決客戶的問題,而無需人類介入,”拉蒂默說,“但如果代理無法解決問題,我們希望有一個(gè)人類參與的環(huán)節(jié),以便進(jìn)行升級(jí)處理。因此,代理能夠通過推理來解決問題的理念,正是AI代理架構(gòu)背后的整體理念?!?/p>
4.為什么實(shí)時(shí)數(shù)據(jù)管道對(duì)企業(yè)RAG至關(guān)重要
企業(yè)使用檢索增強(qiáng)生成的一個(gè)主要原因是連接到其自身的數(shù)據(jù)源。但同樣重要的是確保數(shù)據(jù)的實(shí)時(shí)性。
“陳舊的數(shù)據(jù)會(huì)導(dǎo)致陳舊的決策,”拉蒂默說。Vectorize提供了實(shí)時(shí)和近乎實(shí)時(shí)的數(shù)據(jù)更新能力,客戶可以根據(jù)自身對(duì)數(shù)據(jù)陳舊度的容忍度進(jìn)行配置。
“我們實(shí)際上允許用戶根據(jù)對(duì)數(shù)據(jù)陳舊度的容忍度和對(duì)實(shí)時(shí)數(shù)據(jù)的需求來配置平臺(tái),”他說,“因此,如果您只需要將管道設(shè)置為每周運(yùn)行一次,我們可以滿足您的需求;而如果您需要實(shí)時(shí)運(yùn)行,我們也可以滿足,并且您可以在數(shù)據(jù)可用時(shí)立即獲得實(shí)時(shí)更新?!?/p>
參考鏈接:https://venturebeat.com/ai/vectorize-debuts-agentic-rag-platform-for-real-time-enterprise-data/