自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

RAG真正的難點不是向量數(shù)據(jù)庫,而是實時企業(yè)數(shù)據(jù)管道!這家公司做到了 原創(chuàng)

發(fā)布于 2024-10-11 14:53
瀏覽
0收藏

編輯 | 言征

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

企業(yè)部署GenAI需要RAG,而RAG需要向量數(shù)據(jù)庫,向量數(shù)據(jù)庫已經(jīng)成為企業(yè)部署人工智能的核心要素。但這還遠遠不夠,企業(yè)級別的RAG要復雜得多。

1.向量數(shù)據(jù)庫并非真正的難點

克里斯·拉蒂默(Chris Latimer)是初創(chuàng)公司Vectorize的首席執(zhí)行官兼聯(lián)合創(chuàng)始人,他曾在DataStax工作數(shù)年,期間協(xié)助領(lǐng)導了該數(shù)據(jù)庫供應商的云端工作。他反復遇到的一個問題是,對于實現(xiàn)企業(yè)RAG而言,向量數(shù)據(jù)庫并非真正的難點所在。問題的難點在于,如何將以各種方式存在的非結(jié)構(gòu)化數(shù)據(jù)優(yōu)化并導入向量數(shù)據(jù)庫,以便為生成式人工智能(AI)提供良好的支持。

正因如此,拉蒂默僅在十個月前創(chuàng)立了Vectorize,旨在幫助解決這一挑戰(zhàn)。

現(xiàn)在,該公司聲稱在由True Ventures領(lǐng)投的種子輪融資中籌集了360萬美元。與此同時,該公司還宣布其企業(yè)RAG平臺已正式推出。Vectorize平臺能夠?qū)崿F(xiàn)代理式RAG方法,提供近乎實時的數(shù)據(jù)能力。

Vectorize專注于AI的數(shù)據(jù)工程方面。該平臺幫助公司為在向量數(shù)據(jù)庫和大型語言模型中使用數(shù)據(jù)做好準備并進行維護。Vectorize平臺還通過直觀的界面,使企業(yè)能夠快速構(gòu)建RAG數(shù)據(jù)管道。另一項核心功能是RAG評估功能,它允許企業(yè)測試不同的方法。

“我們不斷看到人們在他們的生成式AI項目開發(fā)周期結(jié)束時發(fā)現(xiàn),項目并未取得良好效果,”Vectorize的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克里斯·拉蒂默在接受VentureBeat獨家采訪時表示?!八麄?yōu)橄蛄繑?shù)據(jù)庫獲取的上下文對大型語言模型來說并非最有用的,它仍在產(chǎn)生幻覺或誤解數(shù)據(jù)?!?/p>

2.Vectorize如何融入企業(yè)RAG架構(gòu)

Vectorize本身并不是一個向量數(shù)據(jù)庫。相反,它是一個將非結(jié)構(gòu)化數(shù)據(jù)源連接到現(xiàn)有向量數(shù)據(jù)庫(如Pinecone、DataStax、Couchbase和Elastic)的平臺。

拉蒂默解釋說,Vectorize會吸收并優(yōu)化來自不同源的數(shù)據(jù),以供向量數(shù)據(jù)庫使用。該平臺將提供一個生產(chǎn)就緒的數(shù)據(jù)管道,負責數(shù)據(jù)攝取、同步、錯誤處理以及其他數(shù)據(jù)工程的最佳實踐。

Vectorize本身也不是一種向量嵌入技術(shù)。將數(shù)據(jù)(無論是文本、圖像還是音頻)轉(zhuǎn)換為向量的過程,就是向量嵌入的全部內(nèi)容。Vectorize幫助用戶評估不同的嵌入模型和數(shù)據(jù)分塊方法,以確定最適合企業(yè)特定用例和數(shù)據(jù)的配置。

拉蒂默解釋說,Vectorize允許用戶從任意數(shù)量的不同嵌入模型中進行選擇。這些不同的模型可能包括OpenAI的ada,甚至是Snowflake正在采用的Voyage AI嵌入。

“我們確實會考慮將數(shù)據(jù)向量化的創(chuàng)新方法,以確保您獲得最佳結(jié)果,”拉蒂默說,“但最終,我們認為其價值在于為企業(yè)和開發(fā)人員提供一個生產(chǎn)就緒的解決方案,讓他們不必再擔心數(shù)據(jù)工程方面的問題?!?/p>

3.利用代理式AI驅(qū)動企業(yè)RAG落地

Vectorize的一項關(guān)鍵創(chuàng)新是其“代理式RAG”方法。該方法將傳統(tǒng)的RAG技術(shù)與AI代理功能相結(jié)合,使應用程序能夠更自主地解決問題。

代理式RAG也并非一個假設(shè)性的概念。Vectorize的早期用戶之一、AI推理硅芯片初創(chuàng)公司Groq就已經(jīng)在使用它。Groq最近籌集了6.4億美元資金。Groq正在利用Vectorize的代理式RAG功能來驅(qū)動一個AI支持代理。該代理可以自主利用Vectorize數(shù)據(jù)管道提供的數(shù)據(jù)和上下文來解決客戶問題。

“如果客戶的問題之前已經(jīng)被問過并得到了回答,那么我們希望這個代理能夠解決客戶的問題,而無需人類介入,”拉蒂默說,“但如果代理無法解決問題,我們希望有一個人類參與的環(huán)節(jié),以便進行升級處理。因此,代理能夠通過推理來解決問題的理念,正是AI代理架構(gòu)背后的整體理念?!?/p>

4.為什么實時數(shù)據(jù)管道對企業(yè)RAG至關(guān)重要

企業(yè)使用檢索增強生成的一個主要原因是連接到其自身的數(shù)據(jù)源。但同樣重要的是確保數(shù)據(jù)的實時性。

“陳舊的數(shù)據(jù)會導致陳舊的決策,”拉蒂默說。Vectorize提供了實時和近乎實時的數(shù)據(jù)更新能力,客戶可以根據(jù)自身對數(shù)據(jù)陳舊度的容忍度進行配置。

“我們實際上允許用戶根據(jù)對數(shù)據(jù)陳舊度的容忍度和對實時數(shù)據(jù)的需求來配置平臺,”他說,“因此,如果您只需要將管道設(shè)置為每周運行一次,我們可以滿足您的需求;而如果您需要實時運行,我們也可以滿足,并且您可以在數(shù)據(jù)可用時立即獲得實時更新?!?/p>

參考鏈接:https://venturebeat.com/ai/vectorize-debuts-agentic-rag-platform-for-real-time-enterprise-data/

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:言征

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
已于2024-10-11 14:54:38修改
收藏
回復
舉報
回復
相關(guān)推薦