自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

RAG真正的難點(diǎn)不是向量數(shù)據(jù)庫(kù),而是實(shí)時(shí)企業(yè)數(shù)據(jù)管道!這家公司做到了

原創(chuàng) 精選
人工智能 其他數(shù)據(jù)庫(kù)
Vectorize的一項(xiàng)關(guān)鍵創(chuàng)新是其“代理式RAG”方法。該方法將傳統(tǒng)的RAG技術(shù)與AI代理功能相結(jié)合,使應(yīng)用程序能夠更自主地解決問題。

編輯 | 言征

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

企業(yè)部署GenAI需要RAG,而RAG需要向量數(shù)據(jù)庫(kù),向量數(shù)據(jù)庫(kù)已經(jīng)成為企業(yè)部署人工智能的核心要素。但這還遠(yuǎn)遠(yuǎn)不夠,企業(yè)級(jí)別的RAG要復(fù)雜得多。

1.向量數(shù)據(jù)庫(kù)并非真正的難點(diǎn)

克里斯·拉蒂默(Chris Latimer)是初創(chuàng)公司Vectorize的首席執(zhí)行官兼聯(lián)合創(chuàng)始人,他曾在DataStax工作數(shù)年,期間協(xié)助領(lǐng)導(dǎo)了該數(shù)據(jù)庫(kù)供應(yīng)商的云端工作。他反復(fù)遇到的一個(gè)問題是,對(duì)于實(shí)現(xiàn)企業(yè)RAG而言,向量數(shù)據(jù)庫(kù)并非真正的難點(diǎn)所在。問題的難點(diǎn)在于,如何將以各種方式存在的非結(jié)構(gòu)化數(shù)據(jù)優(yōu)化并導(dǎo)入向量數(shù)據(jù)庫(kù),以便為生成式人工智能(AI)提供良好的支持。

正因如此,拉蒂默僅在十個(gè)月前創(chuàng)立了Vectorize,旨在幫助解決這一挑戰(zhàn)。

現(xiàn)在,該公司聲稱在由True Ventures領(lǐng)投的種子輪融資中籌集了360萬美元。與此同時(shí),該公司還宣布其企業(yè)RAG平臺(tái)已正式推出。Vectorize平臺(tái)能夠?qū)崿F(xiàn)代理式RAG方法,提供近乎實(shí)時(shí)的數(shù)據(jù)能力。

Vectorize專注于AI的數(shù)據(jù)工程方面。該平臺(tái)幫助公司為在向量數(shù)據(jù)庫(kù)和大型語(yǔ)言模型中使用數(shù)據(jù)做好準(zhǔn)備并進(jìn)行維護(hù)。Vectorize平臺(tái)還通過直觀的界面,使企業(yè)能夠快速構(gòu)建RAG數(shù)據(jù)管道。另一項(xiàng)核心功能是RAG評(píng)估功能,它允許企業(yè)測(cè)試不同的方法。

“我們不斷看到人們?cè)谒麄兊纳墒紸I項(xiàng)目開發(fā)周期結(jié)束時(shí)發(fā)現(xiàn),項(xiàng)目并未取得良好效果,”Vectorize的聯(lián)合創(chuàng)始人兼首席執(zhí)行官克里斯·拉蒂默在接受VentureBeat獨(dú)家采訪時(shí)表示?!八麄?yōu)橄蛄繑?shù)據(jù)庫(kù)獲取的上下文對(duì)大型語(yǔ)言模型來說并非最有用的,它仍在產(chǎn)生幻覺或誤解數(shù)據(jù)?!?/p>

2.Vectorize如何融入企業(yè)RAG架構(gòu)

Vectorize本身并不是一個(gè)向量數(shù)據(jù)庫(kù)。相反,它是一個(gè)將非結(jié)構(gòu)化數(shù)據(jù)源連接到現(xiàn)有向量數(shù)據(jù)庫(kù)(如Pinecone、DataStax、Couchbase和Elastic)的平臺(tái)。

拉蒂默解釋說,Vectorize會(huì)吸收并優(yōu)化來自不同源的數(shù)據(jù),以供向量數(shù)據(jù)庫(kù)使用。該平臺(tái)將提供一個(gè)生產(chǎn)就緒的數(shù)據(jù)管道,負(fù)責(zé)數(shù)據(jù)攝取、同步、錯(cuò)誤處理以及其他數(shù)據(jù)工程的最佳實(shí)踐。

Vectorize本身也不是一種向量嵌入技術(shù)。將數(shù)據(jù)(無論是文本、圖像還是音頻)轉(zhuǎn)換為向量的過程,就是向量嵌入的全部?jī)?nèi)容。Vectorize幫助用戶評(píng)估不同的嵌入模型和數(shù)據(jù)分塊方法,以確定最適合企業(yè)特定用例和數(shù)據(jù)的配置。

拉蒂默解釋說,Vectorize允許用戶從任意數(shù)量的不同嵌入模型中進(jìn)行選擇。這些不同的模型可能包括OpenAI的ada,甚至是Snowflake正在采用的Voyage AI嵌入。

“我們確實(shí)會(huì)考慮將數(shù)據(jù)向量化的創(chuàng)新方法,以確保您獲得最佳結(jié)果,”拉蒂默說,“但最終,我們認(rèn)為其價(jià)值在于為企業(yè)和開發(fā)人員提供一個(gè)生產(chǎn)就緒的解決方案,讓他們不必再擔(dān)心數(shù)據(jù)工程方面的問題?!?/p>

3.利用代理式AI驅(qū)動(dòng)企業(yè)RAG落地

Vectorize的一項(xiàng)關(guān)鍵創(chuàng)新是其“代理式RAG”方法。該方法將傳統(tǒng)的RAG技術(shù)與AI代理功能相結(jié)合,使應(yīng)用程序能夠更自主地解決問題。

代理式RAG也并非一個(gè)假設(shè)性的概念。Vectorize的早期用戶之一、AI推理硅芯片初創(chuàng)公司Groq就已經(jīng)在使用它。Groq最近籌集了6.4億美元資金。Groq正在利用Vectorize的代理式RAG功能來驅(qū)動(dòng)一個(gè)AI支持代理。該代理可以自主利用Vectorize數(shù)據(jù)管道提供的數(shù)據(jù)和上下文來解決客戶問題。

“如果客戶的問題之前已經(jīng)被問過并得到了回答,那么我們希望這個(gè)代理能夠解決客戶的問題,而無需人類介入,”拉蒂默說,“但如果代理無法解決問題,我們希望有一個(gè)人類參與的環(huán)節(jié),以便進(jìn)行升級(jí)處理。因此,代理能夠通過推理來解決問題的理念,正是AI代理架構(gòu)背后的整體理念?!?/p>

4.為什么實(shí)時(shí)數(shù)據(jù)管道對(duì)企業(yè)RAG至關(guān)重要

企業(yè)使用檢索增強(qiáng)生成的一個(gè)主要原因是連接到其自身的數(shù)據(jù)源。但同樣重要的是確保數(shù)據(jù)的實(shí)時(shí)性。

“陳舊的數(shù)據(jù)會(huì)導(dǎo)致陳舊的決策,”拉蒂默說。Vectorize提供了實(shí)時(shí)和近乎實(shí)時(shí)的數(shù)據(jù)更新能力,客戶可以根據(jù)自身對(duì)數(shù)據(jù)陳舊度的容忍度進(jìn)行配置。

“我們實(shí)際上允許用戶根據(jù)對(duì)數(shù)據(jù)陳舊度的容忍度和對(duì)實(shí)時(shí)數(shù)據(jù)的需求來配置平臺(tái),”他說,“因此,如果您只需要將管道設(shè)置為每周運(yùn)行一次,我們可以滿足您的需求;而如果您需要實(shí)時(shí)運(yùn)行,我們也可以滿足,并且您可以在數(shù)據(jù)可用時(shí)立即獲得實(shí)時(shí)更新?!?/p>

參考鏈接:https://venturebeat.com/ai/vectorize-debuts-agentic-rag-platform-for-real-time-enterprise-data/

想了解更多AIGC的內(nèi)容,請(qǐng)?jiān)L問:

51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2017-02-09 11:54:49

聯(lián)想企業(yè)網(wǎng)盤

2022-03-16 11:03:40

數(shù)據(jù)庫(kù)元數(shù)據(jù)數(shù)據(jù)引擎

2025-04-03 16:02:14

2024-07-10 17:28:51

2017-06-21 09:48:08

互聯(lián)網(wǎng)

2025-04-01 07:30:00

2019-07-23 10:43:28

MariaDB數(shù)據(jù)庫(kù)MySQL

2023-11-27 00:58:00

數(shù)據(jù)庫(kù)AI

2015-12-14 10:22:53

2021-01-11 13:35:14

996職場(chǎng)互聯(lián)網(wǎng)

2011-08-30 10:50:01

Vmware企業(yè)數(shù)據(jù)庫(kù)

2015-11-17 15:50:04

A商APPAPP電商

2020-03-23 14:07:10

戴爾

2019-10-08 15:54:42

SQL數(shù)據(jù)庫(kù)技術(shù)

2016-09-18 20:39:54

大數(shù)據(jù)大數(shù)據(jù)時(shí)代

2024-06-05 13:19:56

2023-01-05 08:00:00

2023-07-28 08:00:00

人工智能向量數(shù)據(jù)庫(kù)

2023-07-20 20:54:09

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)