自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

為實時人工智能做好準備

人工智能
不斷縮小的決策窗口和更快的數(shù)據(jù)生成使得實時分析成為一種新興的熱門產(chǎn)品類別。Rockset首席執(zhí)行官兼聯(lián)合創(chuàng)始人Venkat Venkataramani表示,現(xiàn)在,隨著大型語言模型(LLM)和矢量數(shù)據(jù)庫為企業(yè)人工智能鋪平了道路,我們突然進入了實時人工智能系統(tǒng)的時代。

不斷縮小的決策窗口和更快的數(shù)據(jù)生成使得實時分析成為一種新興的熱門產(chǎn)品類別。Rockset首席執(zhí)行官兼聯(lián)合創(chuàng)始人Venkat Venkataramani表示,現(xiàn)在,隨著大型語言模型(LLM)和矢量數(shù)據(jù)庫為企業(yè)人工智能鋪平了道路,我們突然進入了實時人工智能系統(tǒng)的時代。

到目前為止,Rockset一直在開發(fā)一個關(guān)系數(shù)據(jù)庫,使用戶能夠?qū)Υ罅啃螺斎氲臄?shù)據(jù)連續(xù)運行SQL查詢。從傳統(tǒng)數(shù)據(jù)倉庫供應(yīng)商到實時流處理器,許多大數(shù)據(jù)開發(fā)人員一直難以做到這一點。

Rockset通過在其開放的RocksDB的關(guān)鍵價值商店上構(gòu)建的一系列功能來滿足實時分析需求。Rockset首席技術(shù)官兼聯(lián)合創(chuàng)始人Dhruba Borthakur在Facebook幫助下創(chuàng)建了關(guān)鍵價值商店。這包括Rockset強大的聚合索引功能,但也包括其非結(jié)構(gòu)數(shù)據(jù)的接收、時間序列優(yōu)化、查詢規(guī)劃和基于云的架構(gòu)。

到目前為止,目標是讓實時應(yīng)用程序能夠訪問通過Kafka管道到達的最新數(shù)據(jù)。與其他追逐實時分析夢想的數(shù)據(jù)庫公司(Imply、Clickhouse和StarTree)一樣,沒有任何一項出色的功能可以讓你突然成功地在大量傳入數(shù)據(jù)上運行每秒數(shù)萬次SQL查詢。相反,這是一種通過不懈的工程實現(xiàn)的能力。

但在4月份發(fā)生了變化,Rockset推出了對數(shù)據(jù)庫中矢量搜索功能的初步支持。新功能使Rockset不僅可以在其數(shù)據(jù)庫中存儲和索引向量嵌入,還可以將這些向量嵌入與元數(shù)據(jù)過濾、關(guān)鍵字搜索和向量相似性得分相結(jié)合。

Venkataramani表示,這些新的矢量相關(guān)功能將為客戶解鎖實時人工智能應(yīng)用,特別關(guān)注產(chǎn)品推薦、個性化和欺詐檢測。

他說:“這方面以前稱為預(yù)測分析。能夠預(yù)測即將發(fā)生的事情。但如今,這都是實時人工智能?!?/span>

自去年年底ChatGPT出現(xiàn)以來,公司開始重新思考如何以及在哪里應(yīng)用人工智能。Venkataramani表示,基于神經(jīng)網(wǎng)絡(luò)和向量嵌入的新技術(shù)和技術(shù)正在顛覆五年前被認為是前沿的機器學(xué)習(xí)方法。

以產(chǎn)品推薦為例,這是一個經(jīng)過時間考驗的數(shù)據(jù)科學(xué)家應(yīng)用程序。與識別最具預(yù)測性的特征和屬性、構(gòu)建自動提取它們的管道,然后在運行時仔細構(gòu)建機器學(xué)習(xí)模型來推斷消費者偏好的艱苦過程不同,隨著LLM的出現(xiàn),公司現(xiàn)在基本上可以將所有這些數(shù)據(jù)放入文本文檔中,并由神經(jīng)網(wǎng)絡(luò)進行分類。

他說:“以前,機器學(xué)習(xí)模型會試圖提取關(guān)于你的產(chǎn)品、產(chǎn)品顏色、制造商、產(chǎn)品類別等的屬性?!薄暗F(xiàn)在,你可以給這些人工智能模型和神經(jīng)網(wǎng)絡(luò)一個BLOB(表示二進制類型的大對象)的文本。你可以給每個產(chǎn)品一個圖像目錄,你不需要告訴它‘去標記這些圖像,說這是藍色的,屬于同一類?!?/span>

“現(xiàn)在你可以提供用戶正在觀看的所有產(chǎn)品,人工智能模型可以理解用戶的喜好和厭惡,而不必根據(jù)特定的屬性和規(guī)則進行編碼?!薄耙虼?,你可以為用戶提供并構(gòu)建一個向量,該向量代表了他們有更高機會喜歡或購買的所有潛在產(chǎn)品?!?/span>

這大大降低了在生產(chǎn)中使用人工智能的門檻,并使公司能夠利用人工智能做更多的事情。他說,理論上,這可以使一家公司對其目錄中的10萬件商品進行預(yù)測分析,而不是將其限制在前1000件商品。

有了人工智能,就好像一些機器人在觀察用戶的所有行為,并更深入地了解每一種產(chǎn)品,然后在用戶出現(xiàn)在網(wǎng)站上時實時構(gòu)建推薦,而不是一小時后、一天后或一周后??梢詡€性化的程度已經(jīng)達到了頂峰,因為現(xiàn)在可以將所有這些自動化。

Rockset不創(chuàng)建矢量嵌入(矢量嵌入是大量非結(jié)構(gòu)化文本或圖像數(shù)據(jù)的濃縮表示)。但它確實允許用戶將向量嵌入基本上視為數(shù)據(jù)庫中的另一種數(shù)據(jù)類型,并對其執(zhí)行操作,例如相似性搜索。

Venkataramani說: “我們不在乎你用什么模型來獲取非結(jié)構(gòu)化數(shù)據(jù)并將其轉(zhuǎn)化為向量。” “把它想象成另一種數(shù)據(jù)類型,你的表中的另一列。你現(xiàn)在需要對它們進行相似性搜索。你需要說,給定一個向量,給我找到所有其他更接近我正在搜索的向量。”

假設(shè)客戶希望識別傳入數(shù)據(jù)流中所有類似雛菊的圖像(如果應(yīng)用在公共安全而不是花園游覽,則可以將“雛菊”替換為“槍”或“刀”)。

Venkataramani解釋道:“我正在尋找的矢量是一朵雛菊,但這里是用矢量表示的所有其他圖像?!?“現(xiàn)在你需要一個索引。如果你對整個庫進行強力搜索,這個問題需要10天才能得到答案。我希望在100毫秒內(nèi)完成。你是怎么做到的?”

根據(jù)向量嵌入的索引運行機器學(xué)習(xí)算法,如K-最近鄰(KNN)或近似最近鄰(ANN),顯著加快了對輸入數(shù)據(jù)中雛菊和雛菊相鄰圖像的識別。

沒有人在數(shù)據(jù)庫中尋找這個確切的向量。他們在尋找所有更接近或最接近的向量,這就是索引在數(shù)學(xué)上比根據(jù)數(shù)字、字符串、日期或時間構(gòu)建索引復(fù)雜得多的地方。這就是為什么矢量搜索是一種非常不同的功能,這也是Rockset所增加應(yīng)對實時需求的有力功能。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2021-05-10 15:11:58

人工智能大數(shù)據(jù)科技

2024-04-25 15:23:29

2022-02-09 10:00:08

人工智能工業(yè)物聯(lián)網(wǎng)

2023-09-06 11:41:34

數(shù)據(jù)中心人工智能

2020-10-09 11:02:31

數(shù)據(jù)中心人工智能技術(shù)

2022-05-27 08:16:35

端點安全人工智能網(wǎng)絡(luò)安全

2020-09-04 09:53:38

人工智能數(shù)據(jù)中心GPU

2020-08-28 14:57:48

智慧城市革命數(shù)據(jù)

2010-10-08 10:20:24

Novell用戶

2020-05-25 10:23:05

智慧城市物聯(lián)網(wǎng)5G

2022-01-19 10:50:36

災(zāi)難恢復(fù)

2022-01-25 11:17:57

元宇宙網(wǎng)絡(luò)攻擊

2021-11-12 09:00:00

管理企業(yè)技能

2019-02-15 10:05:32

人工智能自動化革命機器人

2017-08-23 14:21:26

微軟人工智能

2019-08-26 14:50:58

物聯(lián)網(wǎng)5G網(wǎng)絡(luò)

2010-08-19 09:44:17

云計算協(xié)同共創(chuàng)

2010-08-30 09:45:38

私有云建設(shè)

2021-12-22 23:15:12

數(shù)據(jù)安全企業(yè)金融

2014-08-22 09:53:16

Windows 9
點贊
收藏

51CTO技術(shù)棧公眾號