自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ul id="yp5wx"><center id="yp5wx"></center></ul>

<sub id="yp5wx"><p id="yp5wx"></p></sub>

<cite id="yp5wx"><track id="yp5wx"></track></cite>

<sub id="yp5wx"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

別再將LLM當(dāng)成數(shù)據(jù)庫了原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2025-1-3 08:09

瀏覽

0收藏

本文介紹了為什么批處理范式已過時(shí)，它如何阻礙AI應(yīng)用，以及為什么AI的未來需要一種實(shí)時(shí)事件流平臺(tái)。

想象一下，你戴著耳機(jī)駕駛一輛汽車，每五分鐘才更新一次路況信息，而不是持續(xù)不斷地提供當(dāng)前位置情況的視頻流。過不了多久，你就會(huì)撞車。

雖然這種類型的批處理在現(xiàn)實(shí)世界中并不適用，卻是當(dāng)今許多系統(tǒng)運(yùn)行的方式。批處理誕生于過時(shí)的技術(shù)限制，迫使應(yīng)用程序依賴靜態(tài)的延遲數(shù)據(jù)。當(dāng)計(jì)算、內(nèi)存和存儲(chǔ)均有限時(shí)，這種方法可能是唯一可行的解決方案，但它與我們跟現(xiàn)實(shí)世界互動(dòng)的方式完全不符合，更不符合AI的運(yùn)作方式。

生成式AI具有不可思議的潛力，不能將大語言模型（LLM）視為靜態(tài)數(shù)據(jù)庫，即等待輸入并提供輸出的反應(yīng)式系統(tǒng)。AI依賴實(shí)時(shí)情境數(shù)據(jù)才能蓬勃發(fā)展。如果固守批處理觀念，我們無異在扼殺其能力。

不妨探討一下為什么批處理范式已過時(shí)，它如何阻礙了AI應(yīng)用的發(fā)展，以及為什么AI的未來需要一種實(shí)時(shí)事件流平臺(tái)。

為什么我們受困于批處理模式？

用于分析和機(jī)器學(xué)習(xí)的面向批處理的系統(tǒng)幾十年來一直主導(dǎo)著技術(shù)界。這些系統(tǒng)應(yīng)運(yùn)而生，是在計(jì)算機(jī)內(nèi)存有限、算力有限、存儲(chǔ)空間極小的時(shí)代創(chuàng)建的。然而，同樣的傳統(tǒng)方法現(xiàn)正被應(yīng)用于新時(shí)代的生成式AI。

機(jī)器學(xué)習(xí)運(yùn)維（MLOps）在很大程度上圍繞一組離散的、順序的任務(wù)發(fā)展而來，比如特征工程、模型訓(xùn)練、模型測試、模型部署和偏差表征。這種概念模型非常適合面向批處理的開發(fā)和交付，但它限制了這些應(yīng)用程序在不斷變化的世界中的反應(yīng)性和準(zhǔn)確性。那些需要更好響應(yīng)的應(yīng)用程序勢必需要避開通用的MLOps基礎(chǔ)設(shè)施。

我們認(rèn)為，這是一種有缺陷的方法。

沒有人因設(shè)計(jì)批處理過程而被解雇

究其核心，這種范式將數(shù)據(jù)聚合到一個(gè)中央數(shù)據(jù)庫中，數(shù)據(jù)被動(dòng)地等待系統(tǒng)或用戶輪詢和調(diào)用。由此形成的系統(tǒng)其用途完全取決于接收到的查詢的具體需求。雖然這種方法適用于當(dāng)時(shí)的限制，但從根本上脫離了我們體驗(yàn)世界并與之互動(dòng)的方式。

別再將LLM當(dāng)成數(shù)據(jù)庫了-AI.x社區(qū)

圖1. 批流程的總體示意圖

盡管技術(shù)不斷發(fā)展，這種觀念依然根深蒂固。今天，我們有了數(shù)據(jù)流平臺(tái)之類的替代技術(shù)，可以實(shí)現(xiàn)實(shí)時(shí)的事件驅(qū)動(dòng)架構(gòu)。但是批處理系統(tǒng)仍然存在，倒不是由于它們是最好的解決方案，而是由于它們已成為認(rèn)可的行事方式。

就像“沒有人因購買IBM系統(tǒng)而被解雇”這句老話，批處理系統(tǒng)同樣如此：沒有人因設(shè)計(jì)了一個(gè)將數(shù)據(jù)聚集在一個(gè)地方的系統(tǒng)而被解雇，前提是根據(jù)這個(gè)集中式數(shù)據(jù)采取行動(dòng)高效而可靠。我們習(xí)慣于把工作看成是一系列任務(wù)，完成一項(xiàng)后再進(jìn)行下一項(xiàng)。運(yùn)籌學(xué)和精益制造等學(xué)科的成熟結(jié)果表明，我們在做批量工作時(shí)表現(xiàn)出色，因?yàn)槲覀兺ㄟ^實(shí)踐變得更好，而轉(zhuǎn)換思維比較低效?，F(xiàn)代分布式系統(tǒng)不需要受制于我們的局限性。

機(jī)器學(xué)習(xí)中的批處理思維

在日常生活中，我們并不基于“批量更新”來應(yīng)對世界。我們不斷地處理信息，對不斷變化的情境做出反應(yīng)和適應(yīng)。然而，歷史限制導(dǎo)致了批處理成為默認(rèn)范式。

傳統(tǒng)的機(jī)器學(xué)習(xí)反映了這種面向批處理的思維。模型圍繞嚴(yán)格的線性工作流程進(jìn)行操作：

收集訓(xùn)練數(shù)據(jù)：收集特定領(lǐng)域的靜態(tài)數(shù)據(jù)集，常用于時(shí)間快照。
特征工程：對數(shù)據(jù)進(jìn)行預(yù)處理、完善并為模型做好準(zhǔn)備。
訓(xùn)練模型：模型基于篩選后的數(shù)據(jù)而構(gòu)建。
測試模型：將現(xiàn)有數(shù)據(jù)的一些部分與訓(xùn)練數(shù)據(jù)隔離出來，用于對照某些預(yù)定義的性能閾值測試模型的有效性。
部署模型：一旦部署，模型就變成了固定的工件，用于預(yù)測查詢。

別再將LLM當(dāng)成數(shù)據(jù)庫了-AI.x社區(qū)

圖2. 傳統(tǒng)機(jī)器學(xué)習(xí)的批流程

雖然這個(gè)過程針對特定的用例很有效，但是本質(zhì)上僵化，缺乏適應(yīng)性。

相比之下，生成式AI如此具有變革性的原因之一是因?yàn)榛A(chǔ)模型天生可重用，并且能夠解決許多領(lǐng)域的各種問題。然而，為了使這些模型在不同領(lǐng)域之間可重用，必須在提示組裝期間確保數(shù)據(jù)在特定情景中，而批處理無法滿足這一要求。

若沒有情景化的數(shù)據(jù)，LLM無法提供價(jià)值

不妨考慮一個(gè)簡單的例子。想象一下，我們開發(fā)一款基于AI的航班助理，當(dāng)航班延誤時(shí)可以幫助客戶。

別再將LLM當(dāng)成數(shù)據(jù)庫了-AI.x社區(qū)

圖3. 用戶與AI航班助理之間的示例交互

在上面的兩輪交互中，需要很多情景信息來滿足客戶的要求。

LLM需要記住，相關(guān)的城市是紐約。它需要知道客戶身份和當(dāng)前預(yù)訂情況、當(dāng)前航班信息、出發(fā)/到達(dá)時(shí)間、座位布局、座位偏好、定價(jià)信息和航空公司變更政策。

相比傳統(tǒng)的機(jī)器學(xué)習(xí)：模型使用針對特定應(yīng)用程序的數(shù)據(jù)進(jìn)行訓(xùn)練，LLM并不使用你的數(shù)據(jù)進(jìn)行訓(xùn)練，它們使用一般信息進(jìn)行訓(xùn)練。針對特定應(yīng)用程序的數(shù)據(jù)工程發(fā)生在提示組裝期間，而不是模型創(chuàng)建期間。

別再將LLM當(dāng)成數(shù)據(jù)庫了-AI.x社區(qū)

圖4. 通過提示組裝實(shí)現(xiàn)的LLM可重用性和定制性

在每分鐘發(fā)表兩篇醫(yī)學(xué)論文、每小時(shí)解決8400起法律案件的當(dāng)下，靜態(tài)數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠。AI系統(tǒng)需要實(shí)時(shí)流動(dòng)的數(shù)據(jù)來給出解決方案。盡管有更好的選擇，但堅(jiān)持使用面向批處理的系統(tǒng)限制了現(xiàn)代應(yīng)用的潛力，尤其是AI方面。是時(shí)候重新思考這種過時(shí)的方法，擁抱反映我們在動(dòng)態(tài)實(shí)時(shí)的世界如何生活和工作的架構(gòu)了。

LLM是外向型

當(dāng)我們設(shè)計(jì)下一代AI應(yīng)用程序時(shí)，可能會(huì)陷入同樣的面向批處理的陷阱。我們將LLM視為數(shù)據(jù)庫（等待輸入并響應(yīng)特定查詢的響應(yīng)式工具）。但這種觀念與LLM具有的能力根本不匹配。AI不僅僅用于保存信息，它還用于推理、生成和進(jìn)化。

數(shù)據(jù)庫是內(nèi)向型，保存信息，只在明確要求時(shí)才提供，而LLM是外向型，旨在參與、合成和主動(dòng)貢獻(xiàn)。它們適合于這種環(huán)境：應(yīng)用情景不斷變化，并且能夠支持這種動(dòng)態(tài)行為的架構(gòu)。面向批處理的方法（模型和數(shù)據(jù)定期更新，但其他方面是靜態(tài)的）扼殺了生成式AI的真正潛力。

要真正發(fā)掘AI的潛力，我們需要轉(zhuǎn)變思維。

AI系統(tǒng)應(yīng)該是工作流程的積極參與者——獻(xiàn)計(jì)獻(xiàn)策，參與動(dòng)態(tài)對話，在一些情況下還能自主操作。這需要大幅改動(dòng)架構(gòu)。我們需要的不是靜態(tài)的查詢-響應(yīng)系統(tǒng)，而是能夠?qū)崿F(xiàn)流暢實(shí)時(shí)的交互和靈活適應(yīng)的事件驅(qū)動(dòng)架構(gòu)。

流處理如何發(fā)掘AI的潛力？

數(shù)據(jù)流平臺(tái)支持實(shí)時(shí)需求，即支持連續(xù)的、事件驅(qū)動(dòng)的工作流程來滿足動(dòng)態(tài)快節(jié)奏的系統(tǒng)需求。在金融、電信和電子商務(wù)等幾毫秒事關(guān)成敗的領(lǐng)域，面向批處理的架構(gòu)力不從心。需要應(yīng)用程序在交易進(jìn)行時(shí)檢測欺詐，在產(chǎn)品銷售時(shí)更新庫存量，或者在客戶交互期間提供實(shí)時(shí)個(gè)性化。

別再將LLM當(dāng)成數(shù)據(jù)庫了-AI.x社區(qū)

圖5. 流處理的總體示意圖

面向生成式AI的流處理

生成式AI的大多數(shù)實(shí)際用例都有賴于實(shí)時(shí)的情境數(shù)據(jù)。流處理平臺(tái)通過克服批處理系統(tǒng)無法解決的重大挑戰(zhàn)來補(bǔ)充這些模型。

實(shí)時(shí)情境化：LLM需要最新的數(shù)據(jù)來生成有意義的響應(yīng)。比如說，基于AI的航班助理需要即時(shí)訪問航班延誤、取消和重新預(yù)訂選項(xiàng)。流處理平臺(tái)則提供了這種實(shí)時(shí)上下文，確保AI在需要時(shí)獲得所需的信息。
動(dòng)態(tài)決策：生成式AI系統(tǒng)能做的不僅僅是響應(yīng)查詢。流處理平臺(tái)允許AI對不斷變化的輸入做出動(dòng)態(tài)反應(yīng)，比如在庫存量變化時(shí)調(diào)整產(chǎn)品推薦，或者對剛發(fā)布的新法律適用案件做出反應(yīng)。
可擴(kuò)展、解耦的架構(gòu)：LLM常常需要與從CRM到分析平臺(tái)的多個(gè)系統(tǒng)集成。流處理平臺(tái)支持解耦的架構(gòu)，其中每個(gè)組件可以在使用相同數(shù)據(jù)流的同時(shí)獨(dú)立操作。這避免了批處理系統(tǒng)的瓶頸和剛性，允許AI應(yīng)用程序有效地?cái)U(kuò)展。
減少AI工作流程的延遲：在批處理系統(tǒng)中，數(shù)據(jù)收集與數(shù)據(jù)處理之間的延遲可能導(dǎo)致過時(shí)的信息。比如說，存儲(chǔ)客戶數(shù)據(jù)的批量更新矢量數(shù)據(jù)庫可能會(huì)推薦已經(jīng)缺貨的產(chǎn)品。流處理消除了這種延遲，使AI工作流程與實(shí)際情形保持一致。

代理型AI：行動(dòng)而不是等待的AI

代理型AI的興起激發(fā)了人們對并不僅限于簡單的查詢/響應(yīng)交互的代理的興趣。這種系統(tǒng)可以自主發(fā)起行動(dòng)、做出決策并適應(yīng)不斷變化的環(huán)境。

以典型的AI代理為例。我們可以把代理看作自動(dòng)化過程，對所處環(huán)境進(jìn)行推理，并主動(dòng)采取行動(dòng)來實(shí)現(xiàn)某些指定的目標(biāo)。它的決策可能很復(fù)雜，包含受中間數(shù)據(jù)查詢影響的條件分支邏輯。

它可能需要從多個(gè)來源提取數(shù)據(jù)，處理提示工程和RAG工作流程，并直接與各種工具交互以執(zhí)行確定性和隨機(jī)性的工作流程。所需的編排很復(fù)雜，依賴多個(gè)系統(tǒng)。如果代理需要與其他代理進(jìn)行聯(lián)系，復(fù)雜性只會(huì)有增無減。如果沒有靈活的架構(gòu)，這些依賴關(guān)系使得擴(kuò)展和修改幾乎不可能實(shí)現(xiàn)。

別再將LLM當(dāng)成數(shù)據(jù)庫了-AI.x社區(qū)

圖6. 代理依賴關(guān)系概況圖

要做到這一點(diǎn)，它們需要：

持續(xù)感知：實(shí)時(shí)事件流，比如庫存、用戶行為或系統(tǒng)狀態(tài)等方面的變化。
情境推理：綜合動(dòng)態(tài)數(shù)據(jù)以推斷意圖和規(guī)劃行動(dòng)的能力。
自主決策：無需等待明確的用戶指令即可執(zhí)行操作，比如重新預(yù)訂航班或動(dòng)態(tài)調(diào)整系統(tǒng)配置。

比如說，使用流處理的基于AI的旅行助理可以自動(dòng)監(jiān)控航班時(shí)刻表、識(shí)別延誤、重新預(yù)訂受影響的航班并通知用戶，這一切都無需人工干預(yù)。換成批量更新的靜態(tài)數(shù)據(jù)，這種程度的自主就不可能實(shí)現(xiàn)。

流處理平臺(tái)通過提供持續(xù)的低延遲數(shù)據(jù)流和實(shí)時(shí)計(jì)算必不可少的基礎(chǔ)設(shè)施來滿足這些需求。沒有這個(gè)基礎(chǔ)，自主、協(xié)作的AI系統(tǒng)仍是遙不可及的夢想。

流處理是生成式AI的未來

生成式AI是我們在構(gòu)建和使用技術(shù)的方式上的一場根本性轉(zhuǎn)變。要充分發(fā)掘其潛力，我們需要與AI處理和獲得見解的方式保持一致的系統(tǒng)：持續(xù)、動(dòng)態(tài)、實(shí)時(shí)。流處理平臺(tái)為這種演變提供了基礎(chǔ)。

如果將AI應(yīng)用程序與流處理平臺(tái)集成，我們就可以：

從被動(dòng)AI系統(tǒng)轉(zhuǎn)向主動(dòng)AI系統(tǒng)。
支持實(shí)時(shí)個(gè)性化和決策。
確保LLM依據(jù)最新、最相關(guān)的數(shù)據(jù)運(yùn)行。
創(chuàng)建可擴(kuò)展的、靈活的架構(gòu)，可以隨AI的進(jìn)步而發(fā)展。

生成式AI不僅僅旨在構(gòu)建更智能的系統(tǒng)，還旨在構(gòu)建連續(xù)的、不斷變化的事件流。流處理平臺(tái)使這一切成為可能，彌合了昔日靜態(tài)系統(tǒng)與基于AI的動(dòng)態(tài)未來之間的缺口。

原文標(biāo)題：??Stop Treating Your LLM Like a Database??，作者：Sean Falconer

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

大語言模型

已于2025-1-3 10:12:31修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

EMNLP 2023｜利用LLM合成數(shù)據(jù)訓(xùn)練模型有哪些坑？

arnoldzhw ? 3188瀏覽 ? 0回復(fù)
OpenAI 36億收購數(shù)據(jù)庫初創(chuàng)公司，CTO劇透GPT-5

Crystalcxt ? 2194瀏覽 ? 0回復(fù)
從零實(shí)現(xiàn)大模型-GraphRAG，構(gòu)建LLM中的關(guān)系數(shù)據(jù)庫

魚蟲子 ? 2781瀏覽 ? 0回復(fù)
用 Dify 和 Notion 打造輕量級金融數(shù)據(jù)庫

開發(fā)者阿橙 ? 3920瀏覽 ? 0回復(fù)
能打造自己的聊天數(shù)據(jù)庫了

Aceryt ? 2340瀏覽 ? 0回復(fù)
LangChain-RAG必備：向量數(shù)據(jù)庫如何CRUD

ermulong ? 2337瀏覽 ? 0回復(fù)
RAG與本地知識(shí)庫，向量數(shù)據(jù)庫，以及知識(shí)圖譜的聯(lián)系與區(qū)別

AI探索時(shí)代 ? 4780瀏覽 ? 0回復(fù)
利用 Schemonic 優(yōu)化數(shù)據(jù)庫模式描述以降低大語言模型成本

AIGC前沿技術(shù)追蹤 ? 2160瀏覽 ? 0回復(fù)
利用Milvus向量數(shù)據(jù)庫，帶你實(shí)現(xiàn)GraphRAG

AI科技論談 ? 2347瀏覽 ? 0回復(fù)
大模型檢索增強(qiáng)生成之向量數(shù)據(jù)庫的問題

AI探索時(shí)代 ? 2077瀏覽 ? 0回復(fù)
LanceDB：為 AI 應(yīng)用打造的高效嵌入式向量數(shù)據(jù)庫

Syrupup ? 7344瀏覽 ? 0回復(fù)
怎么提升向量數(shù)據(jù)庫的召回準(zhǔn)確率

AI探索時(shí)代 ? 2253瀏覽 ? 0回復(fù)
圖數(shù)據(jù)庫的剪枝在大型語言模型中的知識(shí)表示

51CTO內(nèi)容精選 ? 1534瀏覽 ? 0回復(fù)
向量數(shù)據(jù)庫真的能滿足所有 AI Agent 的記憶需求嗎？

Baihai_IDP ? 1980瀏覽 ? 0回復(fù)
RAG：七種用于向量數(shù)據(jù)庫+相似性搜索的索引方法

Halo咯咯 ? 2296瀏覽 ? 0回復(fù)
向量相似性與圖數(shù)據(jù)庫的強(qiáng)強(qiáng)聯(lián)合

Halo咯咯 ? 2106瀏覽 ? 0回復(fù)
爆火 | API 終將淘汰，MCP+LLM+向量數(shù)據(jù)庫才是 Agent 開發(fā)新范式

玄姐聊AGI ? 2140瀏覽 ? 0回復(fù)
RAG實(shí)戰(zhàn) | 向量數(shù)據(jù)庫LanceDB指南

周末程序猿 ? 1423瀏覽 ? 0回復(fù)
技術(shù)前沿：CHASE-SQL與XiYan-SQL，解鎖自然語言與數(shù)據(jù)庫對話的奧秘！

Halo咯咯 ? 656瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenUI：從構(gòu)思到UI僅需數(shù)秒 11h前發(fā)布
MCP安全噩夢終結(jié)者：Agent框架如何重構(gòu)AI防護(hù)新范式？? 1天前發(fā)布

熱門推薦

模型上下文協(xié)議（MCP）開發(fā)實(shí)戰(zhàn)——構(gòu)建LangChain代理客戶端 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇： DDPG算法輕松解決AI醫(yī)療機(jī)器人技術(shù)難題：連續(xù)動(dòng)作控制

下一篇：機(jī)器學(xué)習(xí)用戶寶典：使用SVM解讀情感

社區(qū)精華內(nèi)容

目錄

<pre id="5y6yj"></pre><cite id="5y6yj"></cite>

<style id="5y6yj"><kbd id="5y6yj"></kbd></style>

<sub id="5y6yj"></sub>

<sub id="5y6yj"></sub>