自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<p id="i9zbt"></p>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

AI在數(shù)據(jù)存儲與管理中的應(yīng)用：3個案例

發(fā)布于 2025-4-11 00:21

瀏覽

0收藏

?MinIO

MinIO AIStor與Model Context Protocol（MCP）Server

應(yīng)用的AI能力

- 自然語言處理（NLP）：支持與主流大語言模型（LLMs）如Anthropic Claude或OpenAI GPT集成，用戶可通過自然語言進(jìn)行意圖驅(qū)動的查詢（如：“Find unclassified images in bucket X”），無需編寫結(jié)構(gòu)化命令，從而實現(xiàn)對存儲系統(tǒng)的類對話式交互。

- 自動元數(shù)據(jù)標(biāo)注：借助MCP Server的 `ask-object` 功能，通過AI模型自動提取和分類非結(jié)構(gòu)化數(shù)據(jù)（如圖像元數(shù)據(jù)），可能基于嵌入式生成式或分類模型在LLM框架內(nèi)完成。

- GPU加速處理：通過Nvidia GPUDirect Storage與RDMA及BlueField SuperNICs實現(xiàn)200GbE高速吞吐，顯著優(yōu)化AI工作負(fù)載中的數(shù)據(jù)傳輸效率。

AI在數(shù)據(jù)存儲與管理中的應(yīng)用：3個案例-AI.x社區(qū)

所解決的問題

- 對象檢索依賴手動腳本：傳統(tǒng)S3兼容存儲需結(jié)合 `aws s3 ls` 等命令與Python腳本實現(xiàn)對象定位與處理，效率低下，尤其難以應(yīng)對大規(guī)模數(shù)據(jù)集。

- 查詢與標(biāo)注延遲高：傳統(tǒng)對象存儲在面對非結(jié)構(gòu)化數(shù)據(jù)（如圖像、日志）時，查詢響應(yīng)延遲大、元數(shù)據(jù)需手動標(biāo)注，成為AI/ML訓(xùn)練前數(shù)據(jù)準(zhǔn)備及數(shù)據(jù)治理的瓶頸。

- 場景背景：該問題廣泛存在于PB級非結(jié)構(gòu)化數(shù)據(jù)管理中，影響高效數(shù)據(jù)發(fā)現(xiàn)、快速分類及合規(guī)治理任務(wù)的執(zhí)行。

技術(shù)原理（架構(gòu)與工作機(jī)制）

- 架構(gòu)集成：

- MCP Server是MinIO AIStor的核心組件，構(gòu)建在MinIO S3兼容對象存儲之上，充當(dāng)存儲后端與外部LLM之間的智能中間層。

- 基于MinIO現(xiàn)有的元數(shù)據(jù)索引機(jī)制（如AIStor Catalog），并在此基礎(chǔ)上引入AI驅(qū)動能力。

- 工作流程：

1. 查詢解析：用戶通過自然語言接口提交查詢請求（如：“List objects in 'raw-images' with tag 'unclassified'”），MCP Server 調(diào)用LLM將自然語言轉(zhuǎn)譯為結(jié)構(gòu)化MCP命令。

2. MCP指令執(zhí)行：MCP Server 與對象存儲層直接通信，繞過傳統(tǒng)S3 API調(diào)用，支持以下操作：

- `list-objects`：根據(jù)查詢條件列出匹配對象；

- `ask-object`：分析對象內(nèi)容（如圖像），提取元數(shù)據(jù)或生成語義標(biāo)簽；

- 自動標(biāo)注：AI分析結(jié)果轉(zhuǎn)化為元數(shù)據(jù)，寫入MinIO的元數(shù)據(jù)系統(tǒng)。

3. GPU加速：Nvidia GPUDirect RDMA 實現(xiàn)從存儲到GPU內(nèi)存的直接數(shù)據(jù)傳輸（基于200GbE網(wǎng)絡(luò)），顯著降低CPU開銷，加速對大規(guī)模數(shù)據(jù)集的LLM推理處理。

4. 反饋機(jī)制：自動生成的標(biāo)簽信息將反哺系統(tǒng)，持續(xù)提升后續(xù)查詢準(zhǔn)確性，并支持基于機(jī)器學(xué)習(xí)的數(shù)據(jù)治理任務(wù)（如合規(guī)審計）。

- 系統(tǒng)實時性特征：整體運(yùn)行接近實時，MCP Server的高效指令解析與GPU加速數(shù)據(jù)訪問使查詢執(zhí)行速度比傳統(tǒng)S3 API腳本快約10倍。

- 組件協(xié)同方式：MCP Server與MinIO的S3兼容層和AIStor Catalog深度集成，替代CLI/API為主的傳統(tǒng)交互方式，提供基于AI驅(qū)動的意圖式操作界面。

商業(yè)與運(yùn)營價值

- 10倍查詢提速：MCP Server顯著降低查詢延遲，使得面向AI模型訓(xùn)練、實時分析等時間敏感型場景的對象發(fā)現(xiàn)更加高效。

- 運(yùn)維負(fù)擔(dān)大幅降低：無需編寫腳本或手動標(biāo)注元數(shù)據(jù)，數(shù)據(jù)準(zhǔn)備時間可縮短約70%，同時降低對專業(yè)技術(shù)人員的依賴，并減少人為錯誤。

- 高可擴(kuò)展性：GPU集成保障在PB級數(shù)據(jù)集下也能保持一致的吞吐性能，適用于企業(yè)級AI場景，如自動駕駛系統(tǒng)或科學(xué)研究。

- 數(shù)據(jù)治理能力增強(qiáng)：通過AI驅(qū)動的元數(shù)據(jù)自動標(biāo)注機(jī)制，實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的可發(fā)現(xiàn)性與可管理性，助力合規(guī)與審計流程，符合現(xiàn)代數(shù)據(jù)治理框架。

- 戰(zhàn)略價值提升：MinIO AIStor 是首個原生支持MCP協(xié)議的對象存儲產(chǎn)品，率先將存儲交互范式從“命令驅(qū)動”轉(zhuǎn)向“意圖驅(qū)動”，契合AIOps理念，在同類產(chǎn)品中具備差異化競爭優(yōu)勢。

Pure Storage

Pure1（基于云的AIOps平臺，內(nèi)嵌Pure1 Meta AI引擎）

所采用的AI能力

Pure1通過其內(nèi)置的Pure1 Meta AI引擎，集成了以下AI/ML能力：

- 預(yù)測性分析：用于容量預(yù)測、性能建模與工作負(fù)載仿真。

- 機(jī)器學(xué)習(xí)（ML）：利用監(jiān)督學(xué)習(xí)模型實現(xiàn)異常檢測、工作負(fù)載指紋識別（稱為“Workload DNA”），并主動解決潛在問題。

- 全棧分析（Full-Stack Analytics）：從存儲陣列到虛擬機(jī)（如VMware）收集遙測數(shù)據(jù)，實現(xiàn)端到端可觀測性。

- 自然語言處理（NLP）：AI Copilot功能（目前處于預(yù)覽階段），將支持以自然語言進(jìn)行故障排查與性能優(yōu)化查詢。

AI在數(shù)據(jù)存儲與管理中的應(yīng)用：3個案例-AI.x社區(qū)

所解決的問題

- 主動問題處理：傳統(tǒng)系統(tǒng)中以響應(yīng)式方式進(jìn)行故障排查，往往導(dǎo)致計劃外停機(jī)及SLA違約。

- 容量與性能規(guī)劃：依賴人工預(yù)測容易造成資源過度配置（浪費）或資源不足（性能瓶頸）。

- 工作負(fù)載整合風(fēng)險：在缺乏兼容性與性能影響可視化的前提下進(jìn)行遷移或擴(kuò)展，容易引發(fā)服務(wù)質(zhì)量下降，尤其對AI與數(shù)據(jù)庫等對延遲敏感的應(yīng)用尤為關(guān)鍵。

工作機(jī)制（技術(shù)概覽）

Pure1作為一款云原生AIOps平臺，通過持續(xù)遙測數(shù)據(jù)流水線與Pure Storage存儲陣列（如FlashArray//M、//X及FlashBlade）集成。以下是其技術(shù)組成：

數(shù)據(jù)流水線

- 每日從全球逾10000臺云連接陣列中采集約1萬億個遙測數(shù)據(jù)點，涵蓋IOPS、延遲、吞吐量與工作負(fù)載模式等關(guān)鍵指標(biāo)。

- 所有遙測數(shù)據(jù)匯聚至一個超過7PB的數(shù)據(jù)湖，由Pure1 Meta引擎處理并用于訓(xùn)練ML模型。

AI集成能力

- Workload DNA：通過對10萬+工作負(fù)載配置文件進(jìn)行ML分析，提取指紋特征——這些為基于讀取/寫入比、塊大小、增長趨勢等指標(biāo)建立的標(biāo)準(zhǔn)化行為模型，用于預(yù)測在整合或擴(kuò)展場景下的工作負(fù)載兼容性與交互情況。

- 實時指紋比對：Pure1 Meta持續(xù)將遙測數(shù)據(jù)與預(yù)定義的“問題指紋庫”進(jìn)行匹配，實現(xiàn)異常檢測，并自動生成支持工單。

- Pure1 Workload Planner：預(yù)測性工作負(fù)載規(guī)劃工具，基于ML預(yù)測能力對遷移操作（如從FlashArray//M遷移至//X、添加虛擬機(jī)等）進(jìn)行模擬，并給出容量與性能優(yōu)化建議。

- 支持自動化：系統(tǒng)集成Pure Storage支持基礎(chǔ)設(shè)施，結(jié)合異常檢測與歷史數(shù)據(jù)主動處理問題。

架構(gòu)與工作流程

- Pure1部署于云端，通過安全連接接口與本地陣列交互，幾乎實時運(yùn)行，可通過Web儀表盤或移動應(yīng)用提供可視化洞察。

- 全棧分析能力支持下鉆至虛擬機(jī)層級的性能指標(biāo)，識別跨層級（如存儲與虛擬化平臺之間）瓶頸。

- 通過反饋機(jī)制，實現(xiàn)基于Meta洞察的非中斷式固件更新（Purity OS）。

新興NLP功能

AI Copilot將支持基于自然語言的查詢（如“為什么我的數(shù)據(jù)庫運(yùn)行緩慢？”），并通過遙測數(shù)據(jù)分析提供故障診斷與修復(fù)建議。

該系統(tǒng)不依賴本地AI硬件，即可實現(xiàn)主動管理，并通過對整個客戶部署群體的學(xué)習(xí)優(yōu)化模型精度。

商業(yè)與運(yùn)營價值

- 降低宕機(jī)風(fēng)險：實時指紋識別與異常檢測可主動解決70%的已知問題，支撐Pure提出的“六個九”（99.9999%）高可用性承諾。

- 容量優(yōu)化：預(yù)測模型可提前12個月預(yù)測工作負(fù)載增長，幫助客戶減少過度配置，降低TCO。借助Workload DNA洞察，整合過程中的資源利用率可達(dá)95%以上。

- 減少人工操作：自動化與主動支持降低了支持請求數(shù)量，并簡化系統(tǒng)升級，反映在其83.7的Net Promoter Score（NPS）上。

- 加速問題解決：通過映射存儲與虛擬機(jī)之間的性能瓶頸，全棧分析顯著縮短平均修復(fù)時間（MTTR），減少人工排查。

- 增強(qiáng)戰(zhàn)略靈活性：Workload Planner支持無風(fēng)險的遷移與擴(kuò)展，特別適用于AI工作負(fù)載與混合云場景。

Calsoft Inc.

Accelerato.AI：一個面向數(shù)據(jù)存儲與管理工作流的AI/ML驅(qū)動數(shù)據(jù)處理與自動化平臺。
生成式AI（Gen AI）服務(wù)：為數(shù)據(jù)治理、元數(shù)據(jù)管理與運(yùn)維自動化提供定制化解決方案，適用于各類存儲生態(tài)系統(tǒng)。

AI能力應(yīng)用

- 預(yù)測性分析：應(yīng)用有監(jiān)督與無監(jiān)督機(jī)器學(xué)習(xí)模型（如Random Forest）進(jìn)行存儲系統(tǒng)的容量預(yù)測、資產(chǎn)監(jiān)測與異常檢測。

- 生成式AI：通過對大語言模型（LLMs，如GPT-3/GPT-4）進(jìn)行微調(diào)，用于元數(shù)據(jù)標(biāo)注、文檔摘要生成以及數(shù)據(jù)管理任務(wù)中的自動腳本編寫。

- 自然語言處理（NLP）：處理文本以分類非結(jié)構(gòu)化數(shù)據(jù)，提升存儲資源中的可搜索性。

- 計算機(jī)視覺：主要應(yīng)用于相關(guān)場景（如缺陷檢測），在存儲特定場景中的使用較少，除非與IoT數(shù)據(jù)采集相結(jié)合。

核心技術(shù)組件

- 使用TensorFlow與PyTorch等框架進(jìn)行模型開發(fā)；

- 基于OpenAI GPT-4完成生成任務(wù)；

- 構(gòu)建基于Python的邊緣AI棧，與IoT傳感器及GitHub Copilot集成，實現(xiàn)自動化。

聚焦問題

- 運(yùn)維效率低下：數(shù)據(jù)生命周期管理中的大量手工操作（如資源配置、分層管理與QA測試）導(dǎo)致效率低、成本高。

- 數(shù)據(jù)復(fù)雜性提升：在IoT、零售與醫(yī)療等領(lǐng)域，海量非結(jié)構(gòu)化數(shù)據(jù)難以通過傳統(tǒng)存儲系統(tǒng)進(jìn)行高效組織與檢索。

- 安全與合規(guī)壓力：需在混合多云環(huán)境中實現(xiàn)實時異常檢測（如勒索軟件攻擊、數(shù)據(jù)泄露），以滿足服務(wù)等級協(xié)議（SLA）與監(jiān)管要求。

- 可擴(kuò)展性挑戰(zhàn)：在存儲資源受限的環(huán)境下，需支撐AI訓(xùn)練、LLM推理及實時分析等高負(fù)載需求。

技術(shù)實現(xiàn)機(jī)制

Calsoft將AI技術(shù)實際集成進(jìn)其平臺，重點在于落地可行性。以下為Accelerato.AI與Gen AI服務(wù)在數(shù)據(jù)存儲與管理場景中的具體工作方式：

架構(gòu)集成方式

- Accelerato.AI：可作為中間件或獨立平臺部署，連接存儲陣列、SDS控制器與編排工具（如Kubernetes）。平臺從邊緣設(shè)備或IoT傳感器采集遙測與元數(shù)據(jù)，并通過預(yù)訓(xùn)練的ML模型（如Random Forest）進(jìn)行分類或回歸任務(wù)處理。

- Gen AI服務(wù)：對企業(yè)級數(shù)據(jù)集微調(diào)后的LLMs，通過RESTful API集成至存儲工作流中，實現(xiàn)元數(shù)據(jù)生成與治理自動化。這些服務(wù)通常部署在數(shù)據(jù)湖或?qū)ο蟠鎯ο到y(tǒng)（如S3兼容平臺）之上。

工作流程與數(shù)據(jù)流

1. 數(shù)據(jù)采集：Accelerato.AI實時收集來自分布式存儲節(jié)點或IoT終端的數(shù)據(jù)指標(biāo)（如IOPS、延遲、容量使用率）；Gen AI服務(wù)則負(fù)責(zé)接收非結(jié)構(gòu)化數(shù)據(jù)集（如日志、文檔）以供處理。

2. AI處理階段：

- 預(yù)測分析模型處理時間序列數(shù)據(jù)，用于容量預(yù)測或識別異常（如訪問模式異常）；

- 生成式AI處理元數(shù)據(jù)，生成標(biāo)簽或摘要以增強(qiáng)數(shù)據(jù)可發(fā)現(xiàn)性，例如將一份百頁的存儲日志自動總結(jié)為可執(zhí)行洞察；

- NLP算法對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類，并根據(jù)合規(guī)性或使用模式將數(shù)據(jù)路由至合適的存儲層級。

3. 執(zhí)行與響應(yīng)：AI引導(dǎo)自動化操作，例如將數(shù)據(jù)遷移至冷存儲、動態(tài)擴(kuò)展計算資源或通過儀表盤向管理員發(fā)出預(yù)警。

4. 反饋閉環(huán)：模型根據(jù)最新遙測數(shù)據(jù)或用戶交互結(jié)果持續(xù)動態(tài)再訓(xùn)練，確保在業(yè)務(wù)演進(jìn)中維持模型準(zhǔn)確性。

實時處理能力

通過與SmartHub.ai等合作伙伴的邊緣AI方案，部署輕量模型以支持近實時決策，如在NAS中實現(xiàn)異常檢測。Gen AI服務(wù)根據(jù)任務(wù)不同（如元數(shù)據(jù)標(biāo)注或?qū)崟r摘要）以批處理或近實時模式運(yùn)行。

系統(tǒng)組件集成方式

AI組件與現(xiàn)有基礎(chǔ)設(shè)施（如VMware、AWS）無縫集成，并通過CLI或GUI接口輔助存儲管理員。例如，Accelerato.AI可根據(jù)預(yù)測分析推薦最優(yōu)數(shù)據(jù)放置策略；Gen AI則可為QA團(tuán)隊自動生成存儲升級測試用例。

業(yè)務(wù)與運(yùn)營價值

- 運(yùn)維負(fù)擔(dān)顯著降低：在法律行業(yè)場景中，Gen AI在元數(shù)據(jù)管理與腳本自動生成任務(wù)中可節(jié)省約40%的行政處理時間，該能力可平移至數(shù)據(jù)治理任務(wù)中。

- 系統(tǒng)可用性提升：通過Accelerato.AI實現(xiàn)的預(yù)測性維護(hù)為某全球500強(qiáng)制造企業(yè)減少了30%的系統(tǒng)停機(jī)時間，可類比應(yīng)用于提升存儲系統(tǒng)穩(wěn)定性。

- 成本優(yōu)化：自動分層存儲與異常檢測機(jī)制優(yōu)化資源配置，避免資源超配，有效降低成本（如某電商平臺通過數(shù)據(jù)治理實現(xiàn)400萬美元收入增長）。

- 價值交付加速：在存儲部署過程中，Gen AI可通過自動生成測試用例將驗證周期縮短最多達(dá)40%。

- 增強(qiáng)安全保障：實時異常檢測提升了對安全事件的響應(yīng)能力，幫助金融、醫(yī)療等高度合規(guī)行業(yè)更好地規(guī)避數(shù)據(jù)泄露風(fēng)險。

本文轉(zhuǎn)載自??Andy730??，作者：常華

標(biāo)簽

數(shù)據(jù)

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

麻省理工分享ChatGPT，在教育的5個實際應(yīng)用案例

Aceryt ? 4942瀏覽 ? 0回復(fù)
第一人稱基礎(chǔ)模型——情感與生理數(shù)據(jù)在AI中的應(yīng)用

xuxiangda ? 2021瀏覽 ? 0回復(fù)
從數(shù)據(jù)倉庫到數(shù)據(jù)飛輪：技術(shù)進(jìn)化與實踐案例解析

wx6110dd2be671e ? 2113瀏覽 ? 0回復(fù)
AI存儲：存儲系統(tǒng)在優(yōu)化AI訓(xùn)練中的關(guān)鍵作用

chengganfei ? 4068瀏覽 ? 0回復(fù)
AI大模型在GIS中的應(yīng)用

zhishan15 ? 3914瀏覽 ? 0回復(fù)
AI賦能教育：人工智能在教育中的八大應(yīng)用實例

風(fēng)云2002_1 ? 9900瀏覽 ? 0回復(fù)
AI驅(qū)動對象存儲成為企業(yè)存儲主導(dǎo)技術(shù)

chengganfei ? 2091瀏覽 ? 0回復(fù)
分享3點關(guān)于AI 產(chǎn)品管理的最佳實踐

zhishan15 ? 1774瀏覽 ? 0回復(fù)
ChatGPT寫作指南發(fā)布：12個案例助力高效學(xué)習(xí)

云原生AI百寶箱 ? 4504瀏覽 ? 0回復(fù)
解鎖AI潛力：AI在銷售領(lǐng)域的應(yīng)用案例(非Chatbot)

Baihai_IDP ? 2387瀏覽 ? 0回復(fù)
AI驅(qū)動數(shù)據(jù)存儲變革：2025年五大趨勢展望

chengganfei ? 2384瀏覽 ? 0回復(fù)
大模型廠商視角的AI Agent綜述，Anthropic圖文并茂多個案例教你構(gòu)建有效智能體

王吉偉自頻道 ? 5164瀏覽 ? 0回復(fù)
AI 編程必備：用 Cline 的四個命令實現(xiàn)無縫上下文管理

凝固的雨_1 ? 5580瀏覽 ? 0回復(fù)
從國內(nèi)外十個智能體案例，看AI Agent在教育領(lǐng)域的應(yīng)用

王吉偉自頻道 ? 5226瀏覽 ? 0回復(fù)
數(shù)據(jù)多副本保留：AI時代企業(yè)存儲的戰(zhàn)略重點

chengganfei ? 1509瀏覽 ? 0回復(fù)
自己打包一個數(shù)據(jù)集代碼案例——使用Numpy計算框架自定義一個類似MINST的數(shù)據(jù)集

AI探索時代 ? 1473瀏覽 ? 0回復(fù)
AI大模型如何存儲海量數(shù)據(jù)？一文讀懂數(shù)據(jù)重刪和數(shù)據(jù)壓縮

數(shù)字化助推器 ? 769瀏覽 ? 0回復(fù)
人工智能中的數(shù)據(jù)重要性與數(shù)據(jù)預(yù)處理

parson2000 ? 917瀏覽 ? 0回復(fù)
AI多模態(tài)場景對數(shù)據(jù)管理帶來的挑戰(zhàn)有哪些？

DataForAI ? 166瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

麥肯錫：什么是AI代理？ 7天前發(fā)布
UB-Mesh：一種分層局部化的n維全互連數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu) 2025-03-31 01:39:11發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： UB-Mesh：一種分層局部化的n維全互連數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)

下一篇：麥肯錫：什么是AI代理？

社區(qū)精華內(nèi)容

目錄

<blockquote id="mtt8s"><i id="mtt8s"><video id="mtt8s"></video></i></blockquote>