自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

使用實(shí)時數(shù)據(jù)面臨的主要挑戰(zhàn)

大數(shù)據(jù) 人工智能
鑒于處理實(shí)時數(shù)據(jù)的獨(dú)特挑戰(zhàn),企業(yè)組織需要考慮哪些工具將幫助他們以最有效的方式部署和管理 AI 和 ML 模型。

分析實(shí)時數(shù)據(jù)一直對那些使用 ML 模型的人提出挑戰(zhàn),因?yàn)樗麄兿M褂米钚聰?shù)據(jù)提高推理的準(zhǔn)確性。

由于實(shí)時數(shù)據(jù)的交付速度對于手動分析或用于數(shù)據(jù)組織的傳統(tǒng)軟件來說太快了,因此只有 AI 和 ML 才能理解大量的流數(shù)據(jù)。但是,雖然使用實(shí)時數(shù)據(jù)是 ML 模型最有價值的應(yīng)用之一,但對于那些希望利用該工具進(jìn)行數(shù)據(jù)分析的人來說,它提出了幾個問題。

接下來,我們將討論那些試圖使用實(shí)時數(shù)據(jù)的人所面臨的一些主要挑戰(zhàn)以及克服這些挑戰(zhàn)的潛在方法

在哪些用例中,企業(yè)需要使用流數(shù)據(jù)而不是批處理數(shù)據(jù)?總的來說,數(shù)據(jù)流可以用于實(shí)時自動化決策,這可能涉及在復(fù)雜數(shù)據(jù)集的生產(chǎn)環(huán)境中利用機(jī)器學(xué)習(xí)模型。這方面的例子包括高頻交易中的算法交易、醫(yī)療設(shè)備的異常檢測、網(wǎng)絡(luò)安全中的入侵檢測或電子商務(wù)轉(zhuǎn)換/保留模型。因此,使用批處理數(shù)據(jù)屬于“其他所有事情”,實(shí)時決策和上下文不如有大量數(shù)據(jù)要分析重要。因此,使用批量數(shù)據(jù)屬于“其他所有”類別,在該類別中,實(shí)時決策和上下文并不重要,而是要分析大量數(shù)據(jù)。這方面的例子包括需求預(yù)測、客戶細(xì)分和多點(diǎn)觸控歸因。

使用實(shí)時數(shù)據(jù)的挑戰(zhàn)

雖然利用實(shí)時數(shù)據(jù)在連續(xù)數(shù)據(jù)流上訓(xùn)練ML 模型具有快速適應(yīng)變化和能夠節(jié)省數(shù)據(jù)存儲空間等優(yōu)勢,但也存在挑戰(zhàn)。將模型轉(zhuǎn)換為實(shí)時數(shù)據(jù)可能會產(chǎn)生額外的開銷,如果沒有正確考慮這些挑戰(zhàn),可能無法提供理想的結(jié)果。

實(shí)時的定義

處理實(shí)時數(shù)據(jù)提出了幾個挑戰(zhàn),首先是實(shí)時數(shù)據(jù)本身的概念。“實(shí)時”這個詞,不同的人有不同的理解。在分析環(huán)境中,一些人可能認(rèn)為實(shí)時意味著立即獲得答案,而另一些人不介意從收集數(shù)據(jù)的那一刻起等待幾分鐘,直到分析系統(tǒng)做出響應(yīng)。

這些對實(shí)時的不同定義可能會導(dǎo)致結(jié)果不明確的問題??紤]這樣一個場景,在這個場景中,管理團(tuán)隊(duì)對實(shí)時分析的期望和理解與實(shí)施它的人不同。不明確的定義會導(dǎo)致潛在用例和可以解決的業(yè)務(wù)活動(當(dāng)前和未來的)的不確定性。

恒定的數(shù)據(jù)速度和容量變化

一般來說,實(shí)時數(shù)據(jù)不會以一致的速度或數(shù)量流動,而且很難預(yù)測它的行為方式。與處理批處理數(shù)據(jù)不同,在管道中發(fā)現(xiàn)缺陷之前不斷重新啟動任務(wù)是不切實(shí)際的。由于數(shù)據(jù)不斷流動,處理數(shù)據(jù)時的任何錯誤都會對結(jié)果產(chǎn)生多米諾骨牌效應(yīng)。

實(shí)時數(shù)據(jù)處理階段的有限性進(jìn)一步阻礙了標(biāo)準(zhǔn)的故障排除過程。因此,盡管測試可能無法發(fā)現(xiàn)每個意外錯誤,但較新的測試平臺可以更好地調(diào)節(jié)和緩解問題。

數(shù)據(jù)質(zhì)量

從實(shí)時數(shù)據(jù)中獲得有用的見解還取決于數(shù)據(jù)的質(zhì)量。數(shù)據(jù)質(zhì)量的缺乏會影響整個分析工作流程,就像糟糕的數(shù)據(jù)收集可能會影響整個管道的性能一樣。沒有什么比從錯誤的數(shù)據(jù)中得出商業(yè)結(jié)論更糟糕的了。

通過分擔(dān)責(zé)任和民主化數(shù)據(jù)訪問,可以高度關(guān)注數(shù)據(jù)的正確性、全面性和完整性。有效的解決方案將確保每個職能部門的每個人都能認(rèn)識到準(zhǔn)確數(shù)據(jù)的價值,并鼓勵他們承擔(dān)起維護(hù)數(shù)據(jù)質(zhì)量的責(zé)任。此外,為了保證只使用值得信賴的數(shù)據(jù)源,必須使用自動化程序?qū)㈩愃频馁|(zhì)量政策應(yīng)用于實(shí)時數(shù)據(jù),因?yàn)檫@減少了不必要的分析工作。

各種數(shù)據(jù)源和格式

由于數(shù)據(jù)格式的多樣性和數(shù)據(jù)源數(shù)量的不斷增加,實(shí)時數(shù)據(jù)處理管道可能會面臨困難。例如,在電子商務(wù)中,活動監(jiān)控工具、電子活動跟蹤器和消費(fèi)者行為模型都跟蹤在線世界中的網(wǎng)絡(luò)活動。同樣,在制造業(yè)中,各種各樣的物聯(lián)網(wǎng)設(shè)備被用來從各種設(shè)備中收集性能數(shù)據(jù)。所有這些用例都有不同的數(shù)據(jù)收集方法,并且通常也有不同的數(shù)據(jù)格式。

由于數(shù)據(jù)的這些變化,API 規(guī)范更改或傳感器固件更新可能會導(dǎo)致實(shí)時數(shù)據(jù)流中斷。為了避免錯誤的分析和潛在的未來問題,實(shí)時數(shù)據(jù)必須考慮到無法記錄事件的情況。

過時的技術(shù)

各種新的信息來源給企業(yè)帶來了問題。當(dāng)前分析傳入數(shù)據(jù)的流程的規(guī)模已大幅增長。使用本地或云中的信息湖收集和準(zhǔn)備信息可能需要比預(yù)期更多的測試。

該問題主要源于遺留系統(tǒng)和技術(shù)的使用,這需要不斷擴(kuò)大的熟練信息設(shè)計師和工程師來獲取和同步信息,并創(chuàng)建將信息傳達(dá)給應(yīng)用程序所需的檢查管道。

鑒于處理實(shí)時數(shù)據(jù)的獨(dú)特挑戰(zhàn),企業(yè)組織需要考慮哪些工具將幫助他們以最有效的方式部署和管理 AI 和 ML 模型。一個簡單易用的界面可以讓團(tuán)隊(duì)中的任何人利用實(shí)時指標(biāo)和分析來跟蹤、衡量和幫助提高 ML 的性能,這將是理想的選擇。

基本的可觀察性功能,如生產(chǎn)中使用的數(shù)據(jù)的實(shí)時審計跟蹤,可以幫助團(tuán)隊(duì)輕松識別障礙的根本原因。最終,企業(yè)的競爭力可能取決于其從實(shí)時數(shù)據(jù)中獲得可操作的業(yè)務(wù)洞察力的能力,這些數(shù)據(jù)處理管道針對大量數(shù)據(jù)進(jìn)行了優(yōu)化,同時仍提供對模型性能的可見性。

責(zé)任編輯:姜華 來源: 千家網(wǎng)
相關(guān)推薦

2023-07-10 15:43:11

2023-08-10 07:04:13

2023-06-27 17:21:08

2023-10-08 07:00:12

2019-02-28 21:32:38

物聯(lián)網(wǎng)IOT技術(shù)

2023-03-20 11:12:19

2021-09-26 10:22:12

云計算云計算環(huán)境云應(yīng)用

2023-07-10 14:01:36

2018-04-27 22:59:10

大數(shù)據(jù)數(shù)據(jù)運(yùn)營

2024-08-29 09:41:45

2022-05-13 14:07:19

平臺運(yùn)維團(tuán)隊(duì)軟件開發(fā)

2011-12-30 11:15:50

Web

2016-08-29 20:52:57

2020-04-28 11:04:51

數(shù)據(jù)架構(gòu)互聯(lián)網(wǎng)Flink

2022-09-05 15:08:58

云計算IT工具

2013-04-17 09:28:11

數(shù)據(jù)遷移數(shù)據(jù)改寫

2018-09-20 10:10:34

2013-11-12 09:35:16

大數(shù)據(jù)

2020-12-08 10:07:26

首席信息官遠(yuǎn)程工作CIO

2012-08-24 08:51:27

IBMdW
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號