以人工智能為動(dòng)力的機(jī)器視覺的興起對(duì)企業(yè)數(shù)據(jù)管理產(chǎn)生了影響
人工智能驅(qū)動(dòng)的機(jī)器視覺每天都變得越來越強(qiáng)大和廣泛。機(jī)器視覺和人工智能的新應(yīng)用正在快速發(fā)展,尤其是在醫(yī)療保健、自動(dòng)車輛、制造業(yè)、農(nóng)業(yè)和安全等領(lǐng)域。
在醫(yī)療保健領(lǐng)域,機(jī)器視覺被用來快速分析成千上萬的X光片、CAT掃描和其他醫(yī)學(xué)圖像。它通過優(yōu)先考慮醫(yī)院急診室的病人治療來挽救生命。在交通運(yùn)輸行業(yè),人工智能驅(qū)動(dòng)的機(jī)器視覺系統(tǒng)使自主車輛能夠發(fā)現(xiàn)障礙物并安全地在道路上行駛。
機(jī)器視覺通過自動(dòng)缺陷檢測(cè)在制造業(yè)中也發(fā)揮著關(guān)鍵作用,數(shù)字農(nóng)業(yè)領(lǐng)域的快速擴(kuò)展部署了計(jì)算機(jī)視覺系統(tǒng)來限制甚至消除農(nóng)藥的使用,同時(shí)持續(xù)增加產(chǎn)量。
與機(jī)器視覺系統(tǒng)一樣有用的是,它們是大量非結(jié)構(gòu)化數(shù)據(jù)的來源。國(guó)際數(shù)據(jù)中心(IDC)的研究顯示,它們?cè)絹碓绞軞g迎是推動(dòng)全球數(shù)據(jù)收集量激增的一個(gè)重要因素,預(yù)計(jì)到2025年,全球數(shù)據(jù)收集量將繼續(xù)上升至163zettabytes。
由于人工智能驅(qū)動(dòng)的機(jī)器視覺的所有這些用途和所有這些數(shù)據(jù),它為企業(yè)創(chuàng)造了許多數(shù)據(jù)管理的含義。今天,大多數(shù)組織都面臨著相互沖突的數(shù)據(jù)管理需求。
大多數(shù)數(shù)據(jù)源于邊緣,但計(jì)算和存儲(chǔ)基礎(chǔ)設(shè)施通常集中在幾個(gè)大型數(shù)據(jù)中心或公共云上。將數(shù)據(jù)移動(dòng)到集中的位置會(huì)帶來與傳輸和存儲(chǔ)數(shù)據(jù)相關(guān)的重大延遲和成本。
對(duì)速度的需要
根據(jù)Gartner的數(shù)據(jù),到2025年,大約75%的企業(yè)生成的數(shù)據(jù)將在傳統(tǒng)數(shù)據(jù)中心或云之外創(chuàng)建和處理。目前,在邊緣捕獲的大多數(shù)數(shù)據(jù)都被移動(dòng)到一個(gè)集中的位置進(jìn)行處理,用于人工智能模型開發(fā)。
在實(shí)現(xiàn)機(jī)器視覺技術(shù)時(shí)必須考慮到這一點(diǎn)。對(duì)于任何捕獲和集中PB級(jí)非結(jié)構(gòu)化數(shù)據(jù)(無論是視頻、圖像還是傳感器數(shù)據(jù))的企業(yè)來說,這些負(fù)載大大減慢了機(jī)器學(xué)習(xí)算法的訓(xùn)練過程。這種集中的數(shù)據(jù)處理方法延遲了人工智能開發(fā)管道和生產(chǎn)模型的調(diào)整。在工業(yè)環(huán)境中,這可能會(huì)導(dǎo)致遺漏產(chǎn)品缺陷,可能會(huì)給企業(yè)帶來巨額損失,甚至危及生命。
為了解決這個(gè)問題,越來越多的企業(yè)開始轉(zhuǎn)向分布式、去中心化的體系結(jié)構(gòu)。這意味著大多數(shù)數(shù)據(jù)都在邊緣保存和處理,以解決延遲和延遲問題,并解決與數(shù)據(jù)處理速度相關(guān)的問題。邊緣分析和聯(lián)合機(jī)器學(xué)習(xí)技術(shù)的部署在解決集中式系統(tǒng)固有的安全性和隱私不足的同時(shí)帶來了顯著的好處。
例如,一個(gè)不斷捕捉視頻片段的大型監(jiān)控網(wǎng)絡(luò)會(huì)匯編大量原始數(shù)據(jù),以備日后分析。要有效地從視頻中訓(xùn)練ML模型,就必須對(duì)其進(jìn)行檢查,以區(qū)分視頻中的特定對(duì)象。只需要檢測(cè)到新事物的鏡頭,而不是可能捕捉到空無一人的建筑或街道的冗長(zhǎng)的不改變的視頻。通過在邊緣對(duì)數(shù)據(jù)進(jìn)行預(yù)分析,只將必要的鏡頭移到一個(gè)集中點(diǎn),企業(yè)可以節(jié)省時(shí)間、帶寬和成本。
雖然分布式體系結(jié)構(gòu)有許多優(yōu)點(diǎn),但它們也帶來了額外的復(fù)雜性。在邊緣選擇和部署適當(dāng)?shù)拇鎯?chǔ)和計(jì)算基礎(chǔ)架構(gòu)以及集中化的管理是至關(guān)重要的,它會(huì)顯著影響總體系統(tǒng)效率和擁有成本。
分層存儲(chǔ)
許多收集的圖像和視頻主要用于人工智能模型訓(xùn)練,應(yīng)永久性地存儲(chǔ)在不同的目的。例如,在高級(jí)駕駛員輔助系統(tǒng)和自動(dòng)駕駛車輛中,人工智能根據(jù)實(shí)時(shí)收集的數(shù)據(jù)做出決策。然而,如果一個(gè)問題出現(xiàn)——可能是幾個(gè)月或幾年之后——企業(yè)需要能夠回去分析發(fā)生了什么。盡管這種存儲(chǔ)對(duì)安全至關(guān)重要,但它的成本卻很高——據(jù)Gartner統(tǒng)計(jì),平均每TB每年需要3351美元。當(dāng)您考慮到平均每小時(shí)自動(dòng)測(cè)試車輛捕獲兩TB的數(shù)據(jù)時(shí),很容易看出成本是如何增加的。
許多存儲(chǔ)大量非結(jié)構(gòu)化數(shù)據(jù)的企業(yè)通常依賴于網(wǎng)絡(luò)連接存儲(chǔ)設(shè)備或公共云存儲(chǔ)。但是,采用分層數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)可以顯著節(jié)省成本。在分層系統(tǒng)中,在處理和分析數(shù)據(jù)的活動(dòng)期間,內(nèi)容被放在快速存儲(chǔ)上,而備份副本則被存儲(chǔ)和歸檔在成本較低的存儲(chǔ)上,如磁帶或?qū)ο蟠鎯?chǔ)。低成本存儲(chǔ)的規(guī)??梢缘椭撩縏B50美元。在許多部門,包括自動(dòng)駕駛車輛,大多數(shù)收集的數(shù)據(jù)需要無限期保存,但很少使用,可以以最低的成本存儲(chǔ)。
非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)解決方案和邊緣分析的新發(fā)展不斷沖擊市場(chǎng)。為了利用這些優(yōu)勢(shì),企業(yè)應(yīng)該從頭到尾地實(shí)施模塊化數(shù)據(jù)管理,以便在發(fā)布時(shí)能夠?qū)⒃亟粨Q為更先進(jìn)的技術(shù)。
利用機(jī)器視覺尋找新機(jī)會(huì)
即使有了最好的技術(shù)和服務(wù),成功地傳輸、處理和存儲(chǔ)為機(jī)器視覺用例捕獲的大量數(shù)據(jù)仍將繼續(xù)挑戰(zhàn)各種垂直領(lǐng)域的企業(yè)。
然而,存儲(chǔ)的數(shù)據(jù)也提供了一個(gè)新的機(jī)會(huì)。例如,可以重用圖像和視頻來開發(fā)新的用例。因此,存儲(chǔ)的數(shù)據(jù)將成為企業(yè)新的收入來源,而不是成本。同樣,當(dāng)更先進(jìn)的分析技術(shù)出現(xiàn)時(shí),許多企業(yè)可以重用現(xiàn)有的存檔數(shù)據(jù)來開發(fā)自己的新產(chǎn)品。一些公司,尤其是汽車制造商,已經(jīng)開始意識(shí)到這一潛力。這些潛在的新收入流和數(shù)據(jù)使用是現(xiàn)在開始優(yōu)先考慮智能高效的數(shù)據(jù)處理和存儲(chǔ)的絕佳理由。