自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ul id="oyzg5"><center id="oyzg5"><progress id="oyzg5"></progress></center></ul>

<sub id="oyzg5"></sub>

<cite id="oyzg5"><track id="oyzg5"></track></cite>

<sub id="oyzg5"></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

選擇正確人工智能數(shù)據(jù)存儲的6個注意事項

作者：Chris Evans 2019-09-29 10:33:31

人工智能深度學(xué)習(xí)

企業(yè)如果采用錯誤的存儲人工智能平臺可能會產(chǎn)生嚴(yán)重影響，因此需要了解可能影響產(chǎn)品選擇和策略的6個注意事項。人工智能和機(jī)器學(xué)習(xí)將成為幫助企業(yè)利用其核心數(shù)字資產(chǎn)創(chuàng)造競爭優(yōu)勢的兩個最重要的工具。但在采用人工智能數(shù)據(jù)存儲之前，企業(yè)必須考慮一系列基于機(jī)器學(xué)習(xí)平臺如何獲取、處理和保留數(shù)據(jù)的需求。

企業(yè)如果采用錯誤的存儲人工智能平臺可能會產(chǎn)生嚴(yán)重影響，因此需要了解可能影響產(chǎn)品選擇和策略的6個注意事項。

人工智能和機(jī)器學(xué)習(xí)將成為幫助企業(yè)利用其核心數(shù)字資產(chǎn)創(chuàng)造競爭優(yōu)勢的兩個最重要的工具。但在采用人工智能數(shù)據(jù)存儲之前，企業(yè)必須考慮一系列基于機(jī)器學(xué)習(xí)平臺如何獲取、處理和保留數(shù)據(jù)的需求。

首先，企業(yè)需要檢查機(jī)器學(xué)習(xí)軟件使用的數(shù)據(jù)的生命周期，因為這可以幫助企業(yè)了解為人工智能選擇存儲時應(yīng)考慮的事項。最初，企業(yè)必須獲取數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)或人工智能算法。這些是處理數(shù)據(jù)以學(xué)習(xí)任務(wù)的軟件工具，例如識別對象、處理視頻和跟蹤運動。數(shù)據(jù)可以從多種來源產(chǎn)生，并且通常本質(zhì)上是非結(jié)構(gòu)化的，例如對象和文件。

人工智能的訓(xùn)練過程需要使用數(shù)據(jù)資產(chǎn)，并使用機(jī)器學(xué)習(xí)或人工智能軟件創(chuàng)建算法，以處理未來的數(shù)據(jù)源。在訓(xùn)練或開發(fā)算法時，人工智能軟件將處理源數(shù)據(jù)，以開發(fā)一個模型，該模型可以創(chuàng)建企業(yè)需要獲得的洞察力或收益。

開發(fā)機(jī)器學(xué)習(xí)算法很少作為一個單一的過程來完成。隨著企業(yè)積累新的數(shù)據(jù)，其算法得到了改進(jìn)和完善。這意味著很少的數(shù)據(jù)被丟棄，相反，它會隨著時間的推移而增長并重新處理。

購買人工智能數(shù)據(jù)存儲的標(biāo)準(zhǔn)

在企業(yè)為人工智能平臺選擇存儲之前，必須首先考慮以下注意事項：

1.成本。人工智能數(shù)據(jù)存儲的成本是企業(yè)考慮的關(guān)鍵因素。顯然，企業(yè)管理層和參與采購決策的管理人員都希望其存儲盡可能具有成本效益，并且在許多情況下，這將影響企業(yè)的產(chǎn)品選擇和策略。

2.可擴(kuò)展性。在此需要強(qiáng)調(diào)收集、存儲和處理大量數(shù)據(jù)以創(chuàng)建機(jī)器學(xué)習(xí)或人工智能模型的必要性。機(jī)器學(xué)習(xí)算法要求源數(shù)據(jù)呈指數(shù)增長，以實現(xiàn)精度的線性提高。創(chuàng)建可靠和準(zhǔn)確的機(jī)器學(xué)習(xí)模型可能需要數(shù)百TB甚至PB的數(shù)據(jù)，而且這只會隨著時間的推移而增加。

構(gòu)建PB級存儲系統(tǒng)通常意味著使用對象存儲或橫向擴(kuò)展文件系統(tǒng)?，F(xiàn)代對象存儲當(dāng)然可以解決人工智能工作負(fù)載的容量需求，但是它們可能無法滿足其他標(biāo)準(zhǔn)，例如高性能。橫向擴(kuò)展文件系統(tǒng)可以提供高性能和良好的可擴(kuò)展性，但是將整個數(shù)據(jù)集存儲在單個平臺上可能會很昂貴。由于可擴(kuò)展性要求和大容量產(chǎn)品的成本，塊存儲通常不是機(jī)器學(xué)習(xí)或人工智能的正確選擇，因為高容量產(chǎn)品的可擴(kuò)展性要求和成本。這里唯一的例外是在公共云中。

存儲成本的變化引入了分層或使用多種存儲類型來存儲數(shù)據(jù)的思想。例如，對象存儲是存儲大量非活動人工智能數(shù)據(jù)的良好目標(biāo)。當(dāng)需要處理數(shù)據(jù)時，可以將其移動到高性能文件存儲集群或為高性能而設(shè)計的對象存儲中的節(jié)點，并且在處理完成后可以將數(shù)據(jù)移回。

3.性能。人工智能數(shù)據(jù)的存儲性能包括三個方面。首先可能也是最重要的是延遲。這定義了軟件發(fā)出的每個I/O請求的處理速度。低延遲很重要，因為改善延遲會直接影響創(chuàng)建機(jī)器學(xué)習(xí)或人工智能模型所需的時間。復(fù)雜的模型開發(fā)可能需要數(shù)周或數(shù)月的時間才能運行。通過縮短此開發(fā)周期，企業(yè)可以更快地創(chuàng)建和完善模型。在檢查延遲功能時，由于對象訪問的數(shù)據(jù)流特性，對象將引用時間存儲到第一個字節(jié)，而不是單個I/O請求的延遲。

存儲性能的另一個方面是吞吐量，這是可以將數(shù)據(jù)寫入存儲平臺或從存儲平臺讀取數(shù)據(jù)的速度。系統(tǒng)吞吐量很重要，因為人工智能培訓(xùn)會處理大量數(shù)據(jù)集，通常會反復(fù)讀取和重新讀取相同的數(shù)據(jù)以準(zhǔn)確地開發(fā)模型。機(jī)器學(xué)習(xí)和人工智能數(shù)據(jù)的來源(例如自動駕駛汽車上的傳感器)每天可以產(chǎn)生數(shù)TB的新數(shù)據(jù)。所有這些信息都必須添加到現(xiàn)有數(shù)據(jù)存儲中，并且對任何現(xiàn)有處理的影響最小。

正確設(shè)置存儲平臺至關(guān)重要，因為涉及的數(shù)據(jù)量非常大。

存儲性能的最后一個方面是并行訪問。機(jī)器學(xué)習(xí)和人工智能算法并行處理數(shù)據(jù)，運行多個任務(wù)，這些任務(wù)可以多次讀取同一數(shù)據(jù)，并跨越多個并行任務(wù)。對象存儲擅長并行讀取I/O處理，因為沒有對象鎖定或?qū)傩钥晒芾?。文件服?wù)器跟蹤內(nèi)存中打開的I/O請求或文件句柄。因此，I/O請求的數(shù)量取決于平臺上可用的內(nèi)存。

機(jī)器學(xué)習(xí)的數(shù)據(jù)可以由大量的小文件組成。在這個領(lǐng)域，文件服務(wù)器可以提供比對象存儲更好的性能。向人工智能存儲供應(yīng)商提出的一個關(guān)鍵問題是，其產(chǎn)品的性能特征將如何在大文件類型和小文件類型之間發(fā)生變化。

4.可用性和耐用性。機(jī)器學(xué)習(xí)和人工智能學(xué)習(xí)模型可以長期連續(xù)運行。通過訓(xùn)練開發(fā)算法可能需要幾天或幾周的時間。在此期間，存儲系統(tǒng)必須啟動并持續(xù)可用。這意味著任何升級、技術(shù)更換或系統(tǒng)擴(kuò)展都需要在不停機(jī)的情況下進(jìn)行。

在大型系統(tǒng)中，部件故障是正常的，必須按此處理。這意味著用于人工智能工作的任何平臺都應(yīng)該能夠從設(shè)備(例如HDD硬盤或SSD硬盤)和節(jié)點或服務(wù)器故障中恢復(fù)。對象存儲使用擦除編碼在多個節(jié)點上廣泛分布數(shù)據(jù)，并將組件故障的影響降到很低。有擦除編碼技術(shù)可以擴(kuò)展文件系統(tǒng)以提供同等的彈性級別。擦除編碼方案的效率非常重要，因為它直接關(guān)系到讀寫I/O的性能，特別是對于小文件。

由于大多數(shù)大型對象存儲太大而無法定期備份，因此可靠的擦除編碼成為人工智能存儲平臺的基本功能。

5.公共云。開發(fā)機(jī)器學(xué)習(xí)和人工智能算法既需要高性能的存儲又需要高性能的計算。許多人工智能系統(tǒng)都基于GPU(例如Nvidia DGX)，可以減輕開發(fā)精確算法所涉及的許多復(fù)雜數(shù)學(xué)計算的負(fù)擔(dān)。

公共云服務(wù)提供商已開始提供可用于機(jī)器學(xué)習(xí)的GPU加速虛擬實例。在公共云中運行機(jī)器學(xué)習(xí)工具可以降低構(gòu)建機(jī)器學(xué)習(xí)開發(fā)基礎(chǔ)設(shè)施的投資和成本，同時提供擴(kuò)展開發(fā)機(jī)器學(xué)習(xí)模型所需基礎(chǔ)設(shè)施的能力。

使用公共云計算面臨的挑戰(zhàn)是如何以經(jīng)濟(jì)高效和實用的方式將數(shù)據(jù)導(dǎo)入公共云?；谠朴嬎愕膶ο蟠鎯λ俣忍瑹o法滿足機(jī)器學(xué)習(xí)的I/O需求;因此，必須使用本地塊存儲。每延遲一分鐘傳輸數(shù)據(jù)以及執(zhí)行機(jī)器學(xué)習(xí)的延遲，就意味著增加運行基礎(chǔ)設(shè)施的成本。

公共云的另一個問題是數(shù)據(jù)出口的成本。盡管云計算服務(wù)提供商不收取將數(shù)據(jù)移動到其平臺的費用，但他們確實會收取從其平臺之外的公共網(wǎng)絡(luò)訪問的任何數(shù)據(jù)的費用。因此，盡管公共云在計算方面提供了靈活性，但以一種及時且經(jīng)濟(jì)高效的方式在云中進(jìn)出數(shù)據(jù)并不總是那么簡單。

供應(yīng)商正在開發(fā)存儲產(chǎn)品，以在其內(nèi)部部署和公共云中運行其產(chǎn)品。這些產(chǎn)品可以有效地復(fù)制數(shù)據(jù)或?qū)?shù)據(jù)移至云中，并且只在完成后才將結(jié)果移回。這些復(fù)制技術(shù)具有高帶寬效率，使在本地存儲數(shù)據(jù)并導(dǎo)入到云中進(jìn)行分析工作變得切實可行。

6. 整合。在本文中，將機(jī)器學(xué)習(xí)和人工智能的存儲方面與計算隔離開來。構(gòu)建人工智能數(shù)據(jù)存儲可能很困難，因為存儲網(wǎng)絡(luò)和調(diào)整存儲必須考慮其他因素才能與機(jī)器學(xué)習(xí)應(yīng)用程序一起工作。

產(chǎn)品的預(yù)包裝使供應(yīng)商能夠在將產(chǎn)品交付給客戶之前對其產(chǎn)品進(jìn)行測試和優(yōu)化。如今，有一些存儲產(chǎn)品將流行的人工智能軟件、通用CPU和GPU等計算、網(wǎng)絡(luò)和存儲設(shè)備結(jié)合在一起，以提供支持人工智能的平臺。在部署這些系統(tǒng)之前，許多詳細(xì)的調(diào)整工作已完成。盡管成本可能是一個問題，但對于許多客戶而言，預(yù)包裝的系統(tǒng)可以減少采用人工智能存儲的障礙。

顯然，選擇合適的人工智能數(shù)據(jù)存儲平臺是性能、可擴(kuò)展性和成本等指標(biāo)的平衡。正確使用存儲平臺至關(guān)重要，因為涉及的數(shù)據(jù)量很大。選擇錯誤的產(chǎn)品可能是一個代價高昂的錯誤。與任何存儲產(chǎn)品決策一樣，重要的是與供應(yīng)商溝通，以準(zhǔn)確了解他們的產(chǎn)品如何滿足人工智能和機(jī)器學(xué)習(xí)的需要。該參與過程應(yīng)該包括演示和評估，并作為企業(yè)采購決策的前奏。

責(zé)任編輯：華軒來源：企業(yè)網(wǎng)D1Net

人工智能數(shù)據(jù)存儲

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營