自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大規(guī)模存儲基礎(chǔ)設(shè)施對人工智能的要求

存儲 人工智能
存儲基礎(chǔ)設(shè)施采用人工智能技術(shù)提高了容量和性能方面的要求。對于采用人工智能或機器學習的存儲環(huán)境來說,存儲容量增長到幾十TB甚至數(shù)百TB的情況并不少見。

存儲基礎(chǔ)設(shè)施采用人工智能技術(shù)提高了容量和性能方面的要求。對于采用人工智能或機器學習的存儲環(huán)境來說,存儲容量增長到幾十TB甚至數(shù)百TB的情況并不少見。盡管提供全閃存陣列產(chǎn)品的供應(yīng)商聲稱,這么龐大的數(shù)據(jù)無法全部存儲在全閃存陣列上,但由于它們具有的并行性質(zhì),大多數(shù)存儲環(huán)境從硬盤獲得的服務(wù)幾乎與從閃存獲得的服務(wù)一樣好。

[[322749]]

要求1:高性能網(wǎng)絡(luò)

對于人工智能/機器學習環(huán)境來說,創(chuàng)建使用內(nèi)部部署或直接連接存儲(DAS)的計算服務(wù)器集群的情況并不少見。即使共享存儲在使用容量和將工作負載更均勻地分配給計算節(jié)點方面效率更高,很多組織仍然愿意犧牲這些效率來消除計算節(jié)點與共享存儲之間創(chuàng)建的網(wǎng)絡(luò)延遲。

NVMe光纖網(wǎng)絡(luò)(NVMe-oF)是專門為基于內(nèi)存的存儲設(shè)備(如閃存和非易失性內(nèi)存)設(shè)計的下一代網(wǎng)絡(luò)。它提供的延遲幾乎與DAS NVMe相同。NVMe的深度命令和隊列深度使其也非常適合高度并行化的工作負載,并且人工智能/機器學習可能是所有工作負載中最為并行的技術(shù)。NVMe-oF是專門為內(nèi)存存儲而設(shè)計的,但它也是為人工智能/機器學習量身定制的。

要求2:共享存儲

如果NVMe-oF可以解決計算與存儲之間的延遲問題,那么它將啟用第二個要求,即共享存儲。通過NVMe-oF連接的共享存儲解決方案,工作負載可以受益于共享存儲的所有自然屬性。首先,所有節(jié)點都可以訪問所有數(shù)據(jù),這意味著工作負載可以更均勻地分配其計算負載,這也意味著具有圖形處理單元(GPU)的節(jié)點可以訪問所有數(shù)據(jù)。由于GPU的價格比CPU貴得多,因此讓GPU處理更多的負載是當務(wù)之急,而共享存儲則使這一工作變得更加容易。

在衡量數(shù)十個甚至幾百PB的工作負載容量需求時,存儲效率的提高都可以節(jié)省大量成本。在具有用于每個計算節(jié)點的專用硬盤的集群中,IT團隊無法輕松地將可用存儲容量重新分配給集群中的其他節(jié)點。直接連接存儲(DAS)模型中缺乏資源池,這也意味著組織無法有效使用制造商推向市場的大容量硬盤。現(xiàn)在,具有雙重用途的節(jié)點(計算和存儲)可能會安裝12個或更多的16TB的閃存或18TB的硬盤,而單個節(jié)點可能無法有效使用。如果人工智能/機器學習存儲體系結(jié)構(gòu)從專用服務(wù)器中集中使用這些硬盤,則可以對其進行更精細的分配。人工智能/機器學習工作負載不僅需要擴展以滿足容量需求,而且還必須可以直接訪問存儲節(jié)點以滿足性能需求。

要求3:分層存儲

鑒于人工智能/機器學習數(shù)據(jù)集的規(guī)模,分層存儲幾乎是必須的措施,因為配置數(shù)十PB的閃存設(shè)備太昂貴了。事實上,某些人工智能工作負載并不遵循80/20規(guī)則,在任何給定時間,80%的數(shù)據(jù)都是不活躍的。這些工作負載可以從100%休眠狀態(tài)變?yōu)?00%活躍狀態(tài)。盡管如此,它們還是高度并行的,并且數(shù)百個性能較低的機械硬盤都可以同時滿足工作負載的需求,因此應(yīng)該可以提供這些工作負載所需的性能。如果沒有,他們可以在當前網(wǎng)絡(luò)技術(shù)允許的范圍內(nèi)盡快傳送數(shù)據(jù)。

要求4:并行訪問

并行訪問意味著存儲基礎(chǔ)設(shè)施中的每個節(jié)點為人工智能/機器學習集群中的每個計算節(jié)點提供對其所需數(shù)據(jù)的直接訪問。單個控制節(jié)點不會成為瓶頸。高級別的并行性對于人工智能/機器學習至關(guān)重要,因為可能需要同時訪問存儲池的計算節(jié)點數(shù)量眾多。正是這種并行性使吞吐量能夠使硬盤在人工智能/機器學習存儲基礎(chǔ)設(shè)施中成為一個組件。并行文件系統(tǒng)幾乎總是需要客戶端或代理,但是該代理除了提供并行訪問之外,還經(jīng)常需要比典型NFS協(xié)議更少的開銷。

要求5 :多種協(xié)議

盡管需要并行訪問進行處理,但另一個要求是多協(xié)議訪問,這對于將數(shù)據(jù)提取到存儲基礎(chǔ)設(shè)施中特別有幫助。許多人工智能和機器學習項目都從物聯(lián)網(wǎng)(IoT)設(shè)備接收數(shù)據(jù),這些設(shè)備通常需要與其附帶的協(xié)議進行通信。許多設(shè)備通過服務(wù)器消息塊(SMB)或網(wǎng)絡(luò)文件系統(tǒng)(NFS)進行通信,少數(shù)設(shè)備使用S3存儲桶。更重要的是,幾乎沒有人使用原生并行文件系統(tǒng)客戶端。

要求6 :高級元數(shù)據(jù)處理

人工智能/機器學習的工作負載是元數(shù)據(jù)繁重的負載,盡管通常不是因為它們像媒體和娛樂的工作負載那樣使用豐富的元數(shù)據(jù)。元數(shù)據(jù)在人工智能/機器學習工作負載中的重要性來自其通用文件的數(shù)量。在大多數(shù)情況下,數(shù)十億至數(shù)百PB的人工智能工作負載由數(shù)十億個文件組成。這些文件中的每個文件都有元數(shù)據(jù),就像其他工作負載一樣,大部分IO事務(wù)都來自元數(shù)據(jù)。人工智能/機器學習存儲基礎(chǔ)設(shè)施必須管理元數(shù)據(jù),以便即使文件數(shù)量增加,它也可以維持系統(tǒng)的性能。元數(shù)據(jù)需要在整個存儲集群中進行分配,以便所有節(jié)點都可以參與其管理。供應(yīng)商可能還會查看每個存儲節(jié)點中閃存上的存儲元數(shù)據(jù),以確保系統(tǒng)始終能夠響應(yīng)。

結(jié)論

人工智能/機器學習工作負載與組織過去可能運行的其他工作負載有著根本的不同。早期的人工智能/機器學習項目已經(jīng)依靠直接連接存儲(DAS)進行數(shù)據(jù)存儲。問題在于直接連接存儲(DAS)無法平均分配負載,這對于每個人工智能工作負載的GPU數(shù)量增加至關(guān)重要。而且,直接連接存儲(DAS)效率很低,復(fù)制和移動數(shù)據(jù)所花費的容量和時間上的浪費將會消除機械硬盤的價格優(yōu)勢。

 

責任編輯:趙寧寧 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2020-02-13 13:32:29

人工智能AI機器學習

2016-02-22 10:56:25

2020-04-22 11:26:08

人工智能基礎(chǔ)設(shè)施AI

2022-09-22 11:12:17

人工智能AI

2022-07-18 18:11:33

邊緣計算人工智能云計算

2024-06-18 10:45:05

2023-02-08 14:21:09

2020-01-14 10:59:45

人工智能技術(shù)存儲

2023-02-01 11:30:08

人工智能云計算數(shù)據(jù)中心

2025-02-17 08:06:13

2025-04-30 17:05:25

2009-05-15 09:10:34

日本云計算Kasumigasek

2024-02-02 10:41:01

人工智能電動汽車

2019-01-28 20:50:19

人工智能機器人AI

2025-02-14 16:08:19

2024-03-07 11:19:28

光纖數(shù)據(jù)中心基礎(chǔ)設(shè)施

2023-09-06 14:28:25

2024-01-04 11:43:18

人工智能AI基礎(chǔ)設(shè)施

2023-09-06 17:55:54

2023-06-16 15:12:18

人工智能
點贊
收藏

51CTO技術(shù)棧公眾號