一文看懂分級存儲管理(HSM)
譯文譯者 | 布加迪
審校 | 孫淑娟
如果您負(fù)責(zé)管理企業(yè)數(shù)據(jù),就知道存儲有利有弊。一方面,能夠訪問大量數(shù)據(jù)對商業(yè)決策大有幫助。另一方面,存儲所有這些數(shù)據(jù)可能很費(fèi)錢,而且管理起來非?;靵y。
這時候分級存儲管理(HSM)就有了用武之地。HSM是一種以安全、經(jīng)濟(jì)高效的方式存儲數(shù)據(jù)的系統(tǒng)。本文簡要介紹了HSM、定義、工作原理以及它為貴組織帶來的一些好處。
1、HSM是什么?
分級存儲管理(HSM)是一種以安全、經(jīng)濟(jì)高效的方式存儲數(shù)據(jù)的系統(tǒng)。HSM背后的基本想法是將數(shù)據(jù)存儲在類型最合適的存儲介質(zhì)上,這取決于訪問數(shù)據(jù)的頻次。
比如說,訪問頻繁的數(shù)據(jù)可以存儲在較昂貴、性能較高的存儲介質(zhì)上,比如固態(tài)硬盤(SSD),而訪問不大頻繁的數(shù)據(jù)可以存儲在較便宜、性能較低的存儲介質(zhì)上,比如普通硬盤(HDD)。
雖然HSM是一個由來已久的概念,但由于技術(shù)存儲和通信方法方面的進(jìn)步,自問世以來已發(fā)生了巨大的變化。然而,盡管數(shù)據(jù)大小和訪問時間等方面今非昔比,但很多最初的概念今天仍然很受歡迎,只是在處理大數(shù)據(jù)時規(guī)模要大得多。
2、HSM系統(tǒng)是如何工作的?
HSM系統(tǒng)的工作原理是,根據(jù)數(shù)據(jù)需要訪問的頻次,在不同的存儲層之間自動移動數(shù)據(jù)。頻繁訪問的數(shù)據(jù)將存儲在快速、昂貴的存儲介質(zhì)(比如SSD)上,不常訪問的數(shù)據(jù)將被轉(zhuǎn)移到較慢、較便宜的存儲介質(zhì)上。這確保了用戶總是能夠快速訪問所需的數(shù)據(jù),同時又盡量降低存儲成本和用電量。
HSM可與大多數(shù)計(jì)算機(jī)CPU上的緩存相媲美。與CPU緩存一樣,經(jīng)常使用的數(shù)據(jù)存儲在小而快的SRAM內(nèi)存中,不常使用的數(shù)據(jù)在需要加載新數(shù)據(jù)時轉(zhuǎn)移到較慢但較大的DRAM中。
3、HSM組件和算法
HSM系統(tǒng)通常由三個關(guān)鍵組件組成:數(shù)據(jù)遷移策略、數(shù)據(jù)管理算法和數(shù)據(jù)分層或緩存機(jī)制。數(shù)據(jù)遷移策略根據(jù)使用頻次或重要性等因素,定義了應(yīng)該如何在不同的存儲設(shè)備之間移動數(shù)據(jù)。HSM系統(tǒng)使用的算法可以根據(jù)數(shù)據(jù)訪問的頻次或數(shù)據(jù)大小等標(biāo)準(zhǔn),幫助確定哪些數(shù)據(jù)應(yīng)該存儲在哪個設(shè)備上。
其中一些算法包括最近最少使用置換算法,將最近沒有被訪問的數(shù)據(jù)移動到性能較低的存儲層。大小溫度置換算法是另一種常用的算法,它使用溫度閾值和大小閾值來確定何時遷移數(shù)據(jù)。啟發(fā)式閾值算法是一種較新的算法,利用機(jī)器學(xué)習(xí)技術(shù)更準(zhǔn)確地預(yù)測何時應(yīng)該遷移數(shù)據(jù)。
4、分層和緩存HSM
關(guān)于分層還是緩存的爭論是HSM系統(tǒng)設(shè)計(jì)師在試圖確定利用較低性能存儲層的最佳方法時所面臨的問題。分層可以提供更好的長期性能,而緩存可以提供更好的短期性能。
無論您選擇對存儲進(jìn)行分層還是緩存,這些機(jī)制都可以確保頻繁訪問的數(shù)據(jù)存儲在較快、較容易訪問的設(shè)備上,而不常訪問的數(shù)據(jù)存儲在較慢、較便宜的設(shè)備上。
5、HSM的好處
節(jié)省成本:HSM系統(tǒng)讓用戶可以在任何可能的情況下將數(shù)據(jù)存儲在較便宜的存儲介質(zhì)上,以便企業(yè)節(jié)省總體存儲成本。
提升性能:HSM系統(tǒng)讓用戶可以將頻繁訪問的數(shù)據(jù)存儲在高性能存儲介質(zhì)(比如SSD)上,從而提升系統(tǒng)的整體性能。
加強(qiáng)安全:分級存儲管理系統(tǒng)讓用戶可以將敏感數(shù)據(jù)存儲在較安全的存儲介質(zhì)上,如具有加密功能的SSD或HDD。這些選項(xiàng)有助于加強(qiáng)系統(tǒng)的總體安全性。
改進(jìn)可管理性:HSM系統(tǒng)讓用戶可以根據(jù)訪問數(shù)據(jù)的頻次,將數(shù)據(jù)存儲在不同類型的存儲介質(zhì)上。它們可以在需要時更容易查找和檢索特定文件,從而幫助改進(jìn)系統(tǒng)的整體可管理性。
6、主流的HSM解決方案
如今,市面上有許多不同的HSM解決方案。一些面向大數(shù)據(jù)的主要HSM解決方案包括如下:
- IBM Spectrum Scale
- EMC Celerra / VNX
- NetApp FAS /AFF
- HPE 3 par StoreServe
- 華為OceanStor Dorado
- Qumulo Core
- Red Hat Ceph Storage
請注意,上面這份清單并不完整,也不按特定的順序。目前市場上有許多不同的HSM解決方案,因此確保您的存儲工程師及其他數(shù)據(jù)專業(yè)人員花一些時間來比較幾款解決方案,以找到最適合貴公司需求的解決方案。
原文鏈接:https://www.techrepublic.com/article/what-is-hierarchical-storage-management/