云計(jì)算任務(wù)行之有效的方法
一個(gè)追求卓越品質(zhì)的云存儲(chǔ)解決方案提供商或服務(wù)商在解決云存儲(chǔ)問(wèn)題時(shí)不可避免要處理一些云計(jì)算任務(wù)。本文嘗試揭示一個(gè)事實(shí):一個(gè)志向遠(yuǎn)大的云存儲(chǔ)商為提供優(yōu)質(zhì)云存儲(chǔ)服務(wù),它所要解決的云計(jì)算問(wèn)題一般具有很強(qiáng)的挑戰(zhàn)性,屬于云計(jì)算問(wèn)題中比較難解決的一類。為此我們可以把一個(gè)計(jì)算問(wèn)題,不論是“在云上”計(jì)算的還是在“云下”本地計(jì)算的,抽象成為一個(gè)術(shù)語(yǔ)叫做“命令行”的如下表達(dá)式:
命令 輸入 輸出;
其中“命令”表示計(jì)算任務(wù)的執(zhí)行代碼,“輸入”表示計(jì)算任務(wù)所要處理的輸入數(shù)據(jù),而“輸出”表示計(jì)算任務(wù)完成后的輸出數(shù)據(jù)結(jié)果。舉一具體命令行的例子:
1.WordInFile OutFile; (用Office Word對(duì)文件InFile作文檔處理后將結(jié)果存儲(chǔ)為文件OutFile)
對(duì)于一個(gè)用戶,如果計(jì)算是“在云上”發(fā)生的,那么命令行“命令 輸入 輸出”是在用戶所租用的數(shù)據(jù)中心服務(wù)器上執(zhí)行的,用戶的輸入輸出數(shù)據(jù)也都存儲(chǔ)在數(shù)據(jù)中心。而在“云下”的情形,用戶則要用自己擁有的計(jì)算資源來(lái)執(zhí)行命令行并且還要自己存儲(chǔ)與管理數(shù)據(jù)。為了本文的目的,以下讓我們只考慮“在云上”的情形,并且用“云命令行”來(lái)稱呼一條在云上執(zhí)行的命令行。
于是云命令行描述了一個(gè)典型的云計(jì)算任務(wù),比如Google Docs就提供這樣的在線辦公軟件服務(wù)。一個(gè)優(yōu)質(zhì)的云存儲(chǔ)方案/服務(wù)提供商不可避免要解決一些云計(jì)算任務(wù)。我們也可以用云命令行來(lái)為這樣的云存儲(chǔ)商抽象描述出幾例它必須要執(zhí)行的云計(jì)算任務(wù)。
2.DeDupip1:v1ip2:v2; (用重復(fù)數(shù)據(jù)刪除處理方案DeDup對(duì)IP地址為ip1數(shù)據(jù)中心服務(wù)器邏輯磁盤卷v1做重復(fù)數(shù)據(jù)刪除,將結(jié)果存儲(chǔ)到IP地址為ip2數(shù)據(jù)中心服務(wù)器邏輯磁盤卷v2上。這條云命令行描述了一個(gè)優(yōu)質(zhì)云存儲(chǔ)服務(wù)商為降低服務(wù)成本而必須要做的一項(xiàng)云計(jì)算任務(wù)。)
3.LoadBalanceip-1ip-2…ip-n; (在IP地址為ip-1, ip-2, …, ip-n的服務(wù)器集群中做存儲(chǔ)附載均衡,使每個(gè)服務(wù)器均衡發(fā)揮處理與存儲(chǔ)數(shù)據(jù)的能力,以優(yōu)化服務(wù)質(zhì)量。)
4.RAICVip-1ip-2…ip-n; (將磁盤卷V冗余分布到IP地址為ip-1, ip-2, …, ip-n的“低成本冗余云存儲(chǔ)商陣列”中去,此處RAIC = Redundant Array of Inexpensive Cloud storage service providers。這些低成本云存儲(chǔ)商因?yàn)槭召M(fèi)低廉只能提供一些低端的,比如可能會(huì)掉線的,云存儲(chǔ)服務(wù),而不追求為了提高服務(wù)品質(zhì),比如提供不會(huì)掉線的云存儲(chǔ)服務(wù),所必須解決的云計(jì)算任務(wù)。
以上云命令行的例子(2),(3),(4)都還可以帶有云數(shù)據(jù)安全保護(hù),比如對(duì)(2)加上數(shù)據(jù)安全保護(hù),我們可以用下面類似Unix Pipe(管道)命令抽象出一個(gè)組合計(jì)算任務(wù):先對(duì)加密數(shù)據(jù)做解密,再進(jìn)行重復(fù)數(shù)據(jù)刪除,***將處理結(jié)果做加密存儲(chǔ)。下面是經(jīng)過(guò)如此管道組合后得到的云命令行例子:
5.Decrypt–passphraseip1:c1|DeDup|Encrypt–passphraseip2:c2; (這條組合云命令行稍許有點(diǎn)技術(shù)細(xì)節(jié),一般讀者略過(guò)這里的解釋無(wú)妨。其中passphrase是解密命令Decrypt與加密命令Encrypt所用的參數(shù),它指向一個(gè)密鑰讓程序Decrypt(Encrypt)對(duì)輸入(出)數(shù)據(jù)做解密(加密)處理;符號(hào)“|”叫做“管道”,用來(lái)通知操作系統(tǒng)順序操作Decrypt;DeDup;Encrypt)。
我們還可以同理對(duì)(2)和(4)做管道組和,將重復(fù)數(shù)據(jù)刪除分布到低成本冗余云存儲(chǔ)商陣列中去,得到的結(jié)果是既可靠又低成本。還可以再加上(5),對(duì)低成本可靠的云存儲(chǔ)服務(wù)做數(shù)據(jù)作安全保護(hù),以防止低成本云存儲(chǔ)商偷竊用戶數(shù)據(jù)。我們還可以考慮對(duì)云上數(shù)據(jù)作查詢檢索的任務(wù),而且還可以基于安全策略的查詢檢索,等等,不在此一一列舉。
為什么我們說(shuō)一個(gè)志向遠(yuǎn)大的,著眼于提供優(yōu)質(zhì)云存儲(chǔ)服務(wù)的云存儲(chǔ)商所要解決的云計(jì)算任務(wù)會(huì)比一般云計(jì)算任務(wù),比如云命令行(1)那樣的,更具有挑戰(zhàn)性呢?我們不妨作如下觀察:云命令行(1)一類的云計(jì)算任務(wù)通常為個(gè)體用戶所使用,為處理某個(gè)具體任務(wù),相對(duì)比較簡(jiǎn)單。所以因服務(wù)質(zhì)量問(wèn)題而對(duì)用戶造成的損害一般會(huì)比較有限,防范手段也相對(duì)容易實(shí)現(xiàn)。比如我們可以設(shè)想云命令行(1)在執(zhí)行時(shí)服務(wù)器宕機(jī)造成用戶數(shù)據(jù)丟失。一個(gè)簡(jiǎn)單的防范手段可以是讓云上的Word作頻繁的AutoSave。
一個(gè)比較大的計(jì)算任務(wù)也可以用比較頻繁的CheckPoint將計(jì)算中間狀態(tài)保存起來(lái),以減小由于宕機(jī)而造成的損失。而云計(jì)算命令行(2)至(5)一類,以及對(duì)它們加以稍有點(diǎn)想象力組合而得的云計(jì)算任務(wù)不僅可以針對(duì)個(gè)體用戶提供高端云存儲(chǔ)服務(wù),更加可能的情形是:這一類計(jì)算任務(wù)是我們通常稱之為“信息生命周期管理”(Information Lifecycle Management, ILM)的任務(wù),主要是高端云存儲(chǔ)服務(wù)商所提供的存儲(chǔ)服務(wù)內(nèi)容,其所面對(duì)的標(biāo)準(zhǔn)服務(wù)對(duì)象是企業(yè)或組織用戶。對(duì)這樣的用戶一般都要提供具備海量數(shù)據(jù)處理能力的ILM云存儲(chǔ)服務(wù),其相應(yīng)速度,可靠度,安全保護(hù),版本管理,查詢搜索質(zhì)量,等等,都必須是專業(yè)級(jí)的。對(duì)于這樣的ILM任務(wù),我們不難得出結(jié)論:云存儲(chǔ)比云計(jì)算更具挑戰(zhàn)性,云計(jì)算只是云存儲(chǔ)的一個(gè)子問(wèn)題。
【編輯推薦】