極端環(huán)境下的系統(tǒng)部署——為好奇號(hào)進(jìn)行系統(tǒng)升級(jí)
譯文【51CTO精選譯文】美國(guó)宇航局正在著手準(zhǔn)備為好奇號(hào)火星探測(cè)器進(jìn)行系統(tǒng)升級(jí)。系統(tǒng)升級(jí)工作大家都知道,沒(méi)啥技術(shù)含量——不過(guò)好奇號(hào)有點(diǎn)特殊。就在不久之前它剛剛成功登陸火星,因此傳統(tǒng)的DVD或者USB啟動(dòng)盤(pán)之類(lèi)升級(jí)方案顯然無(wú)法奏效。而且出于成本考慮,找家快遞公司把系統(tǒng)盤(pán)帶過(guò)去的想法也被嚴(yán)謹(jǐn)?shù)目茖W(xué)人員否決了。
面對(duì)一系列難題,我開(kāi)始不禁設(shè)想美國(guó)宇航局的專(zhuān)家們會(huì)如何就此展開(kāi)討論:
“還有三個(gè)月好奇號(hào)探測(cè)器就要發(fā)射了,系統(tǒng)工作狀態(tài)怎么樣?”
“挺好,沒(méi)啥大問(wèn)題。雖然版本和功能有點(diǎn)落后,但應(yīng)該能解決。”
“有點(diǎn)落后?什么意思?”
“別緊張,只不過(guò)是驅(qū)動(dòng)程序有點(diǎn)小毛病。”
“哪些驅(qū)動(dòng)有問(wèn)題?”
“沒(méi)多少,就是輪胎控制不太好使……激光發(fā)射裝置也有故障。最關(guān)鍵的攝像機(jī)還是運(yùn)轉(zhuǎn)良好的,雖然目前只有黑白圖像,但已經(jīng)不錯(cuò)了。”
“好吧……你確定發(fā)射的時(shí)候一切都能恢復(fù)正常?”
“當(dāng)然,放心吧,其實(shí)我們已經(jīng)考慮過(guò)了,發(fā)射之后再給系統(tǒng)打補(bǔ)丁也是可行的。”
“打補(bǔ)???”
“對(duì),就像給PC機(jī)升級(jí)一樣,方便快捷。”
“你確定一切會(huì)進(jìn)展順利吧?”
“確定,咱們搞技術(shù)的經(jīng)常做系統(tǒng)升級(jí),老簡(jiǎn)單了。”
“但到時(shí)候這東西可就上火星了,你知道吧?這跟升級(jí)PC機(jī)能一樣嗎?”
“我知道,火星嘛,紅的圓的那個(gè)。沒(méi)事,我們已經(jīng)準(zhǔn)備了很好的方案構(gòu)思。”
“說(shuō)說(shuō)看。”
“你說(shuō)這東西要花多久才能上火星?”
“253天。”
“??!那就沒(méi)事了。有兩百多天,我們可以慢慢完善遠(yuǎn)程升級(jí)模塊。不怕跟你交個(gè)底,最壞的情況也不過(guò)是這東西需要重啟、而且有那么幾天不能正常工作。”
好奇號(hào)成功于火星著陸時(shí),我一直在收看由美國(guó)宇航局放出的直播影像,對(duì)高科技的贊嘆以及自豪的情感給我?guī)?lái)很大沖擊。技術(shù)人員為這次偉大計(jì)劃所做出的不懈努力令我深深著迷。對(duì)于這樣一個(gè)龐大的項(xiàng)目,任何一丁點(diǎn)偏差都會(huì)令巨額投入功虧一簣,它的成功也因此變得更加值得景仰。美國(guó)宇航局甚至專(zhuān)門(mén)制作了一部名為“恐怖七分鐘”的短片,詳細(xì)描述了此次太空探索活動(dòng)所遭遇過(guò)的病毒侵襲。當(dāng)好奇號(hào)終于踏上火星的瞬間,相信每位觀眾都在興奮之余感到一絲寬慰。
“能用就行”的觀念令人后怕
“能用就行”不是挺好嗎?答案恰恰相反,一切未經(jīng)嚴(yán)格審核的妥協(xié)都會(huì)給計(jì)劃帶來(lái)大量威脅與變數(shù)。好奇號(hào)探測(cè)器不僅是一臺(tái)單純的設(shè)備,它代表著人類(lèi)無(wú)數(shù)科技結(jié)晶的綜合體,而成功登陸則是各項(xiàng)技術(shù)完美契合的證明。但隨后的消息卻令人錯(cuò)愕——美國(guó)宇航局宣布其網(wǎng)站由于負(fù)載過(guò)重而陷入癱瘓。
這著實(shí)令我大吃一驚。我剛剛以觀眾的身份見(jiàn)證了人類(lèi)歷史發(fā)展中的又一里程碑式事件,創(chuàng)新、工程與技術(shù)的最高成就在此刻融為一體——然而小小的網(wǎng)站處理能力問(wèn)題卻難倒了這群技術(shù)天才。我們似乎有種習(xí)慣,就是在實(shí)現(xiàn)龐大規(guī)劃的同時(shí)不可避免地犯下一些低級(jí)失誤。只要與日常工作關(guān)系不大,這些環(huán)節(jié)就總會(huì)在關(guān)鍵時(shí)刻掉鏈子——就拿這次來(lái)說(shuō)吧,美國(guó)宇航局為好奇號(hào)項(xiàng)目投入了25億美元的巨額預(yù)算,而官方網(wǎng)站居然會(huì)在直播時(shí)癱瘓了!
剛開(kāi)始,好奇號(hào)火星探測(cè)器與地球之間的數(shù)據(jù)傳輸能力僅為5Mb,目前則已經(jīng)擴(kuò)展到40Mb——等到火星端主天線設(shè)置完畢后,帶寬還將進(jìn)一步提升。還沒(méi)布置好主天線就有40Mb的帶寬,這已經(jīng)比我們地球這邊的大部分普通網(wǎng)站更強(qiáng)力了,因此操作系統(tǒng)部署工作應(yīng)該很容易才對(duì)。不過(guò)事情真是這樣嗎?
對(duì)于好奇號(hào)而言,整個(gè)OS升級(jí)過(guò)程要如何實(shí)現(xiàn)?事情會(huì)完全按照預(yù)定步驟順利完成,還是遭遇一系列突發(fā)情況?就算是在地球上,要將手頭的計(jì)算機(jī)系統(tǒng)從WindowsXP升級(jí)到Windows7都是件麻煩事,換在火星上真能一次搞定?宇航局官網(wǎng)事件令我們心存疑問(wèn)。接下來(lái)就是我個(gè)人最難理解的問(wèn)題:一定要把設(shè)備放出去再升級(jí)系統(tǒng)嗎?難道在地球上升級(jí)系統(tǒng)比遙控火星上的設(shè)備還費(fèi)勁?
在地球上進(jìn)行操作系統(tǒng)部署比在火星上還難?
在發(fā)射之前,好奇號(hào)火星探測(cè)器無(wú)需在不允許停機(jī)的前提下進(jìn)行系統(tǒng)部署,可以說(shuō)升級(jí)活動(dòng)雖然是項(xiàng)目中的關(guān)鍵環(huán)節(jié),但卻不會(huì)對(duì)既定任務(wù)造成影響,完全可以當(dāng)作一項(xiàng)普通流程對(duì)待。除此之外,在地球上進(jìn)行升級(jí)還可以大大降低項(xiàng)目開(kāi)支。由于遠(yuǎn)程升級(jí)會(huì)帶來(lái)諸多人力、時(shí)間及精力的額外投入,隨之而來(lái)的部署成本也將呈直線上升趨勢(shì)。根據(jù)項(xiàng)目規(guī)劃,系統(tǒng)遷移工作需要涉及大量關(guān)鍵數(shù)據(jù),同時(shí)要保證不能造成業(yè)務(wù)中斷以及應(yīng)用程序與信息丟失。這絕對(duì)是種費(fèi)力不討好的方案,真不知道美國(guó)宇航局是怎么想的。
在地球上進(jìn)行系統(tǒng)部署顯然要比在火星上容易得多
與美國(guó)宇航局的判斷不同,我們一向會(huì)把系統(tǒng)升級(jí)工作提前做好。事實(shí)上,為身邊的設(shè)備進(jìn)行系統(tǒng)升級(jí)對(duì)于每位技術(shù)人員都不是難事。我們非常了解系統(tǒng)部署工作與基礎(chǔ)設(shè)施中的難題,所以我們會(huì)使用像Nomad2012這樣集成了微軟SystemCenter配置管理工具(簡(jiǎn)稱SCCM)的軟件,以完成自動(dòng)的形式完成高度優(yōu)化且流程快捷的電腦系統(tǒng)遷移工作。在過(guò)去一個(gè)月中,我們已經(jīng)靠這套方案成功實(shí)現(xiàn)了近四萬(wàn)臺(tái)計(jì)算機(jī)的Windows7系統(tǒng)升級(jí)任務(wù)。
這才是處理任務(wù)的正常方式。
這才是系統(tǒng)部署的最佳方案。
不必中斷正常工作,應(yīng)用程序及用戶數(shù)據(jù)都會(huì)正確保存在升級(jí)后的新系統(tǒng)中。
整個(gè)系統(tǒng)部署過(guò)程比遙控火星端容易得多,Nomad與SCCM會(huì)以自動(dòng)化方式完成任務(wù)。
為什么要使用Nomad2012?
Nomad2012如何控制我們的SCCM帶寬管理?
Nomad2012是一款純軟件式解決方案,能夠以動(dòng)態(tài)方式管理IT業(yè)務(wù)中涉及的帶寬資源,保證當(dāng)業(yè)務(wù)流量與IT流量相沖突時(shí),系統(tǒng)能夠優(yōu)先處理業(yè)務(wù)類(lèi)數(shù)據(jù)信息。ReverseQos™正是令Nomad2012擁有這項(xiàng)能力的核心因素。
利用Nomad對(duì)SCCM中的分支設(shè)計(jì)及SCCM帶寬管理加以規(guī)劃,我們將不必再為將哪站點(diǎn)設(shè)為區(qū)域核心而浪費(fèi)腦細(xì)胞。與微軟SSCMWAN那充滿局限性的帶寬管理機(jī)制相比,與Nomad完整整合的分支設(shè)計(jì)功能使我們能在不添加任何額外SCCM分支設(shè)計(jì)限制的前提下定位應(yīng)用程序及軟件包。由于Nomad2012的設(shè)計(jì)初衷在于增強(qiáng)SystemCenter功能而非與之競(jìng)爭(zhēng),因此將其引入SCCM分支設(shè)計(jì)完全不會(huì)帶來(lái)任何風(fēng)險(xiǎn)。
在評(píng)估Nomad2012及其它類(lèi)似的SCCM分支設(shè)計(jì)客戶管理系統(tǒng)時(shí),許多企業(yè)都會(huì)針對(duì)自身運(yùn)行環(huán)境提出一系列處理原則。
在不造成單點(diǎn)故障的前提下,它們能減少多少服務(wù)器使用量?Nomad通過(guò)微軟配置管理器所減少的服務(wù)器基礎(chǔ)設(shè)施數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)市場(chǎng)上的同類(lèi)產(chǎn)品。大家完全不用擔(dān)心“該不該部署它”或者“這會(huì)不會(huì)造成單點(diǎn)故障”等問(wèn)題,Nomad2012會(huì)對(duì)一切可能發(fā)生的情況做好準(zhǔn)備。
在不造成單點(diǎn)故障的前提下減少網(wǎng)絡(luò)基礎(chǔ)設(shè)施
Nomad同時(shí)擁有字節(jié)層差異化、客戶端緩存管理以及點(diǎn)對(duì)點(diǎn)冗余等功能,另外Nomad2012的分布式體系允許企業(yè)以難以置信的幅度(95%)削減基礎(chǔ)設(shè)施服務(wù)器規(guī)模,而且不會(huì)帶來(lái)任何單點(diǎn)故障之類(lèi)的風(fēng)險(xiǎn)、不必要的客戶端或者內(nèi)核驅(qū)動(dòng)。
出于管理政策、設(shè)施地理位置或者提高可用性及災(zāi)難恢復(fù)效果的考慮,大多數(shù)企業(yè)都希望內(nèi)部設(shè)施能夠以多點(diǎn)方式運(yùn)行,而Nomad2012則是同類(lèi)產(chǎn)品中惟一能滿足這些需求的佼佼者。
除此之外,Nomad2012的系統(tǒng)部署工具還允許企業(yè)以超載形式處理遷移項(xiàng)目,這樣一來(lái)我們就能夠在不添加額外技術(shù)人員的基礎(chǔ)上,最大程度通過(guò)自動(dòng)化方式完成客戶系統(tǒng)遷移??偠灾?,Nomad2012值得一試,它讓你的各類(lèi)分支業(yè)務(wù)聚合成統(tǒng)一的整體——一套方案、通吃全部。
原文鏈接:Extreme OSD – Upgrading the OS of the Curiosity Rover on Mars
【編輯推薦】