終于不再苦逼割接了,要灰度升級(jí)!
老司機(jī)提醒您:指令千萬條,安全***條,割接不規(guī)范,悔出兩行淚!
迎著晚霞,送走日出,別人在酣睡,我們卻要精神百倍,深夜割接,幾乎是每個(gè)通信人都經(jīng)歷過的痛。搞核心網(wǎng)的人,體驗(yàn)尤其深:信令,路由,各種東西一點(diǎn)都不能錯(cuò),一錯(cuò)影響一大片,計(jì)費(fèi),通話,數(shù)據(jù)…轉(zhuǎn)眼腦袋就要掉的節(jié)奏啊!
割接,割接,就是先割后接, 把舊的設(shè)備割掉,再把新的接上去。
割接是對(duì)正運(yùn)行的網(wǎng)絡(luò)進(jìn)行改造、升級(jí)、遷移等變更,會(huì)造成業(yè)務(wù)中斷,稍有疏忽,就可能影響業(yè)務(wù),甚至?xí)劤赏ㄐ攀鹿省?/p>
割接前要進(jìn)行反復(fù)論證、周密測(cè)試、數(shù)據(jù)備份、失敗緊急回退演練等,以規(guī)避割接風(fēng)險(xiǎn)。
割接時(shí),通常選擇在晚上零點(diǎn)之后進(jìn)行,以減少對(duì)用戶的影響,并要求每一個(gè)割接人員、每一個(gè)時(shí)間點(diǎn)、每一個(gè)步驟都必須精準(zhǔn)、清晰落實(shí),以保證次日凌晨前完成割接。
割接后,還要完成業(yè)務(wù)驗(yàn)證,不影響第二天的業(yè)務(wù)運(yùn)營,才算割接完畢,如釋重負(fù)!
一旦割接失敗,最崩潰的是回退,比回退更崩潰的是回退失敗,而比回退失敗更更崩潰的是業(yè)務(wù)影響面積太大!
從固網(wǎng)到移動(dòng),從1G到4G,電信業(yè)經(jīng)歷了無數(shù)次新功能割接上線,而每一次操作對(duì)于通信工程師就像是上戰(zhàn)場(chǎng),對(duì)技術(shù)、體力、腦力、經(jīng)驗(yàn)等是一次嚴(yán)峻的綜合考驗(yàn),不累趴下是不可能的。
不想再苦逼割接了
要灰度升級(jí)
電信業(yè)務(wù)升級(jí)割接這么苦逼,可微信、QQ經(jīng)歷了N個(gè)版本,為啥騰訊從不像運(yùn)營商那樣發(fā)一個(gè)割接公告,停了業(yè)務(wù)半夜做升級(jí)?
亞馬遜每秒鐘都在部署新軟件,這些互聯(lián)網(wǎng)巨頭的新功能升級(jí)為啥如此輕松?
他們的秘密就是----灰度升級(jí)。
灰度升級(jí)(又稱灰度發(fā)布、灰度更新)指在黑與白之間,能夠平滑過渡的一種發(fā)布方式。灰度發(fā)布不必一次性中斷業(yè)務(wù),它可在不影響已上線業(yè)務(wù)的前提下,在初始灰度的時(shí)候及時(shí)發(fā)現(xiàn)、調(diào)整問題,以保證平穩(wěn)升級(jí)。
金絲雀發(fā)布和A/B測(cè)試都屬于灰度發(fā)布方式。
由于金絲雀對(duì)空氣中的甲烷和一氧化碳濃度十分敏感,約在18世紀(jì)時(shí),人類已經(jīng)知道用金絲雀來偵測(cè)危險(xiǎn)氣體了,礦工們將金絲雀帶入礦井,如果金絲雀停止唱歌,就知道必須趕快撤離。
礦井里的金絲雀
這就是金絲雀發(fā)布的由來,即先部署少量的新版本服務(wù)作為“金絲雀”來測(cè)試驗(yàn)證,確認(rèn)整體穩(wěn)定無異常后再全面部署。
A/B測(cè)試(A/B testing)就是讓一部分用戶繼續(xù)用A,一部分用戶開始用B,如果用戶對(duì)B沒有什么反對(duì)意見,那么逐步擴(kuò)大范圍,把所有用戶都遷移到B上面來。
Google是A/B測(cè)試的先驅(qū),早在2000年,Google工程師們***將A / B測(cè)試應(yīng)用于搜索引擎,以確定搜索頁面上顯示***結(jié)果數(shù)量。僅在2011年,Google就進(jìn)行了7000次A / B測(cè)試。如今A/B測(cè)試已是互聯(lián)網(wǎng)巨頭們的家常便飯了。
灰度升級(jí)可以應(yīng)用于電信領(lǐng)域的割接升級(jí)嗎?
沒有問題,云原生來拯救
在IT領(lǐng)域,早就經(jīng)歷了從虛擬化到云原生(Cloud Native)的演進(jìn)歷程。
IT領(lǐng)域的云原生演進(jìn)
在電信領(lǐng)域,自2012年由AT&T、英國電信、中國移動(dòng)、德國電信等12家運(yùn)營商聯(lián)合發(fā)布NFV白皮書后,5年后23家運(yùn)營商再次聯(lián)合發(fā)布新版NFV 5G白皮書。與2012版的白皮書不同,這份NFV 5G白皮書除了關(guān)注網(wǎng)絡(luò)虛擬化本身,更關(guān)注5G應(yīng)用,并提出了云原生概念。
2017年,3GPP確認(rèn)5G核心網(wǎng)基于云原生構(gòu)架設(shè)計(jì),采用以微服務(wù)為中心的軟件架構(gòu)。
從IT到CT,為什么都要從NFV演進(jìn)到云原生?
因?yàn)樵缙诘腘FV,從傳統(tǒng)專用設(shè)備中解耦出的網(wǎng)絡(luò)功能軟件(VNF)是“大塊頭”的單體式應(yīng)用程序,無法充分利用云環(huán)境的靈活性。
為此,業(yè)界提出了基于云原生的設(shè)計(jì)原則,將VNF進(jìn)一步分解和細(xì)粒度化,通過軟件模塊化、輕量化的方式來提升應(yīng)用開發(fā)的整體敏捷性和彈性,并通過開放API接口和開源來簡(jiǎn)化集成過程,從而加速創(chuàng)新和新業(yè)務(wù)上線,適應(yīng)瞬息萬變的市場(chǎng)環(huán)境。
正是基于云原生架構(gòu)設(shè)計(jì),5G核心網(wǎng)實(shí)現(xiàn)了“化整為零、由硬變軟”的***變革,以靈活、敏捷應(yīng)對(duì)5G多樣化業(yè)務(wù)時(shí)代。
云原生是一套充分利用云環(huán)境優(yōu)勢(shì)來構(gòu)建、測(cè)試、部署和運(yùn)行軟件的辦法,其主要由微服務(wù)架構(gòu)、DevOps、容器、動(dòng)態(tài)編排等組成,
微服務(wù)架構(gòu)將傳統(tǒng)單體式應(yīng)用程序分解為無狀態(tài)(Stateless)、松散耦合、粒度更小的“微”服務(wù),以提升應(yīng)用部署的彈性。
DevOps讓運(yùn)維和開發(fā)人員共同協(xié)作發(fā)布服務(wù)(包括微服務(wù)),它創(chuàng)造了一種文化和環(huán)境,以快速、頻繁且更可靠地構(gòu)建、測(cè)試和發(fā)布服務(wù),提高運(yùn)作效率。
同時(shí)出鏡的還有灰度升級(jí)。
傳統(tǒng)電信在升級(jí)割接時(shí),新版本替換舊版本,都是通過批量操作,一次性的、100%的從舊版本“割接”到新版本。這種操作方式必須中斷業(yè)務(wù),一旦操作失敗再回退到老系統(tǒng)時(shí)極易出錯(cuò),存在很大的風(fēng)險(xiǎn)。
割接 vs 灰度升級(jí)
而基于云原生的灰度升級(jí)意味著我們不必“一次性割接”,DevOps支持循序漸進(jìn)的引入新版本的VNF(虛擬化網(wǎng)絡(luò)功能)組件,先挑選少量測(cè)試用戶操作試點(diǎn),將少量的流量切換到新版本上,并在這個(gè)過程中持續(xù)監(jiān)控性能,確保穩(wěn)定之后,再進(jìn)一步將其他用戶切換到新版本上。如果一旦發(fā)現(xiàn)少量測(cè)試用戶的性能異常,也可快速回退到舊版本上,可大幅降低割接風(fēng)險(xiǎn)。
終于核心網(wǎng)不用再熬夜苦逼升級(jí)割接了,采用灰度升級(jí),大白天妥妥的就把事干了。
值得一提的是,灰度升級(jí)不再是概念,已落地現(xiàn)實(shí),據(jù)悉,去年年中,華為已為拉美某大型運(yùn)營商在大白天完成了灰度升級(jí),***升級(jí)三波完成,2.3萬用戶平穩(wěn)上線,妥妥的告別暗夜割接!