IPv6升級(jí)引發(fā)重大通信故障
本文轉(zhuǎn)載自微信公眾號(hào)「網(wǎng)優(yōu)雇傭軍」,作者通信。轉(zhuǎn)載本文請(qǐng)聯(lián)系網(wǎng)優(yōu)雇傭軍公眾號(hào)。
新年伊始,重大通信故障又發(fā)生了。
2022年2月1日,日本移動(dòng)運(yùn)營(yíng)商N(yùn)TT DoCoMo發(fā)生全國(guó)范圍內(nèi)的重大通信故障,導(dǎo)致部分4G和5G用戶在長(zhǎng)達(dá)5個(gè)小時(shí)內(nèi)無(wú)法上網(wǎng)和進(jìn)行VoLTE語(yǔ)音通話。2月7日,NTT社長(zhǎng)召開新聞發(fā)布會(huì),就本次事故表示道歉,并公布故障原因。
故障描述
1. 故障發(fā)生時(shí)間:
2022年2月1日早上7點(diǎn)30分至下午0點(diǎn)13分
2. 故障影響:
部分移動(dòng)用戶無(wú)法使用移動(dòng)互聯(lián)網(wǎng)服務(wù)和語(yǔ)音通話服務(wù)(VoLTE)
3. 故障原因:
因引入IPv6單棧模式時(shí),服務(wù)器負(fù)荷陡增,并向終端發(fā)送控制與網(wǎng)絡(luò)通信的信令。
4. 影響用戶數(shù)量:
約18000名
5. 影響范圍:
全國(guó)
6. 解決措施:
針對(duì)本次IPv6單棧網(wǎng)絡(luò)升級(jí)失敗,為快速恢復(fù)服務(wù),DoCoMo采取了回退到"IPv4/IPv6雙棧模式”的臨時(shí)措施。未來(lái),該運(yùn)營(yíng)商表示將采取增加服務(wù)器容量以及優(yōu)化設(shè)計(jì)等方式,重啟IPv6單棧模式升級(jí)。
為何引入IPv6單棧模式?
眾所周知,IPv4的地址長(zhǎng)度為32位,約42億(2^32)個(gè)IP地址,相當(dāng)于世界上平均3個(gè)人共用2個(gè)IP地址,隨著PC和智能手機(jī)的普及,目前已基本分配殆盡,發(fā)展已到極限。而IPv6的地址長(zhǎng)度為128位,可提供的IP地址數(shù)量非常多,可"讓地球上每一粒沙子都有一個(gè)IP地址"。
如今,隨著物聯(lián)網(wǎng)設(shè)備增多和5G普及,接入互聯(lián)網(wǎng)的設(shè)備數(shù)量不斷增加,對(duì)IP地址的需求也越來(lái)越大。為此,運(yùn)營(yíng)商、ISP、云商等各界均積極推動(dòng)IPv6升級(jí),以解決IPv4地址耗盡問題。
在IPv4向IPv6過渡階段,大家一般都采用IPv4/IPv6雙棧模式,即:為終端分配IPv4和IPv6兩套IP地址,如果對(duì)端是IPv4服務(wù)器,就用IPv4通信;如果對(duì)端是IPv6,就用IPv6進(jìn)行通信。
然而,在雙棧模式下,要求移動(dòng)網(wǎng)絡(luò)中的所有設(shè)備都支持IPv4/IPv6兩套協(xié)議棧,存在升級(jí)周期慢、維護(hù)成本高等問題,且無(wú)法根本解決IPv4地址短缺問題。
在此背景下,為了最大限度地提升IPv6利用率,DoCoMo提出在2022年春季在移動(dòng)網(wǎng)絡(luò)中引入IPv6單棧模式。
IPv6單棧,也叫純IPv6或者IPv6-only,即:在移動(dòng)數(shù)據(jù)通信中僅為終端分配IPv6地址。
不過,由于IPv6協(xié)議和IPv4協(xié)議是不兼容的,如上圖所示,在升級(jí)為IPv6單棧的移動(dòng)網(wǎng)絡(luò)后,網(wǎng)絡(luò)僅為終端分配IPv6地址,如果終端訪問的目標(biāo)服務(wù)器仍然為IPv4,需通過DoCoMo移動(dòng)網(wǎng)絡(luò)中的服務(wù)器或交換機(jī)設(shè)備進(jìn)行地址轉(zhuǎn)換處理,將IPv6地址轉(zhuǎn)換為IPv4,才能實(shí)現(xiàn)終端訪問只有IPv4地址的目標(biāo)節(jié)點(diǎn)。
對(duì)此,DoCoMo采用了DNS64/NAT64和464XLAT兩種IP地址轉(zhuǎn)換方法,前者可解決Native IPv6用戶連接IPv4服務(wù)器的問題,后者允許終端上的IPv4-Only應(yīng)用在IPv6單棧網(wǎng)絡(luò)上進(jìn)行通信。
根據(jù)DoCoMo官方通報(bào),本次通信故障正是因?yàn)槠湓谝苿?dòng)網(wǎng)絡(luò)中引入“IPv6單?!蹦J剑瑢?dǎo)致服務(wù)器負(fù)荷增加,并向終端發(fā)送控制與網(wǎng)絡(luò)通信的信令,從而造成部分移動(dòng)用戶無(wú)法接入ISP(sp-mode)和IMS(VoLTE),無(wú)法進(jìn)行數(shù)據(jù)通信和語(yǔ)音通話。隨后,該運(yùn)營(yíng)商采取了回退到"IPv4/IPv6雙棧模式”的緊急措施,約在5個(gè)小時(shí)后恢復(fù)正常。