自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

通過(guò)滴滴技術(shù)博客:探尋造成此次P0故障的真正原因

新聞
雖然滴滴有能力基于K8S二次開(kāi)發(fā),但是由于版本跨度較大,細(xì)節(jié)點(diǎn)較多,原地升級(jí)風(fēng)險(xiǎn)我覺(jué)得比替換升級(jí) 大不少。比如集群版本已經(jīng)升級(jí)為1.20,但是Node節(jié)點(diǎn)的kubelet的版本還是 1.12,如果api不兼容,那么這個(gè)影響是非常大的,集群回滾又沒(méi)有那么快。

2023年11月27日晚至2023年11月28日早晨,滴滴發(fā)生了長(zhǎng)達(dá)12小時(shí)的P0級(jí)故障,導(dǎo)致滴滴核心業(yè)務(wù)都受到了影響,比如不顯示定位無(wú)法打車(chē)、滴滴單車(chē)無(wú)法掃碼等問(wèn)題,期間滴滴進(jìn)行了多次致歉。

圖片圖片

                       來(lái)源:https://weibo.com/2838754010/NuMAAaUEl

目前問(wèn)題故障已經(jīng)恢復(fù),根據(jù)最新的消息得知造成此次事故的原因,是由于升級(jí)K8S 集群導(dǎo)致。

圖片圖片

1. 集群體量大

最大集群規(guī)模已經(jīng)遠(yuǎn)遠(yuǎn)超出了社區(qū)推薦的5千個(gè) node 上限,有問(wèn)題的爆炸半徑大。

圖片圖片

2. 版本升級(jí)跨度大

直接從1.12 升級(jí)到了1.20,跨越多個(gè)版本,有可能存在api不兼容的問(wèn)題。

3. 升級(jí)方式應(yīng)該選擇了原地升級(jí)

雖然滴滴有能力基于K8S二次開(kāi)發(fā),但是由于版本跨度較大,細(xì)節(jié)點(diǎn)較多,原地升級(jí)風(fēng)險(xiǎn)我覺(jué)得比替換升級(jí)大不少。

比如集群版本已經(jīng)升級(jí)為1.20,但是Node節(jié)點(diǎn)的kubelet的版本還是 1.12,如果api不兼容,那么這個(gè)影響是非常大的,集群回滾又沒(méi)有那么快。

圖片圖片

至于為什么采用原地升級(jí)方案,估計(jì)還有很多細(xì)節(jié)我們不得而知,但是此種方式確實(shí)有點(diǎn)激進(jìn),船大不好掉頭。

責(zé)任編輯:武曉燕 來(lái)源: 架構(gòu)成長(zhǎng)指南
相關(guān)推薦

2023-12-05 09:46:30

2021-08-05 06:46:39

P0故障公司

2020-04-09 10:43:12

長(zhǎng)事務(wù)P0故障

2025-01-17 12:03:24

2013-02-25 10:48:53

RubyWeb

2010-01-06 09:57:34

華為交換機(jī)故障

2023-06-07 07:27:32

唯品會(huì)冷凍系統(tǒng)故障

2022-03-13 22:50:47

P0故障HBase

2025-03-10 08:20:53

代碼線(xiàn)程池OOM

2025-01-17 13:38:30

支付寶P0事故

2021-04-30 07:09:48

SQLP0事故

2023-03-06 18:34:44

存貨庫(kù)存模型

2021-01-28 09:48:39

UPS電源數(shù)據(jù)中心

2009-12-23 09:37:38

集線(xiàn)器故障

2011-06-28 16:18:37

網(wǎng)站收錄

2015-04-17 10:12:58

光纖光纖衰減光纖損耗

2020-06-04 08:03:37

MySQL事故P0

2022-10-17 08:31:03

生產(chǎn)環(huán)境P0項(xiàng)目

2010-08-02 16:51:54

2010-07-28 10:21:44

統(tǒng)一計(jì)算
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)