滴滴崩了,簡(jiǎn)單聊聊
大家好呀,我是樓仔。
我之前在滴滴工作過(guò)一年多,也深度參與過(guò)滴滴十一前夕的重保,對(duì)于滴滴崩了的消息,估計(jì)很多同學(xué)都看到了,這里也想和大家簡(jiǎn)單聊聊。
圖片
回顧來(lái)看滴滴歷史上類似故障情況在 2022 年 9 月 22 日也出現(xiàn)過(guò),當(dāng)日滴滴官方微博致歉稱由于機(jī)房網(wǎng)絡(luò)故障,導(dǎo)致滴滴部分服務(wù)受到影響。
然而像昨天這樣大面積、長(zhǎng)時(shí)間的故障,滴滴史上少有。
01 事件回顧
11月27日,全國(guó)多地滴滴用戶反映,滴滴出行 App “崩了”,出現(xiàn)不顯示定位、地圖無(wú)法加載、扣費(fèi)異常、無(wú)法打車等情況。
圖片
27 日深夜,滴滴出行對(duì)此作出回應(yīng):“非常抱歉,由于系統(tǒng)故障,今天晚間滴滴 App 服務(wù)出現(xiàn)異常,經(jīng)技術(shù)同學(xué)緊急修復(fù),目前正陸續(xù)恢復(fù)中?!?/p>
圖片
28 日早上 7 點(diǎn) 30 分許,滴滴出行再度道歉,稱經(jīng)技術(shù)團(tuán)隊(duì)連夜修復(fù),滴滴網(wǎng)約車等服務(wù)已恢復(fù),用戶可下載滴滴 App 使用打車服務(wù)。
騎車等服務(wù)還在陸續(xù)修復(fù)中,所有可開(kāi)鎖或未關(guān)鎖的青桔車輛均可免費(fèi)騎行。
圖片
滴滴出行發(fā)文后,仍有大量用戶反映滴滴 App 還是存在問(wèn)題。
02 可能原因
滴滴官方還沒(méi)有披露原因,科創(chuàng)版日?qǐng)?bào)記者采訪業(yè)內(nèi)人士,推測(cè)原因:
- 一是可能遭受外部攻擊,系統(tǒng)被打穿;
- 二底層系統(tǒng)本身存在有缺陷。
下面是訪談?dòng)涗洠?/p>
圖片
個(gè)人感覺(jué)外部攻擊的概率應(yīng)該不大,大概率應(yīng)該是基建服務(wù)掛了。
然后很多同學(xué)說(shuō),和 “降本增效” 有關(guān)。
03 降本增效
滴滴的“減員增效”,裁減了多少人?
21 年底,滴滴員工總數(shù) 24396 人,22 年底是 20870 人,累計(jì)減少 3526 人,裁減比例是 14.4%。
相比阿里云之前裁員 7%,滴滴裁員比例的確有點(diǎn)大。
圖片
而且,滴滴研發(fā)人員占員工總數(shù)比重是 40%,光 2022 年一年,就裁掉 1090 研發(fā)人員。
然后也有一些其它博主經(jīng)過(guò)詳細(xì)計(jì)算,預(yù)計(jì) 2023 年,滴滴研發(fā)人員減少大概 1200-1400 人。
以上數(shù)據(jù)來(lái)源:滴滴系統(tǒng)崩了,跟裁員 14% 有關(guān)系嗎?
對(duì)于這次的損失,據(jù)滴滴出行此前公布的 2023 年第三季度財(cái)報(bào)顯示,單季度中國(guó)出行業(yè)務(wù)總交易額為 725 億元,日均單量達(dá)到 3130 萬(wàn)單。
而以此次“崩了”的故障時(shí)長(zhǎng)計(jì)算,估計(jì)將會(huì)讓滴滴損失過(guò)千萬(wàn)的訂單量和超 4 億的交易額。
04 一點(diǎn)看法
對(duì)于滴滴這次崩了,除了技術(shù)本身的原因,可能還是多少和降本增效有關(guān)。
這里的降本,很多同學(xué)可能只會(huì)理解為單純的裁員,其實(shí)降本,還包括服務(wù)器費(fèi)用的降本,這個(gè)費(fèi)用占比通常也會(huì)非常高。
我是 18 年在滴滴呆了一年,做的是滴滴搜索,在滴滴高速擴(kuò)張的時(shí)候,基本不用考慮服務(wù)器費(fèi)用。
我記得當(dāng)時(shí)整個(gè)搜索相關(guān)的機(jī)器就有幾百臺(tái),僅僅一套 ES 集群,就有十幾臺(tái)機(jī)器,2 套就需要二十幾臺(tái),而且每臺(tái)的機(jī)器成本非常高。
但是在 18 年中下旬時(shí),滴滴也開(kāi)始考慮降本,首先是縮減服務(wù)器成本,當(dāng)時(shí)滴滴全部用的是物理機(jī),由于是雙機(jī)房,費(fèi)用加倍。
后來(lái)經(jīng)過(guò)一輪物理機(jī)縮減后,為了繼續(xù)降本,服務(wù)陸續(xù)上云(不過(guò)后來(lái)是否上云,我就不清楚了,因?yàn)楫?dāng)時(shí)離開(kāi)了滴滴。)
雖然這次不是流量高峰將機(jī)器打掛,但是當(dāng)用戶發(fā)現(xiàn)請(qǐng)求失敗時(shí),就會(huì)一直嘗試,請(qǐng)求數(shù)量就會(huì)爆發(fā)性增長(zhǎng),再加上早高峰,流量就非常高了,縮容后的服務(wù),沒(méi)有提前進(jìn)行擴(kuò)容,有的可能會(huì)扛不住。
然后是關(guān)于人員的裁減,這個(gè)影響面就很好理解了。
不過(guò)作為一個(gè)國(guó)民級(jí)的應(yīng)用,崩了 12 個(gè)小時(shí),無(wú)論什么原因,確實(shí)很不應(yīng)該。
具體原因還需要等滴滴官方解答,同時(shí)作為研發(fā),我也整過(guò)嚴(yán)重的 P0 線上事故,希望滴滴的研發(fā)小伙伴能挺過(guò)這波難關(guān)。