整理丨諾亞
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
語(yǔ)雀是螞蟻集團(tuán)旗下的在線文檔編輯與協(xié)同工具。這個(gè)不算太出名的大廠產(chǎn)品最近因突發(fā)事故而來到了聚光燈下。
10月23日,有網(wǎng)友發(fā)現(xiàn),語(yǔ)雀突然崩了,一時(shí)之間,在線文檔、客戶端和官網(wǎng)均無(wú)法打開。更令人詫異的是,這一故障持續(xù)了7個(gè)多小時(shí),直到23日晚上10點(diǎn)多才恢復(fù)正常。
圖片
作為大廠旗下的產(chǎn)品,語(yǔ)雀的故障修復(fù)耗時(shí)如此之久,不免讓人好奇其原因及后續(xù)補(bǔ)救方案。昨天晚上9點(diǎn)多,語(yǔ)雀團(tuán)隊(duì)發(fā)文對(duì)此次事件進(jìn)行了總體復(fù)盤。
圖片
一、故障根由:新的運(yùn)維升級(jí)工具BUG
根據(jù)官方解釋,此次故障的起因是事件當(dāng)天下午“服務(wù)語(yǔ)雀的數(shù)據(jù)存儲(chǔ)運(yùn)維團(tuán)隊(duì)在進(jìn)行升級(jí)操作時(shí),由于新的運(yùn)維升級(jí)工具 bug,導(dǎo)致華東地區(qū)生產(chǎn)環(huán)境存儲(chǔ)服務(wù)器被誤下線。”
在其影響下,語(yǔ)雀數(shù)據(jù)服務(wù)發(fā)生嚴(yán)重故障,造成大面積的服務(wù)中斷。盡管進(jìn)行了全力修復(fù),但“受限于恢復(fù)方案、數(shù)據(jù)量級(jí)等因素,整體用時(shí)較長(zhǎng)”。
語(yǔ)雀團(tuán)隊(duì)表示,通過這次故障深刻認(rèn)識(shí)到,“語(yǔ)雀作為一款服務(wù)千萬(wàn)級(jí)客戶的文檔產(chǎn)品,應(yīng)該做到更完善的技術(shù)風(fēng)險(xiǎn)保障和高可用架構(gòu)設(shè)計(jì),尤其是面向技術(shù)變更操作的‘可監(jiān)控,可灰度,可回滾’的系統(tǒng)化建設(shè)和流程審計(jì)”。
為了避免重蹈覆轍,語(yǔ)雀團(tuán)隊(duì)針對(duì)性地制定了如下措施:
1、升級(jí)硬件版本和機(jī)型,實(shí)現(xiàn)離線后的快速上線。該措施在本次故障修復(fù)中已完成;
2、運(yùn)維團(tuán)隊(duì)加強(qiáng)運(yùn)維工具的質(zhì)量保障與測(cè)試,杜絕此類運(yùn)維 bug 再次發(fā)生;
3、縮小運(yùn)維動(dòng)作灰度范圍,增加灰度時(shí)間,提前發(fā)現(xiàn) bug;
4、從架構(gòu)和高可用層面改進(jìn)服務(wù),為語(yǔ)雀增加存儲(chǔ)系統(tǒng)的異地災(zāi)備。
不過對(duì)于這一回應(yīng),也有網(wǎng)友表示不滿:“首先,語(yǔ)雀團(tuán)隊(duì)在似乎沒有做好商業(yè)化的準(zhǔn)備就已經(jīng)商業(yè)化了。然后,沒有售后團(tuán)隊(duì),打電話聯(lián)系不到人。再者,異地災(zāi)備之前竟然沒有,無(wú)法想象。最后,也可以看出語(yǔ)雀團(tuán)隊(duì)灰度的隨意性?!?/p>
二、賠償方案:針對(duì)個(gè)人用戶贈(zèng)送6個(gè)月會(huì)員服務(wù)
為了致歉并挽回用戶信任,語(yǔ)雀團(tuán)隊(duì)在事件復(fù)盤的同時(shí)也提供了面向兩類用戶的賠償方案。
針對(duì)語(yǔ)雀?jìng)€(gè)人用戶,我們贈(zèng)送 6 個(gè)月的會(huì)員服務(wù)。操作流程:進(jìn)入工作臺(tái)“賬戶設(shè)置”,點(diǎn)擊左側(cè)“會(huì)員信息”,在會(huì)員信息頁(yè)面點(diǎn)擊“立即領(lǐng)取”,即可獲得贈(zèng)送服務(wù)。
針對(duì)語(yǔ)雀空間用戶,由于情況比較復(fù)雜,我們會(huì)單獨(dú)制定賠償方案。請(qǐng)空間管理員留意語(yǔ)雀站內(nèi)信。
三、語(yǔ)雀的浮沉:前端大佬主導(dǎo)立項(xiàng),經(jīng)歷兩次生死危機(jī)
與釘釘、飛書不同,語(yǔ)雀雖然也是一款文檔產(chǎn)品,但強(qiáng)調(diào)的是“知識(shí)管理”,采用“結(jié)構(gòu)化知識(shí)庫(kù)管理”,形式上類似書籍目錄。
也正是因?yàn)檫@一特質(zhì),語(yǔ)雀上每一篇文檔都必須屬于某一知識(shí)庫(kù),以期幫助用戶建立起知識(shí)管理的意識(shí)和習(xí)慣。但這也注定了語(yǔ)雀的受眾面較窄,畢竟有知識(shí)管理需求的用戶還是偏小眾,即使要培養(yǎng)轉(zhuǎn)化也耗時(shí)較長(zhǎng)。
語(yǔ)雀的創(chuàng)始人玉伯是業(yè)內(nèi)著名的前端技術(shù)大佬。2008年加入淘寶后,玉伯先后做出了前端領(lǐng)域很火的框架 SeaJS、KISSY,之后帶領(lǐng)團(tuán)隊(duì)通過開源做了很多技術(shù)產(chǎn)品。
2016年,在螞蟻體驗(yàn)技術(shù)部的創(chuàng)新產(chǎn)品孵化機(jī)制中,玉伯團(tuán)隊(duì)主導(dǎo)的語(yǔ)雀問世;2018年,語(yǔ)雀正式對(duì)公網(wǎng)提供服務(wù);2021年,螞蟻成立了智能協(xié)同事業(yè)部,語(yǔ)雀作為重點(diǎn)產(chǎn)品以獨(dú)立BU運(yùn)作;2022年,語(yǔ)雀正式推出移動(dòng)端版本,移動(dòng)端iOS與Android同步上線。
不過,語(yǔ)雀的成長(zhǎng)路徑并非一帆風(fēng)順,反而經(jīng)歷了兩次生死局。
第一次考驗(yàn)發(fā)生在2018年,彼時(shí)文檔產(chǎn)品迎來爆發(fā)期,騰訊文檔、飛書次第登場(chǎng),想要抓住風(fēng)口的阿里同樣推出了釘釘文檔,而語(yǔ)雀團(tuán)隊(duì)將三分之二的人輸送給了釘釘。團(tuán)隊(duì)人員驟減使語(yǔ)雀前途未卜。
第二次則出現(xiàn)在2020年,集團(tuán)集中火力,想要合并語(yǔ)雀、釘釘文檔等內(nèi)部文檔團(tuán)隊(duì),成立獨(dú)立的文檔事業(yè)部,以期形成合力。但是內(nèi)部意見未統(tǒng)一,所以作罷。
熬過兩次生死局后,語(yǔ)雀仍然未能踏上發(fā)展的坦途,商業(yè)化成為與日俱增的壓力。2019年,語(yǔ)雀就開始嘗試簡(jiǎn)單的商業(yè)化模式。但對(duì)于小團(tuán)隊(duì)來說,商業(yè)化路徑的探索并不容易。就像前文提到的,語(yǔ)雀受眾目標(biāo)較分散,很難第一時(shí)間發(fā)掘,也需要花時(shí)間去轉(zhuǎn)化。此前就有媒體報(bào)道,語(yǔ)雀主要還是服務(wù)螞蟻和阿里內(nèi)部,商業(yè)化方面較為單一。
更致命的是,今年4月,語(yǔ)雀的創(chuàng)始人玉伯從螞蟻離職了。對(duì)于大廠內(nèi)部孵化的創(chuàng)新項(xiàng)目而言,創(chuàng)始人的離開必然會(huì)帶來一定動(dòng)蕩,給人員組成、資源投入帶來大小不一的影響。因此當(dāng)時(shí)就有人猜測(cè),隨著玉伯離開,語(yǔ)雀可能要涼。在本次突發(fā)事件中,語(yǔ)雀崩了7個(gè)多小時(shí),遠(yuǎn)超人們預(yù)估的恢復(fù)時(shí)間,或許可以折射出個(gè)中問題。
此外,這次語(yǔ)雀的故障也不得不讓人聯(lián)想,假使飛書或者釘釘掛了,你們手頭的工作還能正常進(jìn)行嗎,你們公司還能正常運(yùn)轉(zhuǎn)嗎?
參考鏈接:
https://mp.weixin.qq.com/s/WFLLU8R4bmiqv6OGa-QMcw
https://weibo.com/6448460373?refer_flag=1001030103_
https://www.36kr.com/p/2487990260602760
https://www.leiphone.com/category/industrynews/1bzDrJ28F5Pk8nEo.html