一夜癱瘓,阿里云的麻煩大了
北京時間2019年3月3號凌晨,我使用極客時間學(xué)習專欄的時候,極客時間APP各種報錯無反應(yīng)。隨后網(wǎng)上消息傳來,阿里云大規(guī)模出現(xiàn)癱瘓。我恍然大悟,原來極客時間背后用的也是阿里云。
此后阿里云公布,自從3月2號23點55分鐘左右開始,華北2地域可用區(qū)C部分ECS實例出現(xiàn)IO HANG。通俗一點解釋就是磁盤無響應(yīng)。由于該地區(qū)對應(yīng)的服務(wù)區(qū)主要是北京的客戶。而北京又是互聯(lián)網(wǎng)企業(yè)的聚集地,此次的事故造成的影響巨大,不言而喻。
此次阿里云的故障也導(dǎo)致了一系列的公司的運營運維被喚醒。大家都在努力的排除故障。包括自己的故障和不是自己的故障。但是從網(wǎng)上反映的信息來看,除了干等阿里云幾個小時修復(fù)以外,建立在阿里云上的各個企業(yè)能做的非常有限。
這一方面說明了國內(nèi)阿里云的確是占據(jù)了云廠商的主導(dǎo)地位,另外一方面也說明云的確如同水電一般。一旦出現(xiàn)故障,云故障的破壞力,和停水停電的破壞力,并沒有什么太大的區(qū)別。
同樣的事情在美國發(fā)生過一次。亞馬遜AWS的存儲服務(wù)S3,號稱比本地硬盤要靠譜不知道多少倍的塊存儲服務(wù),因為一名碼農(nóng)操作失誤,導(dǎo)致了大面積的服務(wù)中斷。結(jié)果是美國半個互聯(lián)網(wǎng)癱了,從雅虎郵箱到StackOverflow,一時間哀鴻遍野。這是***次讓我這個普通的吃瓜群眾感受到亞馬遜的云服務(wù)在美國的影響力。
但是也正是這次之后,有能力的企業(yè)意識到不能把雞蛋放在一個籃子里。很多企業(yè)選擇了亞馬遜和Azure,或者亞馬遜和GCP(Google Cloud Platform)的雙云方案。有些獨立的SaaS服務(wù)提供商,之前都只拿AWS作為其資源池的,也改由兩家云廠商來提供了。
當然,更有經(jīng)驗的企業(yè)早就知道單云的問題。比如說蘋果公司的iCloud,一直以來都是選擇兩家云廠商一起來提供冗余備份服務(wù)的。這種做法在S3斷服之后,變得越來越普遍。
從某種程度上看,亞馬遜AWS的江湖地位是很牢固的。但是之前大家一直對亞馬遜是不是會一騎絕塵把其他云廠商都干翻這個事情抱有某種程度的期望。S3斷服事件以后,AWS的市場份額依舊領(lǐng)先,但是大部分人對于北美市場存在兩到三家云服務(wù)場商已經(jīng)沒什么懷疑了。畢竟,即便用AWS,也需要有個備份。
有競爭肯定是好事情。S3斷服對AWS不一定是個好事情,對北美市場的云生態(tài),卻是一個值得紀念的歷史性事件。我一直在想,同樣的事情在中國市場應(yīng)該會出現(xiàn)。但是之前出現(xiàn)的一直都是騰訊云弄壞一個客戶這樣的雞毛蒜皮的事情。今天阿里云大規(guī)模斷服,無疑給廣大的云用戶廠商提了一個醒,云服務(wù)也是需要有備份的。
阿里云在中國就像AWS在北美一樣,占據(jù)了巨大的市場份額。有多巨大對我們來說不夠直觀。這次阿里云一癱,一堆堆的企業(yè)都冒出來叫喚,真的是非常的直觀。
這個事件,對阿里云來說也許并不是一件好事情,因為這讓很多企業(yè)意識到云廠商也是需要備份的。阿里云一家獨大的可能性被大大壓縮了。但是對華為云,騰訊云,中國電信天翼云們,都是好事情啊。對比美國云市場的發(fā)展,中國云市場阿里云一家獨大的局面,也越來越難了。
【本文為51CTO專欄作者“徐飛”的原創(chuàng)稿件,轉(zhuǎn)載請通過作者微信公眾號“飛總聊IT”獲取聯(lián)系和授權(quán)】