自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一次遷移引發(fā)的“血案”,最終賠償29億!

新聞
早前,英國(guó) TSB 銀行籌劃了良久的遷移方案失敗,13 億客戶(hù)記錄出錯(cuò),事后各類(lèi)賠償總計(jì)花費(fèi)約 29 億元人民幣。時(shí)隔一年,這家銀行終于想明白原因是缺乏嚴(yán)格的測(cè)試。

早前,英國(guó) TSB 銀行籌劃了良久的遷移方案失敗,13 億客戶(hù)記錄出錯(cuò),事后各類(lèi)賠償總計(jì)花費(fèi)約 29 億元人民幣。時(shí)隔一年,這家銀行終于想明白原因是缺乏嚴(yán)格的測(cè)試。

[[311840]] 

圖片來(lái)自 Pexels

2018 年,英國(guó)的 TSB 銀行陷入了困境。雖然這家金融機(jī)構(gòu)與勞埃德銀行集團(tuán)(Lloyds Banking Group,兩者最初于 1995 年合并)拆分已有兩年時(shí)間。

但 TSB 仍然與前伙伴勞埃德銀行集團(tuán)有著關(guān)密不可分的關(guān)系,因?yàn)樗?IT 系統(tǒng)是非常匆忙地從勞埃德銀行集團(tuán)復(fù)制而來(lái)的。

更糟糕的是,TSB 每年還要支付 1 億英鎊的許可費(fèi)給對(duì)方(撰寫(xiě)本文時(shí)按匯率計(jì)算相當(dāng)于 1.27 億美元,約 8.9 億人民幣)。

沒(méi)人會(huì)愿意為“前任”付費(fèi)。

為了改變這種局面,2018 年 4 月 22 日晚上 6 點(diǎn)鐘,TSB 啟動(dòng)了一個(gè)已經(jīng)蓄謀數(shù)月的計(jì)劃,要把他們 540 萬(wàn)用戶(hù)的數(shù)十億條數(shù)據(jù)遷移到西班牙公司 Banco Sabadell 的 IT 系統(tǒng)上來(lái),后者在 2015 年 3 月以 17 億歐元(22 億美元)的價(jià)格收購(gòu)了 TSB。

01.前所未有的遷移,前所未有的糟糕

Banco Sabadell 的主席 Josep Oliu 于 2017 年圣誕前兩周的一次超過(guò) 1800 人的公司集會(huì)上宣布了這項(xiàng)計(jì)劃。

這次大規(guī)模集會(huì)是在巴塞羅那商業(yè)街上的一個(gè)又大又現(xiàn)代的會(huì)議大廳中舉行的。這次遷移工作的重中之重是 Banco Sabadell 公司在 2000 年開(kāi)發(fā)的 Proteo 系統(tǒng)的新版本,并為這次 TSB 遷移項(xiàng)目而專(zhuān)門(mén)命名為 Proteo4UK。

Banco Sabadell 的首席執(zhí)行官 Jaime Guardiola Romojaro 曾對(duì)巴塞羅那的公眾宣稱(chēng),Proteo4UK 項(xiàng)目投入的人力超過(guò) 2500 人年。

“在歐洲,像 Proteo4UK 這么大型的整合項(xiàng)目絕對(duì)是史無(wú)前例的,我們投入的技術(shù)專(zhuān)家已經(jīng)超過(guò)了 1000 人”,他繼續(xù)說(shuō),“這個(gè)項(xiàng)目會(huì)為我們?cè)谟?guó)的業(yè)務(wù)帶來(lái)極大助力”。

4 月 22 日,一個(gè)平常的星期天晚上,TSB 的遷移項(xiàng)目 Proteo4UK 接近完工了。

幾乎整個(gè)周末 TSB 舊的 IT 系統(tǒng)都處于停服狀態(tài),客戶(hù)數(shù)據(jù)不斷地從舊系統(tǒng)向新系統(tǒng)遷移。

到了周日晚上,新系統(tǒng)慢慢啟用了,并對(duì)外開(kāi)放入口,平滑地恢復(fù)了對(duì)外服務(wù)。

雖然在圣誕之前的公司會(huì)議上,Oliu 和 Guardiola Romojaro 都對(duì)這個(gè)項(xiàng)目表現(xiàn)得信心滿(mǎn)滿(mǎn),可是 TSB 參與具體遷移工作的工程師們卻非常緊張。

這個(gè)項(xiàng)目原計(jì)劃是要進(jìn)行 18 個(gè)月的,但它已經(jīng)延期了,而且超出了預(yù)算。畢竟,把一個(gè)公司的全部數(shù)據(jù)從一個(gè)系統(tǒng)遷移到另一個(gè)系統(tǒng),這絕非易事。

他們所擔(dān)心的事情真的發(fā)生了。

在確認(rèn)數(shù)據(jù)遷移很順利,TSB 重新對(duì)外開(kāi)放了對(duì)賬戶(hù)的訪問(wèn)之后,不到 20 分鐘,第一個(gè)故障投訴電話就打了進(jìn)來(lái)。

人們發(fā)現(xiàn)自己一生的積蓄忽然不翼而飛了。有些非常小額的交易卻被誤記成了幾千元的支出。

有些客戶(hù)登錄之后卻發(fā)現(xiàn),他們查看的并不是自己的銀行賬號(hào),里面的信息壓根就屬于不相干的人。

晚上 9 點(diǎn),TSB 的領(lǐng)導(dǎo)層向英國(guó)的金融監(jiān)管機(jī)構(gòu)英國(guó)金融行為監(jiān)管局(Financial Conduct Authority,F(xiàn)CA)匯報(bào),自己這邊出了問(wèn)題。

而事實(shí)上在 TSB 自己匯報(bào)之前,F(xiàn)CA 就已經(jīng)注意到了這個(gè)事件,因?yàn)楹檬虏怀鲩T(mén),壞事傳千里,尤其是在這個(gè)有互聯(lián)網(wǎng)有 Twitter 的時(shí)代,出了問(wèn)題時(shí)人們首先想到的就是去 Twitter 上吐槽。

到了晚上 11:30,F(xiàn)CA 終于和另一個(gè)金融監(jiān)管機(jī)構(gòu) PRA(Prudential Regulation Authority)碰了頭,并在零點(diǎn)之后成功地與 TSB 的管理者們開(kāi)起了電話會(huì)議。

這時(shí)候已經(jīng)是 4 月 23 日,星期一的凌晨了。他們只想問(wèn)一個(gè)問(wèn)題:到底發(fā)生了什么?

盡管當(dāng)時(shí)的局面很混亂,但現(xiàn)在我們對(duì)事件已經(jīng)有了一個(gè)比較清晰的結(jié)論:13 億的用戶(hù)數(shù)據(jù)在遷移中被損壞了。

事后銀行的 IT 系統(tǒng)用了幾個(gè)星期才恢復(fù)服務(wù),在此期間有幾百萬(wàn)人的日常存取錢(qián)行為受到了影響。

而直到這個(gè)事件發(fā)生一年多之后,專(zhuān)家們才自認(rèn)為找到了問(wèn)題的根本原因:缺乏嚴(yán)格的測(cè)試。

[[311841]] 

02.遷移并不是想象中的那么簡(jiǎn)單

隨著用戶(hù)的需求和期望不斷增加,銀行的 IT 系統(tǒng)也變得越來(lái)越復(fù)雜。

60 年前,我們需要自己在營(yíng)業(yè)時(shí)間去到銀行的某個(gè)分行或營(yíng)業(yè)部,在營(yíng)業(yè)員的幫助下在柜臺(tái)上把錢(qián)存入銀行,或者把錢(qián)從銀行取出來(lái)。

我們銀行賬戶(hù)里的數(shù)字變動(dòng)與我們拿在手上的真實(shí)的錢(qián)是完全對(duì)應(yīng)的。銀行工作人員會(huì)用筆和紙記下我們賬戶(hù)的變動(dòng),普通顧客是接觸不到任何計(jì)算機(jī)系統(tǒng)的。

然后當(dāng)一天或一周結(jié)束時(shí),銀行工作人員再把傳統(tǒng)的記錄在卡片或紙帶上的數(shù)據(jù)輸入巨型計(jì)算機(jī),做最終匯總。

到了 1967 年,世界上第一臺(tái)自動(dòng)提款機(jī)(Automated Teller Machine,ATM)在倫敦北部的一家銀行門(mén)前正式投入使用。

它徹底地改變了銀行為顧客提供服務(wù)的方式,也改變了銀行的方方面面。方便成了銀行服務(wù)的基本標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)也讓用戶(hù)與屏幕后面運(yùn)行的銀行系統(tǒng)之間的距離大大地拉近了。

“在很久以前,IT 系統(tǒng)只是給銀行內(nèi)部工作人員使用的,只需要在柜臺(tái)上做些紙質(zhì)工作,銀行就完全可以正常運(yùn)轉(zhuǎn)”,ITRS 集團(tuán)的首席執(zhí)行官 Guy Warren 說(shuō)。

ITRS 集團(tuán)是全世界 190 多家銀行的技術(shù)供應(yīng)商。“后來(lái) ATM 出現(xiàn)了,再后來(lái)又有了網(wǎng)上銀行系統(tǒng),普通顧客才真的直接與銀行的 IT 系統(tǒng)打交道了。”

ATM 還只是個(gè)開(kāi)始。很快人們就可以通過(guò)電話進(jìn)行轉(zhuǎn)賬,再也不必去現(xiàn)場(chǎng)排隊(duì)了。

這個(gè)功能需要把特制的卡片插入可以解密雙音多頻(Dual-Tone Multi-Frequency,DTMF)信號(hào)的硬件中,這樣當(dāng)客戶(hù)按下“1”時(shí),它就可以把這個(gè)命令翻譯成“取錢(qián)”,而把“2”翻譯成“存錢(qián)”。

網(wǎng)上銀行和手機(jī)銀行把客戶(hù)與銀行核心系統(tǒng)之間的距離拉得更近了。盡管不同的功能會(huì)由不同的子系統(tǒng)來(lái)實(shí)現(xiàn),但所有子系統(tǒng)之間都要進(jìn)行交互,并且向最核心的系統(tǒng)發(fā)出請(qǐng)求,比如更新余額、記錄轉(zhuǎn)賬等等。

據(jù) BLMS 咨詢(xún)公司的 Brian Lancaste 所說(shuō),典型的零售銀行核心系統(tǒng)都會(huì)運(yùn)行在一臺(tái)大型機(jī)上。

他曾經(jīng)在 IBM 工作過(guò) 13 年,而在 HSBC 負(fù)責(zé)管理 IT 技術(shù)部門(mén)的時(shí)間則更長(zhǎng)。他現(xiàn)在為銀行提供咨詢(xún)服務(wù),并在全英國(guó)范圍內(nèi)推動(dòng)社區(qū)(對(duì)客戶(hù)服務(wù)的社區(qū)銀行)的構(gòu)建。

他說(shuō),“那可能是你能夠運(yùn)行核心系統(tǒng)的最可靠的平臺(tái)了,也是最具備可擴(kuò)展性的”。

把核心的用戶(hù)數(shù)據(jù)庫(kù)放在大型機(jī)上,再加上運(yùn)行在許多服務(wù)器之上的其他不同的 IT 基礎(chǔ)設(shè)施,就可以構(gòu)建對(duì)大型機(jī)進(jìn)行訪問(wèn)的應(yīng)用接口,從而提供互聯(lián)網(wǎng)接入了。

當(dāng)用戶(hù)在網(wǎng)上登錄進(jìn)自己的銀行賬號(hào),看到了自己的最新信息時(shí),很少有人會(huì)想到發(fā)生在后臺(tái)的數(shù)據(jù)處理過(guò)程有多么復(fù)雜。登錄信息會(huì)在多臺(tái)服務(wù)器之間傳遞。

當(dāng)你做一筆交易時(shí),系統(tǒng)會(huì)從后端的基礎(chǔ)設(shè)施拷貝一份數(shù)據(jù)過(guò)來(lái),然后就是復(fù)雜的部分了:把錢(qián)從一個(gè)賬戶(hù)搬到另一個(gè)賬戶(hù),完成交水電費(fèi)、還款等實(shí)際業(yè)務(wù),然后再繼續(xù)處理其他請(qǐng)求。

再設(shè)想一下,如果上面描述的過(guò)程每秒鐘同時(shí)發(fā)生幾十億次,又會(huì)是怎樣呢?

世界銀行組織在比爾和梅琳達(dá)·蓋茨基金會(huì)(The Bill & Melinda Gates Foundation)的幫助下,推算出現(xiàn)在全世界有 69% 的成年人都有銀行賬戶(hù)。

這些成年人每個(gè)人都要還賬單,有些還要還貸款,而有 Netflix 或優(yōu)酷土豆賬號(hào)的人就更多了。另外他們的銀行賬號(hào)也不屬于同一家銀行。

[[311842]] 

手機(jī)銀行、ATM 等數(shù)不清的銀行內(nèi)部 IT 系統(tǒng)不僅要在彼此之間進(jìn)行交互,它們還要與不同地域的不同銀行進(jìn)行交互,比如玻利維亞、危地馬拉甚至巴西等。

如果你把一張美國(guó)發(fā)行的信用卡插進(jìn)了一臺(tái)中國(guó)的 ATM 機(jī),它仍然要能夠取出錢(qián)來(lái)。錢(qián)一直是全球化的,但與錢(qián)相關(guān)的操作從來(lái)沒(méi)有這么復(fù)雜過(guò)。

“使用銀行 IT 系統(tǒng)的方式不斷在增加”,ITRS 集團(tuán)高管 Warren 說(shuō)。而且舊的系統(tǒng)幾乎永遠(yuǎn)都不會(huì)下線,新的系統(tǒng)還會(huì)不斷涌現(xiàn)出來(lái)。

“如果你考慮的問(wèn)題是用各種各樣的平臺(tái)來(lái)滿(mǎn)足各種不同的用戶(hù)群體,以及它們能夠提供多少在線服務(wù)的時(shí)間,那么很明顯,你會(huì)有大問(wèn)題”,Warren 說(shuō)。

事實(shí)上,衡量一個(gè)好的 IT 系統(tǒng)的標(biāo)準(zhǔn)是“你的系統(tǒng)有多大能力做自我修復(fù),在出現(xiàn)嚴(yán)重故障甚至停服時(shí),它能夠處理得怎么樣”。

“雙活數(shù)據(jù)中心”這個(gè)詞講的是至少要有兩個(gè)數(shù)據(jù)中心來(lái)一起提供服務(wù),保證在任何時(shí)刻都可以正常處理業(yè)務(wù),它通過(guò)冗余來(lái)提高了可靠性。

[[311843]] 

03.問(wèn)題復(fù)盤(pán)

TSB 的 IT 系統(tǒng)就不擅長(zhǎng)自我修復(fù),銀行的技術(shù)團(tuán)隊(duì)在處理嚴(yán)重故障時(shí)也很痛苦。但導(dǎo)致 TSB 的 IT 系統(tǒng)故障的根本原因在于它的復(fù)雜性。

根據(jù)事故早期 IBM 為 TSB 出具的一份報(bào)告,“新應(yīng)用與微服務(wù)的高級(jí)用法相結(jié)合,再加上使用了雙活數(shù)據(jù)中心,導(dǎo)致了生產(chǎn)環(huán)境的多重風(fēng)險(xiǎn)”。

對(duì)于像 HSBC 一樣的全球性銀行,IT 系統(tǒng)都是高度復(fù)雜并且內(nèi)部互聯(lián)的,因此會(huì)有規(guī)律地進(jìn)行測(cè)試、遷移和升級(jí)等活動(dòng)。

“對(duì)于像 HSBC 這樣的公司,這些事情是時(shí)時(shí)刻刻在發(fā)生的”,前 HSBC 的 IT 技術(shù)負(fù)責(zé)人 Lancaster 說(shuō)。

他覺(jué)得 HSBC 可以做為其他銀行如何運(yùn)營(yíng) IT 系統(tǒng)的典范:要有專(zhuān)職的員工,付出專(zhuān)門(mén)的時(shí)間。

“就算你標(biāo)記好所有的 I,劃上所有的 T,最后總會(huì)發(fā)現(xiàn) IT 系統(tǒng)還是需要相當(dāng)大量的計(jì)劃和測(cè)試工作”,Lancaster 說(shuō)。

對(duì)于小型銀行,尤其是那些沒(méi)有豐富的數(shù)據(jù)遷移經(jīng)驗(yàn)的小型銀行來(lái)說(shuō),要把這事做好就更有挑戰(zhàn)性了。

“TSB 的遷移工作就很復(fù)雜”,Lancaster 說(shuō),“我不確定他們是不是真的明白這事有多復(fù)雜,我印象很深的是他們并沒(méi)有制訂出非常明確的測(cè)試計(jì)劃”。

故障發(fā)生幾個(gè)星期之后,F(xiàn)CA 的首席執(zhí)行官 Andrew Bailey 在回應(yīng)英國(guó)議會(huì)就這個(gè)問(wèn)題的問(wèn)詢(xún)時(shí)確認(rèn)了這一點(diǎn)。

有問(wèn)題的代碼當(dāng)然是 TSB 問(wèn)題的根源,但全球金融網(wǎng)絡(luò)相互關(guān)聯(lián)的各個(gè)系統(tǒng)讓它的錯(cuò)誤層出不窮并且無(wú)法逆轉(zhuǎn)。

各種意想不到的錯(cuò)誤不斷地從這個(gè) IT 架構(gòu)各個(gè)地方冒出來(lái)。用戶(hù)不斷地收到各種冒名其妙的消息,而且壓根與自己的問(wèn)題無(wú)關(guān)。

“對(duì)我來(lái)說(shuō),這表明他們?nèi)狈训幕貧w測(cè)試,因?yàn)殂y行系統(tǒng)是與支付系統(tǒng)、短信系統(tǒng)等許多外部系統(tǒng)相關(guān)聯(lián)的”,Bailey 告訴議員們,“當(dāng)你提交了修復(fù)代碼,又引發(fā)了各種意想不到的問(wèn)題時(shí),那我們就又回到了測(cè)試的問(wèn)題上”。

回歸測(cè)試可能可以有助于避免這樣的災(zāi)難,它可以幫你在把有問(wèn)題的代碼部署到生產(chǎn)環(huán)境之前,在有問(wèn)題的代碼與外部依賴(lài)相互作用造成不可逆轉(zhuǎn)的錯(cuò)誤、造成嚴(yán)重破壞之前,就把問(wèn)題定位出來(lái)。

其他人也表示了同意。被邀請(qǐng)來(lái)幫忙定位問(wèn)題的 IBM 專(zhuān)家一點(diǎn)也沒(méi)有掩飾對(duì) TSB 的批評(píng)之意。

他們說(shuō)本應(yīng)該看到“國(guó)際標(biāo)準(zhǔn)級(jí)的嚴(yán)格設(shè)計(jì)、測(cè)試方法、全面的運(yùn)營(yíng)論證、預(yù)上線試運(yùn)行和就緒的運(yùn)維支撐等”。

而實(shí)際上他們看到的完全不一樣:“IBM 并沒(méi)有看到有任何證據(jù)表明這些系統(tǒng)經(jīng)過(guò)了哪些可以達(dá)到上線標(biāo)準(zhǔn)的嚴(yán)格測(cè)試,以證明它們可以投入生產(chǎn)了”。

TSB 已經(jīng)踏入了雷區(qū),而看起來(lái)她還毫不知情。

“他們所使用的技術(shù)是有相當(dāng)大復(fù)雜度的,而且這些復(fù)雜度又有著不同的表現(xiàn)形式”,Ryan Rubin 說(shuō)。

他是一個(gè) IT 專(zhuān)家,之前曾在 EY 工作,現(xiàn)在是 Cyberian Defence 的管理總監(jiān),這是一家專(zhuān)門(mén)幫助大型公司管理網(wǎng)絡(luò)風(fēng)險(xiǎn)的咨詢(xún)公司。“這可能會(huì)導(dǎo)致宕機(jī)和各種復(fù)雜事件,正如我們所看到的那樣”。

Warren 說(shuō),英國(guó)的銀行一般的行業(yè)標(biāo)準(zhǔn)是要達(dá)到“四個(gè)九”的可用性,即在 99.99% 的時(shí)間里他們的服務(wù)要對(duì)用戶(hù)可用。

在現(xiàn)實(shí)中,這意味著和網(wǎng)上銀行一樣,銀行的 IT 系統(tǒng)在一天中的每個(gè)小時(shí)都要正常對(duì)外提供服務(wù),在一年中也最多只能有 52 分鐘的離線時(shí)間。

“三個(gè)九”,即 99.9% 的可能性,聽(tīng)起來(lái)與四個(gè)九好像沒(méi)有太大區(qū)別,但那就意味著一年超過(guò) 8 小時(shí)的停服時(shí)間。

“對(duì)于一家英國(guó)銀行來(lái)說(shuō),四個(gè)九的標(biāo)準(zhǔn)是可以的,三個(gè)九的標(biāo)準(zhǔn)不可接受”,Warren 說(shuō),他回想起來(lái)他提供咨詢(xún)服務(wù)的第一個(gè)軟件項(xiàng)目就要求達(dá)到六個(gè)九的標(biāo)準(zhǔn)——那是一家核電站的控制系統(tǒng)。

每當(dāng)一家公司對(duì)她的 IT 基礎(chǔ)設(shè)施做出變更時(shí),就會(huì)有引入故障的風(fēng)險(xiǎn)。減少變化當(dāng)然有助于避免問(wèn)題,但對(duì)于必要的改變來(lái)說(shuō),就要經(jīng)過(guò)嚴(yán)格的測(cè)試,這正是 IBM 所強(qiáng)調(diào)的在 TSB 的故障中所缺乏的。

Shujun Li 在肯特大學(xué)教授網(wǎng)絡(luò)安全課程,也為包括一家大型銀行和許多保險(xiǎn)公司在內(nèi)的大型公司提供咨詢(xún)服務(wù)。

他說(shuō),每次升級(jí)和打補(bǔ)丁操作最后都會(huì)歸結(jié)到風(fēng)險(xiǎn)管理的問(wèn)題,對(duì)那些客戶(hù)投資幾億的大型項(xiàng)目來(lái)說(shuō)尤其如此。

“要有流程來(lái)保證風(fēng)險(xiǎn)都得到了有效的控制”,他說(shuō),“另外你還要心里有數(shù),萬(wàn)一出了問(wèn)題的話,可能會(huì)付出多少金錢(qián)和名譽(yù)上的代價(jià)”。

詳細(xì)的計(jì)劃可以降低 TSB 所經(jīng)歷的這種重大事故的風(fēng)險(xiǎn)。“故障還是會(huì)發(fā)生的,但進(jìn)行快速恢復(fù)和保持冗余所要付出的代價(jià)卻會(huì)減少”,Rubin 說(shuō)。

隨著網(wǎng)絡(luò)供應(yīng)商和云解決方案的發(fā)展,存儲(chǔ)費(fèi)用已經(jīng)大大降低了。“所有東西都是現(xiàn)成的,當(dāng)災(zāi)難發(fā)生時(shí),它們可以幫助銀行管理風(fēng)險(xiǎn),并將故障影響控制到最小”。

不過(guò),對(duì)于一些機(jī)構(gòu)來(lái)說(shuō),為應(yīng)對(duì)災(zāi)難的發(fā)生而要實(shí)施備份計(jì)劃的成本可能太高。Warren 認(rèn)為,一些銀行在如何實(shí)現(xiàn) IT 彈性方面做得過(guò)于保守。

他解釋說(shuō):“你不能靠預(yù)算來(lái)做這件事。這是一項(xiàng)金融服務(wù):要么有,要么沒(méi)有。他們本來(lái)就應(yīng)該再多投入一些錢(qián)。”

吝嗇的 IT 投入最終讓人付出了慘痛的代價(jià)。

TSB 聲稱(chēng)他們?cè)?2018 年因?yàn)槭鹿试斐傻膿p失是 1.05 億歐元(1.34 億美元),與之形成對(duì)比的是 2017 年他們的利潤(rùn)是 1.63 億歐元(2.06 億美元)。

遷移事故后續(xù)的總支出達(dá)到了 3.3 億歐元(4.19 億美元),包括補(bǔ)償用戶(hù)、更正虛假交易(在事故發(fā)生后的混亂情況下,虛假交易的數(shù)量急劇上升)、以及為臨時(shí)聘請(qǐng)技術(shù)專(zhuān)家而要支出的費(fèi)用等。

對(duì)應(yīng)在這次事故中所要承擔(dān)的責(zé)任,TSB 的 IT 服務(wù)供應(yīng)商 Sabis 也收到了一張 1.53 億歐元(1.94 億美元)的賬單。

要降低風(fēng)險(xiǎn),也許最簡(jiǎn)單的辦法就是盡量不要做改動(dòng)。

但是正如 Lancaster 所說(shuō),“每間銀行,每個(gè)發(fā)展中的社區(qū),每家公司都無(wú)時(shí)無(wú)刻不被業(yè)務(wù)驅(qū)動(dòng)著,要構(gòu)建出越來(lái)越多的好東西來(lái)服務(wù)客戶(hù),支撐業(yè)務(wù)”。

他觀察到,“為了變得更有競(jìng)爭(zhēng)力,你就會(huì)有動(dòng)力引入更多的新系統(tǒng)和新功能”。同時(shí),對(duì)于各家公司,尤其是金融服務(wù)類(lèi)的公司來(lái)說(shuō),他們對(duì)客戶(hù)承擔(dān)著責(zé)任,要保證他們的財(cái)產(chǎn)安全,并且在使用現(xiàn)有服務(wù)時(shí)要保持良好的體驗(yàn)。

“當(dāng)你承受著巨大的業(yè)務(wù)壓力要引入新東西時(shí),兩難之處在于你該投入多少成本來(lái)讓所有系統(tǒng)保持正常運(yùn)行”。

根據(jù) FCA 公布的數(shù)據(jù),從 2017 年到 2018 年,英國(guó)金融服務(wù)業(yè)上報(bào)的技術(shù)故障發(fā)生次數(shù)增長(zhǎng)了 187%。

究其原因,最常見(jiàn)的故障根本原因都在于變更管理做得很失敗。尤其對(duì)于銀行系統(tǒng)來(lái)說(shuō),需要保持時(shí)刻在線,而且需要近乎實(shí)時(shí)的交易報(bào)告。

客戶(hù)可能擔(dān)心他們的錢(qián)會(huì)不會(huì)不翼而飛,如果感受不到自己的錢(qián)的存在,他們肯定會(huì)抓狂。

在 TSB 的事故發(fā)生幾個(gè)月之后,英國(guó)金融監(jiān)管機(jī)構(gòu)和英格蘭銀行一起發(fā)布了一份關(guān)于運(yùn)營(yíng)彈性的討論文件。

“文件的目的是提醒各家金融公司:你會(huì)不會(huì)把天平向引入新功能的一側(cè)傾斜了太多,從而忽略了現(xiàn)有系統(tǒng)的平穩(wěn)運(yùn)行?”Lancaster 解釋到。

文件也對(duì)監(jiān)管規(guī)則提出了修改建議:

公司里相關(guān)員工也應(yīng)該為公司的 IT 系統(tǒng)所出的故障負(fù)責(zé)。“如果你對(duì)此負(fù)有責(zé)任,你可能會(huì)因此而破產(chǎn),甚至可能被送進(jìn)監(jiān)獄。這會(huì)讓許多東西都隨之發(fā)生改變,包括大家對(duì)事情的重視程度,”Warren 說(shuō)。“你會(huì)非常慎重地對(duì)待它,因?yàn)樗玛P(guān)你的家庭財(cái)產(chǎn)和你的人身自由。”

Rubin 說(shuō):

“從 TSB 的事件之后,大家做事情時(shí)肯定會(huì)更加認(rèn)真地審查。高級(jí)管理者再也不會(huì)忽視 IT 系統(tǒng)的建設(shè),也不會(huì)對(duì)技術(shù)資產(chǎn)投入不足了。由于有著處罰和合規(guī)性要求,現(xiàn)在的形勢(shì)已經(jīng)發(fā)生了很大變化。”

不管大家從 TSB 身上學(xué)到了什么經(jīng)驗(yàn)和教訓(xùn),嚴(yán)重的停服事件肯定還是會(huì)發(fā)生的,這無(wú)可避免。

“我不認(rèn)為故障會(huì)消失”,Warren 說(shuō),相反,人們必須接受:“你能接受多大程度的可用性?換句話說(shuō),就是多少停服時(shí)間?”

作者:Chris Stokel-Walker,足下編譯

簡(jiǎn)介:本文翻譯自“ What broke the bank ”翻譯已取得原網(wǎng)站授權(quán)。

 

責(zé)任編輯:武曉燕 來(lái)源: increment
相關(guān)推薦

2020-02-04 14:27:09

架構(gòu)技術(shù)棧微信半月刊

2022-06-14 08:00:28

切換包管理器版本

2021-09-05 11:20:04

帶寬網(wǎng)絡(luò)排查

2021-11-01 17:29:02

Windows系統(tǒng)Fork

2017-03-20 19:40:29

AndroidSwipeRefres下拉刷新

2017-08-24 17:37:18

DNS緩存分析

2021-07-27 07:12:11

Getter接口Setter

2021-01-11 05:30:04

Boot 單機(jī)片

2018-12-27 09:09:35

2019-11-04 10:37:53

MongoDB宕機(jī)日志

2023-07-13 09:12:37

CNCF項(xiàng)目云原生

2024-05-13 08:37:17

炫技H5UI

2011-02-28 09:31:30

HashtableHashMap

2021-11-22 08:33:27

微信聊天離婚

2021-03-17 00:17:16

命令應(yīng)急響應(yīng)

2022-11-29 21:26:26

跨域配置

2015-02-04 14:36:07

格式串漏洞Ghost漏洞安全漏洞

2021-12-01 06:59:27

架構(gòu)

2019-01-16 09:20:42

架構(gòu)設(shè)計(jì)JVM FullGC宕機(jī)事故

2018-07-16 22:29:29

代碼迭代質(zhì)量
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)