乘云向未來 | 字節(jié)跳動多云架構(gòu)下的安全運營實踐之路
隨著企業(yè)數(shù)字化轉(zhuǎn)型進程進入“快車道”,“上云是常態(tài),不上云是例外”這一觀念不斷被接受,一系列云上安全問題也逐漸浮出水面——信息泄漏問題頻發(fā),僵尸攻擊、應(yīng)用程序攻擊等頻繁侵擾,使得業(yè)務(wù)連續(xù)性受到一定程度沖擊,對癥且有效的手段將成為護航企業(yè)玩轉(zhuǎn)云時代的“無形利器”。
11月10日、11月16日和11月24日,火山引擎公共云·城市分享會陸續(xù)亮相北京、上海、深圳。會上火山引擎以“如何輕松把控上云風(fēng)險”為題,分享了字節(jié)跳動在多云復(fù)雜架構(gòu)下的安全運營實踐經(jīng)驗,展示火山引擎高效護航云上安全的能力。
以下為演講實錄:
火山引擎致力于做一朵安全的云
隨著數(shù)字化轉(zhuǎn)型進程加快,越來越多的企業(yè)將業(yè)務(wù)放置于云上,以提高業(yè)務(wù)運行效率。然而,在近兩年,國內(nèi)外越來越多的攻防問題出現(xiàn)在云上。很多企業(yè)不禁困惑:上云是否助長了危險系數(shù)的提升,降低了業(yè)務(wù)的安全水平?
至此,各行各業(yè)開始愈發(fā)重視云上安全問題,如數(shù)據(jù)安全、云上權(quán)限管理等?;谑袌鲂枨蟾邼q,火山引擎致力于以產(chǎn)品與服務(wù)幫助企業(yè)解決上云過程中遇到的安全問題。
在火山引擎公共云·城市分享會上,討論最多的話題就是,火山引擎為什么要做云?
相比于toB行業(yè)的資深企業(yè)而言,火山引擎在云業(yè)務(wù)方面仍然處于追趕階段。但從競爭力來看,火山引擎toB業(yè)務(wù)具備兩大核心競爭力優(yōu)勢。
其一,火山引擎愿意服務(wù)各行各業(yè),可以作為最后的“兜底方”,用積極的態(tài)度幫助客戶解決各種問題。其二,字節(jié)跳動業(yè)務(wù)上云、業(yè)務(wù)云原生化都是走在行業(yè)較前列的。
在上云的過程中,字節(jié)跳動也面臨著安全問題。其中最典型的就是云上和線下IDC的運維、管理和操作方式完全不同,這給業(yè)務(wù)部門、安全部門和運維部門都帶來了巨大的挑戰(zhàn)。
在IDC領(lǐng)域,比如防火墻、交換機、數(shù)據(jù)庫能否訪問公網(wǎng),都是可以由自己控制的,一個命令就可以實現(xiàn)。但是在云上這種方法就不可行了。幾乎所有的云都需要配置較多的規(guī)則、角色、權(quán)限等,一旦配置出錯,就會出現(xiàn)前述種種問題。因此,云上的安全復(fù)雜性是很大的。
無論是從成本還是從穩(wěn)定性來考慮,很多業(yè)務(wù)使用多云是剛需。多云就意味著企業(yè)需要使用不止一家云廠商的產(chǎn)品,然而一種云產(chǎn)品就已經(jīng)帶來如此多的問題,多云就會讓這些問題、風(fēng)險雙倍甚至三倍增長,帶來不可估量的隱患。
在先前的調(diào)研中,火山引擎發(fā)現(xiàn),海外的相關(guān)云上、多云防護產(chǎn)品大多數(shù)比較成熟,但國內(nèi)相對來說成熟產(chǎn)品較少,這與國內(nèi)的信息化進程、轉(zhuǎn)型的節(jié)奏息息相關(guān)。
目前,國內(nèi)絕大多數(shù)企業(yè)使用云的形式比較單一,比如購買大量的ECS算力、存儲,在云上放置一些邊緣業(yè)務(wù),而主要的業(yè)務(wù)還是放在線下。這種做法相對來說,使用云的形式、模式還沒有那么復(fù)雜,很多問題還沒有充分暴露出來。
隨著企業(yè)信息化轉(zhuǎn)型、降本增效的需求增長,公有云、混合云在未來將會繼續(xù)呈現(xiàn)增長的趨勢。在這個趨勢下,安全類問題是企業(yè)必須關(guān)注的?;鹕揭嬉龅?,就是不管是自己使用多云場景,還是對外服務(wù)客戶,都將發(fā)揮最大價值來保障安全穩(wěn)定。這也是火山引擎將長期投入的一項事業(yè)。
多云在安全方面的隱患會帶來很多附加成本。從安全角度來看,包括勒索問題在內(nèi)的各種各樣問題將會逐漸暴露;從業(yè)務(wù)角度而言,數(shù)據(jù)泄露等安全問題的修復(fù)過程是較為困難的,且成本較高。
要事前不要事后,要可見不要盲點
基于上述多重挑戰(zhàn),字節(jié)跳動從安全運營和安全防護的角度提出了解決思路——要事前不要事后,要可見不要盲點。
即盡可能讓安全風(fēng)險控制在事前,而不是事后;盡可能讓所有的資產(chǎn),無論是暴露在公網(wǎng)還是內(nèi)網(wǎng),都盡可能可見,不要有盲點。盲點是非??膳碌?,因為不知道什么時候你的公司域名或IP會被仿冒,可能會泄露公司業(yè)務(wù)代碼或敏感數(shù)據(jù),如果沒有做到提前預(yù)防,其造成的損失將不可控。
云上賬號的安全風(fēng)險大大增加,不同的賬號有不同的權(quán)限,例如業(yè)務(wù)的開發(fā)或運維人員,在完全不知情的情況下,在企業(yè)的一朵云上創(chuàng)建了一個數(shù)據(jù)庫或ECS,很可能就會遇到泄漏或被攻擊的風(fēng)險。
此外,要統(tǒng)一,不要分散。安全問題在這一維度上跟業(yè)務(wù)是一樣的,要強調(diào)統(tǒng)一性。在安全領(lǐng)域有一個短板理論,即一個企業(yè)的安全是由最小的業(yè)務(wù)決定的,小業(yè)務(wù)一旦被攻破,將會直接影響所有的業(yè)務(wù)。統(tǒng)一的安全管控和治理,將是企業(yè)上云重要的一環(huán),它將關(guān)系到效率、成本和穩(wěn)定性等因素。
以多重能力打造產(chǎn)品矩陣,護航企業(yè)云上安全
字節(jié)跳動的上云進程是比較快速的,幾乎主要業(yè)務(wù)都在云上。因此,火山引擎基于字節(jié)跳動的業(yè)務(wù)防護經(jīng)驗,總結(jié)了相關(guān)的解決方案,并沉淀在產(chǎn)品中,輸出給客戶和伙伴。
整體而言,字節(jié)跳動要像運營一朵云一樣運營多云。這其中包括幾個方面的內(nèi)容。從底層來說,字節(jié)跳動本身是多云架構(gòu)模式,使用過包括火山引擎在內(nèi)的多個云;從核心能力來看,火山引擎擁有流量、邊界、終端、賬號、資產(chǎn)、權(quán)限等等所有相關(guān)的安全數(shù)據(jù)能力,同時可以對外提供統(tǒng)一的多云管控、多云數(shù)據(jù)安全篩查,這是解決多云安全問題的總體思路和架構(gòu)。
對此,火山引擎總結(jié)了長期在字節(jié)跳動業(yè)務(wù)實踐中積累下來的安全策略。
在上云初期階段,火山引擎產(chǎn)品能夠在10分鐘內(nèi)橫跨多云,全面獲取資產(chǎn)潛在風(fēng)險。業(yè)務(wù)在上云的過程中,也需要不同的賬號。通過統(tǒng)一的策略和界面,可以讓集團的安全措施和安全要求及時觸達到每一個賬號上,一旦出現(xiàn)問題,集團能夠及時屏蔽掉不同云之間、不同IDC之間安全防護能力的差異性。
在漏洞修復(fù)方面,僅需2步就能批量修復(fù)數(shù)千風(fēng)險資產(chǎn)。多云安全內(nèi)置的快捷修復(fù)腳本可覆蓋90%的多云安全策略,能夠基于配置的敏感性提供多種修復(fù)方式,例如增量安全功能自動加固開啟、歷史越權(quán)配置評估使用頻率、跨云資產(chǎn)細粒度操作支持、無需額外操作自動區(qū)分多云差異性等。
在資產(chǎn)創(chuàng)建方面,1次點擊就能夠進行資產(chǎn)創(chuàng)建,遵循最佳安全實踐。想要將業(yè)務(wù)放到云上,就要申請云上的DB、主機等,業(yè)務(wù)的運維、研發(fā)人員都具備此權(quán)限。因此,需要對信息實時感知,才可能防范風(fēng)險。通過實時的監(jiān)控和掃描,幫助運維、安全人員記錄每一步操作,例如,誰開了一個端口、誰開了遠程桌面,都能夠清晰記載。這對安全人員來說,就減少了相應(yīng)的擔(dān)憂,讓風(fēng)險可見可管控。
在風(fēng)險檢測方面,內(nèi)置4類入侵檢測引擎,全面保護云上資產(chǎn)?;鹕揭婕嫒莶煌飘a(chǎn)品和安全產(chǎn)品。通過可視化形式,幫助用戶在多云下,提高處置安全事件的效率。其中,字節(jié)跳動開啟了基于內(nèi)核打造的長期開源終端安全項目,在安全檢測能力、穩(wěn)定性、性能方面,基本處于國內(nèi)頂尖水平,能夠避免由于代碼寫錯造成對業(yè)務(wù)的嚴重影響。
在風(fēng)險處置方面,通過跨云協(xié)同處置的方式,讓風(fēng)險閉環(huán)。當(dāng)遇到一個入侵事件或告警的時候,首先要判斷是否是真實的。能夠把告警的噪聲和精確度提升上來,是企業(yè)安全水平提升的一個顯著標(biāo)志。字節(jié)跳動的業(yè)務(wù)規(guī)模已經(jīng)遍及各地,不同地區(qū)的分布、不同流量入口、不同終端規(guī)模帶來的告警事件是大量的?;鹕揭嫱ㄟ^長期打磨,優(yōu)化降噪和止損的經(jīng)驗,整合成了產(chǎn)品,通過可視化精準(zhǔn)識別需要關(guān)注的告警,并給出加固阻斷操作指引,讓止血、預(yù)防、降噪、自動化形成閉環(huán)。
在安全運營方面,無論對于響應(yīng)時間,還是漏洞修復(fù)而言,安全運營都是至關(guān)重要的一環(huán)。火山引擎提供豐富向外擴展兼容能力,支持連接企業(yè)原生辦公軟件、工單流程、消息中心等,以開放接口,平滑銜接企業(yè)原有的安全流程,提高組織效率。
在合規(guī)問題上,火山引擎從IP角度、審計角度、合規(guī)角度,將大量需要滿足規(guī)范的經(jīng)驗或策略形成模板提供給用戶。包括超過30個合規(guī)評估框架,自動遵循等保2.0、NIST、SOC2、PCI-DSS和各種CIS標(biāo)準(zhǔn)等。
基于一系列字節(jié)跳動多云安全運營的實踐與探索,火山引擎也推出了多云安全平臺產(chǎn)品,皆是在字節(jié)跳動業(yè)務(wù)長期實踐中總結(jié)的最佳解決方案,這也并非終點。火山引擎將持續(xù)以字節(jié)跳動為依托,打造更豐富、更穩(wěn)定、更安全可靠的云安全類產(chǎn)品,將更好的服務(wù)帶給用戶。