自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

T前線:云原生改造到底有多難

原創(chuàng) 精選
數(shù)字化轉(zhuǎn)型 云原生
云原生改造沒有那么簡單,需要具體問題具體分析。

鮮花與荊棘同在。云原生在外界看來,是高端大氣上檔次的時(shí)髦熱詞。彈性、可觀測、韌性、可持續(xù)等一系列優(yōu)美的詞匯都會(huì)出現(xiàn)在它的上下文。但回歸到落地層面,卻并非一朝一夕之功。

云原生改造是事關(guān)企業(yè)長遠(yuǎn)發(fā)展的一項(xiàng)重要舉措。作業(yè)幫的基礎(chǔ)技術(shù)架構(gòu)經(jīng)歷了成功的轉(zhuǎn)型,轉(zhuǎn)型過程中面臨的挑戰(zhàn)也是困難重重,有哪些轉(zhuǎn)型經(jīng)驗(yàn)值得借鑒?

我們請(qǐng)到了作業(yè)幫基礎(chǔ)架構(gòu)負(fù)責(zé)人董曉聰,分享作業(yè)幫在多云之路上的思考與探索。希望本文能給即將或正在數(shù)字化轉(zhuǎn)型的開發(fā)者、管理者以幫助。

Q:是什么原因讓作業(yè)幫選擇了云原生?

A:本人在 2019 年加入作業(yè)幫,發(fā)現(xiàn)當(dāng)時(shí)基礎(chǔ)技術(shù)架構(gòu)的有兩個(gè)特點(diǎn):

一、規(guī)模化:作業(yè)幫線上有數(shù)千個(gè)應(yīng)用服務(wù),這么多應(yīng)用服務(wù)對(duì)應(yīng)數(shù)萬個(gè)服務(wù)實(shí)例,這么多的服務(wù)實(shí)例跑在數(shù)十萬的計(jì)算核心之上;二、復(fù)雜化:作業(yè)幫整體的技術(shù)棧是比較多元的。其中占比最高的技術(shù)棧是 Golang 和 PHP,還有大量模塊是 C++、Python、Java 等進(jìn)行編寫的。

此外,不同的業(yè)務(wù)特點(diǎn)和團(tuán)隊(duì)特點(diǎn)差異很大,比如流量產(chǎn)品,技術(shù)棧偏向于保守,而產(chǎn)業(yè)互聯(lián)網(wǎng)的業(yè)務(wù)架構(gòu)則由領(lǐng)域驅(qū)動(dòng),微服務(wù)架構(gòu)比較徹底。

作業(yè)幫在穩(wěn)定性、效率、成本等方面也面臨著諸多挑戰(zhàn)。

穩(wěn)定性方面。之前在傳統(tǒng)的互聯(lián)網(wǎng)公司,大家很少接觸到用戶,對(duì)用戶的感知更多的是一個(gè)個(gè) UV、PV 數(shù)字,但在線教育不一樣,我們通過直播等形式面對(duì)的是一個(gè)個(gè)學(xué)生,每一次穩(wěn)定性的事故都可能會(huì)影響他們的學(xué)業(yè),造成不可挽回的損失。所以作業(yè)幫對(duì)穩(wěn)定性的要求只能更高。首先,考慮當(dāng)出現(xiàn)單機(jī)、單機(jī)群、單云故障的時(shí)候,我們的架構(gòu)能否很好的應(yīng)對(duì)這些沖擊?當(dāng)代碼變更導(dǎo)致業(yè)務(wù)中斷的時(shí)候,我們能不能快速止損?

再比如效率問題。由于線下、線上的交付物不同(如:線下是容器,線上卻是虛擬機(jī)),兩側(cè)的環(huán)境也是異構(gòu)的,這就導(dǎo)致研發(fā)、運(yùn)維、測試的周期和成本會(huì)成倍的增加。

一旦出現(xiàn)網(wǎng)絡(luò)的抖動(dòng)、服務(wù)的故障,總需要各方不斷協(xié)調(diào),等著研發(fā)等運(yùn)維,運(yùn)維等云廠商來恢復(fù),給用戶造成非常不好的體驗(yàn)。

另一個(gè)很大一部分也是出于 IT 支出的考慮,是結(jié)合業(yè)務(wù)考慮,與多家廠商談判得到的結(jié)果。

綜上,基于穩(wěn)定性和成本、效率等問題的考慮,作業(yè)幫選擇了云原生以及多云。

改造后的整體收益,還是比較明顯的。首先是穩(wěn)定性,整體機(jī)器故障的影響也從分鐘級(jí)別縮短到了秒級(jí),交付部署的質(zhì)量得到了大幅度提升。成本這塊也有明顯的收益。

Q:作業(yè)幫在云原生改造的過程中積累了不少專利,能簡要介紹下嗎?

A:近些年作業(yè)幫,在云原生方面積累了一些成果,非常樂于與業(yè)界展開分享交流。下面列舉一些。

比如在資源層,作業(yè)幫打通了各家云的網(wǎng)絡(luò),在連通性、高可靠、感控能力等方面處理和制定了一套計(jì)算生命周期的平臺(tái);在容器層面,開發(fā)了一套多云分發(fā)的平臺(tái);在服務(wù)治理層,自研了一套分布式的日志查詢引擎方案,這套方案的成本僅為 ES 的 1/10,同時(shí)整體的查詢效率也比較高查詢 1TB 日志的話,耗時(shí)是在 5 秒以內(nèi),大幅度提高了研發(fā)的效率 ;流量管控方面,作業(yè)幫的方案已經(jīng)將 P90 的損耗將至了 0.8ms,而開源方案一般在 3 ms;應(yīng)用層面,作業(yè)幫也自建了可自由切換的多云體系,其中比較經(jīng)典的是將外呼系統(tǒng)建成了一套多活的架構(gòu)。

Q: 如何看待云原生的發(fā)展

A:云原生提供了以下三種關(guān)鍵能力:容器化、服務(wù)網(wǎng)格、多活,三種能力的最終的目的,是把之前云被禁錮的能力釋放出來。展開來講,首先,容器是一個(gè)基座的能力,只有容器實(shí)現(xiàn)了 100%,上層的能力才能釋放出來。

其次,服務(wù)網(wǎng)格。目前看,業(yè)內(nèi)已經(jīng)存在主流的方案 Istio,也有 BAT 自研方案,對(duì)于中長尾企業(yè)來內(nèi)的接受度也不錯(cuò),但也存在部分機(jī)制、性能上的問題。Mesh 方面,目前業(yè)界沒有達(dá)成一套統(tǒng)一的標(biāo)準(zhǔn)。隨著容器 K8S 標(biāo)準(zhǔn)的形成,關(guān)于 Mesh 的標(biāo)準(zhǔn)也需要業(yè)內(nèi)人士的碰撞、交流與探索。

個(gè)人比較看好的是,微軟之前提出的 Dapr 的 Multi-Runtime 思路。它把更多運(yùn)行時(shí)卸載到 Sidecar ,本質(zhì)上是將中間件和業(yè)務(wù)代碼進(jìn)一步解耦。

第三,上層的多云多活,之前阿里云原生實(shí)戰(zhàn)峰會(huì)上公開了應(yīng)用多活的白皮書??梢钥闯?,企業(yè)對(duì)于云原生的性能要求越來越高,云原生的規(guī)范和標(biāo)準(zhǔn)正在清晰化和明確化。

Q:能介紹下關(guān)于 GPU 容器化、多云遷移方面的情況嗎?

A:關(guān)于 GPU 調(diào)度的優(yōu)化,起源于作業(yè)幫使用 AI 推理、圖像識(shí)別占用的資源比較多。GPU 是一個(gè)相對(duì)比較貴的資源,通過調(diào)研一些方案并和云廠商進(jìn)行溝通,了解到目前主要推薦的方案是 GPU 容器化,但是這會(huì)至少帶來 15% 的性能損耗,這個(gè)是沒法接受的。但我們發(fā)現(xiàn)大多數(shù)的 GPU 服務(wù)使用的各種資源相對(duì)比較固定。于是作業(yè)幫基于算力和顯存去進(jìn)行了一些策略的調(diào)度,根據(jù)這些服務(wù)與資源進(jìn)行匹配的方式,也就是比較經(jīng)典的背包問題,同時(shí)夜間也會(huì)進(jìn)行一下預(yù)測再重新調(diào)度,如果中間出現(xiàn)一些故障,也會(huì)執(zhí)行轉(zhuǎn)移相關(guān)的策略。GPU 服務(wù)目前已經(jīng)實(shí)現(xiàn) 100% 容器化。

多云遷移,當(dāng)時(shí)對(duì)于作業(yè)幫來說比較難。因?yàn)橥瑫r(shí)還在做容器化改造,疊加實(shí)施的難度很大。我們的做法是將服務(wù)注冊(cè)統(tǒng)一起來,本質(zhì)上打通容器與虛擬機(jī)的鴻溝。多云之間的遷移是分步驟的,將需要遷移的業(yè)務(wù)在服務(wù)發(fā)現(xiàn)的過程中解耦掉,就可以分批進(jìn)行了。

Q:作業(yè)幫的云原生的轉(zhuǎn)型,會(huì)對(duì)技術(shù)管理上帶來哪些變化呢?

A:比較明顯的是,會(huì)對(duì)運(yùn)維的方式產(chǎn)生一定的影響。對(duì)于運(yùn)維的崗位而言,中等規(guī)模的公司是很難接受的。人肉的工作少了,基礎(chǔ)架構(gòu)的能力更得到重視,不再局限于一些重復(fù)的、機(jī)械式的工作。

技術(shù)的變革,就好比馬車與火車的變革。如果能及時(shí)遷移到新的技術(shù)上來,相信能夠帶來新的成長。

對(duì)于技術(shù)管理者而言,這里呼吁大家積極加入這場變革中來,這里是一片廣闊的海洋。云原生本身代表著開放,不是開源與廠商之間的爭奪。希望大家都能參與進(jìn)來,一起把這個(gè)領(lǐng)域做的更加完善。今天大家把云原生向前推動(dòng)一步,明天就能從云原生的升級(jí)中得到巨大的回饋。

同時(shí),企業(yè)在進(jìn)行云原生改造過程中,不應(yīng)盲目追求主流的技術(shù)方案,一定要從實(shí)際的業(yè)務(wù)情況出發(fā)來做選擇,這樣才能獲得實(shí)用的收益。團(tuán)隊(duì)管理上,應(yīng)積極引導(dǎo)團(tuán)隊(duì)在云原生改造的過程中,保持擁抱變化的積極心態(tài)。另外還會(huì)出現(xiàn)設(shè)施不完備等一系列客觀問題,都需要給與一定時(shí)間的寬容度。

Q:開源方面,作業(yè)幫有哪些進(jìn)展?

A:作業(yè)幫在開源社區(qū)一直是有有回饋的,像之前有開源日志方面的方案,至于下一步,整體項(xiàng)目的開源,我們希望把項(xiàng)目做的完善一點(diǎn),更有普適性之后再進(jìn)行開源。期待開源后與業(yè)內(nèi)朋友一起溝通交流。

寫在最后

容器化、服務(wù)網(wǎng)格、多活架構(gòu),可以說是云原生發(fā)展到目前為止最為重要的三個(gè)特點(diǎn)。這些特點(diǎn)是無數(shù)云開發(fā)者一起努力得到的結(jié)果。

正如董老師所言,云原生是一片廣闊的海洋。只有更多的開發(fā)者和企業(yè)一道參與進(jìn)來,才能助力云原生結(jié)出累累碩果,改變與我們息息相關(guān)的數(shù)智化世界。

專家介紹

董曉聰,2019 年加入作業(yè)幫,作業(yè)幫基礎(chǔ)架構(gòu)的負(fù)責(zé)人,負(fù)責(zé)架構(gòu)研發(fā)、運(yùn)維、DBA、安全相關(guān)的工作,阿里云 MVP、騰訊云 TVP。曾在百度、滴滴等公司負(fù)責(zé)架構(gòu)和技術(shù)管理工作,擅長業(yè)務(wù)中臺(tái)、技術(shù)中臺(tái)、研發(fā)中臺(tái)的搭建和迭代。

作業(yè)幫成立于 2015 年,是一家以科技手段助力普惠教育的公司,公司主要的業(yè)務(wù)分為兩大板塊。第一,作業(yè)幫 App 是一款典型的流量互聯(lián)網(wǎng)產(chǎn)品,二是作業(yè)幫直播課,是一款典型的產(chǎn)業(yè)互聯(lián)網(wǎng)產(chǎn)品,涵蓋教育主播鏈條,如教研、教學(xué)、教務(wù)、輔導(dǎo)等。

責(zé)任編輯:薛彥澤 來源: 51CTO
相關(guān)推薦

2022-09-01 21:02:31

手機(jī)衛(wèi)星5G

2021-03-09 05:49:32

通信女性從業(yè)者通信行業(yè)

2019-11-18 11:46:34

云計(jì)算IT數(shù)據(jù)

2013-01-18 11:28:27

應(yīng)用推廣

2012-05-31 09:24:55

云計(jì)算云存儲(chǔ)

2021-02-25 23:36:13

無人機(jī)通信技術(shù)

2017-05-23 22:16:16

IT數(shù)據(jù)

2018-04-16 11:34:59

2012-02-22 13:59:11

云計(jì)算數(shù)據(jù)中心

2013-07-24 09:29:35

云就緒應(yīng)用DevOps工具分布式網(wǎng)絡(luò)

2012-02-29 09:50:52

云計(jì)算虛擬化

2016-09-22 16:47:55

iOSAndroidWindows Pho

2020-11-12 08:24:06

云計(jì)算公共云

2010-05-11 09:40:42

云計(jì)算收入

2015-09-07 14:31:33

云計(jì)算SDNNFV

2020-08-05 07:00:00

SSD硬盤存儲(chǔ)

2022-09-27 09:43:08

物聯(lián)網(wǎng)設(shè)備物聯(lián)網(wǎng)

2024-10-15 09:48:56

2020-08-13 12:49:49

微軟開發(fā)Windows

2022-04-25 12:39:57

云原生云計(jì)算
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)