51CTO專訪褚霸:阿里集團(tuán)與去IOE這條路
原創(chuàng)【51CTO 特約報(bào)道】目前越來越多的企業(yè)開始采用高性能的硬件搭建自己的服務(wù)器,而且高性能硬件也日趨成熟。CPU的核心數(shù)越來越多,內(nèi)存越來越大并且價(jià)格變得更加低廉,SSD設(shè)備的性能也遠(yuǎn)遠(yuǎn)超越以前的IO設(shè)備,萬兆網(wǎng)絡(luò)也逐步成為一種主流。但是企業(yè)在購買的時(shí)候需要如何選擇呢?只是一味購買新的硬件設(shè)備往往會(huì)對企業(yè)本身造成不良后果,甚至帶來沉重的經(jīng)濟(jì)負(fù)擔(dān)。
余鋒(花名:褚霸)
在2012年7月8日阿里技術(shù)嘉年華上記者遇到淘寶核心系統(tǒng)數(shù)據(jù)庫組-高級(jí)技術(shù)專家余鋒(花名:褚霸)。在會(huì)上,褚霸以《利用新硬件提升數(shù)據(jù)庫性能》為題分享了淘寶在利用高性能新硬件的寶貴經(jīng)驗(yàn)。
從硬件到軟件再到軟硬結(jié)合
隨著業(yè)務(wù)需求的不斷增加,企業(yè)意識(shí)到需要增加自身在軟硬件方面的投入,大家都紛紛把目光投入到新硬件采購上來。對于淘寶如此龐大的業(yè)務(wù)量而言,性能與成本之間就存在著很微妙的關(guān)系。褚霸表示:“在性能與成本上來說,整個(gè)阿里集團(tuán)擁有軟件的定制能力,硬件是根據(jù)軟件本身的特點(diǎn)進(jìn)行采購的,做一些定制化的東西。成本上來講需要控制在合理的范圍內(nèi),需要高性能,但是成本不能夠太過分。其實(shí)對于硬件來說投錢下去就可以見到效果,軟件上面投錢下去不一定能很快的看到效果。”
就在當(dāng)天的大會(huì)上我們不難看出,不論是哪個(gè)行業(yè),大家多多少少都在關(guān)注高性能硬件這方面的東西,只不過沒有淘寶下了那么大的力氣。褚霸認(rèn)為:“未來大家也都會(huì)走我們這樣的一條路,這是未來的一個(gè)趨勢。”
大家不難看出,在互聯(lián)網(wǎng)剛剛起步的那幾年企業(yè)購入大批硬件設(shè)備,比如IBM小型機(jī)、EMC的存儲(chǔ);當(dāng)企業(yè)業(yè)務(wù)發(fā)展到一定程度的時(shí)候,高額的硬件成本讓不少企業(yè)開始轉(zhuǎn)向采用軟件開發(fā)解決企業(yè)內(nèi)部業(yè)務(wù)需求,當(dāng)軟件開發(fā)達(dá)到一定程度的時(shí)候企業(yè)就開始逐步采用定制化的高性能硬件提升軟件性能。這樣就形成了一個(gè)從硬件到軟件在到軟硬結(jié)合的趨勢。
阿里集團(tuán)與去IOE的這條路
淘寶從很多年以前就開始籌備去IOE計(jì)劃,并且淘寶是目前國內(nèi)去IOE做的做徹底也是最成功的一家。去IOE是一項(xiàng)非常龐大并且負(fù)復(fù)雜的項(xiàng)目,不單單是底層數(shù)據(jù)庫的變化,硬件也要跟著變。
褚霸告訴記者:“在項(xiàng)目剛剛開始的時(shí)候,我們在前端也做了很多工作,前端需要把數(shù)據(jù)庫進(jìn)行弱化,之前對Oracel數(shù)據(jù)庫用的比較狠,在開始需要對Oracle數(shù)據(jù)庫進(jìn)行弱化處理,之后在將其替換掉然后在進(jìn)行其他的事情。”
去IOE本身就是一場革新,一場企業(yè)內(nèi)部的技術(shù)革新。這對于企業(yè)內(nèi)部的IT技術(shù)團(tuán)隊(duì)來講也是一次更新與交替的時(shí)刻。對于工程師而言,尤其是Oracle DBA就面臨這選擇:轉(zhuǎn)型為MySQL數(shù)據(jù)庫工程師還是離職繼續(xù)做Oracle DBA。這對于企業(yè)IT部門來說是一個(gè)巨大的沖擊。
面對這樣的變化集團(tuán)龐大的數(shù)據(jù)庫團(tuán)隊(duì)又是如何面對的呢?作為數(shù)據(jù)庫項(xiàng)目組的主要負(fù)責(zé)人,褚霸告訴記者:“這種沖擊對于整個(gè)團(tuán)隊(duì)并沒有造成太大的沖擊,這是一個(gè)公司整體的規(guī)劃,并且從很早的就開始籌備,從上到下已經(jīng)形成一個(gè)共識(shí),支持的力度很大。這件事是一個(gè)系統(tǒng)的工程,大家一塊塊的去做,前端做好了,后面自然而然的就要去接,中間做好了,后端的也就順其自然的開始做。”
之前網(wǎng)上的一篇博文《去IOE:去掉“IE”就Ok?》指出,硬件:去“IE”利人利己;去留Oracle 各有理由,量力而行。淘寶又是如何判斷O的去留呢?
對于淘寶來說在業(yè)務(wù)系統(tǒng)搭建之初,整個(gè)阿里集團(tuán)有98%以上的軟件系統(tǒng)和業(yè)務(wù)都采用Oracle數(shù)據(jù)庫提供數(shù)據(jù)服務(wù)。褚霸針對這個(gè)問題告訴記者,Oracle數(shù)據(jù)庫性能很穩(wěn)定,不過他需要小型機(jī)與EMC存儲(chǔ)這種高性能硬件做搭載。但是對于淘寶來講,去掉Oracle數(shù)據(jù)庫的原因還是因?yàn)閿?shù)據(jù)庫本身已經(jīng)不能滿足業(yè)務(wù)需求,這才是替換它的根本。
內(nèi)部團(tuán)隊(duì)之間的協(xié)同工作
不論企業(yè)在進(jìn)行何等策略性改變的時(shí)候,相關(guān)的準(zhǔn)備工作需要進(jìn)行認(rèn)真的考慮,尤其是在各個(gè)部門之間的協(xié)調(diào)。褚霸告訴記者:“我來淘寶就一直帶數(shù)據(jù)庫團(tuán)隊(duì),我們這個(gè)組實(shí)際上就是維護(hù)整個(gè)集團(tuán)的MySQL數(shù)據(jù)庫,提高它的性能以及在集群上的可用性。但是大家也可以在一些開源項(xiàng)目中看到核心數(shù)據(jù)庫組做出的貢獻(xiàn),比如TFS分布式文件系統(tǒng)。”
談到TFS,褚霸接著說:“TFS是我們其他組的項(xiàng)目,但是數(shù)據(jù)庫與底層系統(tǒng)是相通的嘛,過去我們花了很多時(shí)間去研究I/O、設(shè)備以及文件系統(tǒng)等等,內(nèi)核組也做了很多文件系統(tǒng)的優(yōu)化。組與組織間會(huì)相互之間影響,看起來組與組之間是扁平的,但是實(shí)際上相互之間還是有很多聯(lián)系的。”在去IOE計(jì)劃實(shí)施之初,整個(gè)集團(tuán)內(nèi)部的團(tuán)隊(duì)之間也是進(jìn)行協(xié)同工作,項(xiàng)目進(jìn)展到哪一步,哪一個(gè)組就要及時(shí)完成自己負(fù)責(zé)的那部分。
整個(gè)阿里巴巴集團(tuán)進(jìn)行去IOE運(yùn)動(dòng)是為了提高業(yè)務(wù)的可擴(kuò)展性,并且構(gòu)建符合自身業(yè)務(wù)需求的定制化服務(wù)。對于大多數(shù)企業(yè)來說,構(gòu)建符合自身業(yè)務(wù)需求的服務(wù)才是最終根本。
【編輯推薦】