他將Yahoo!Hadoop從20個節(jié)點擴展為42000個節(jié)點
Eric Baldeschwieler,今年47歲,有很深的計算機技術(shù)背景。在卡內(nèi)基梅隆大學(Carnegie Mellon University)獲得應(yīng)用數(shù)學(計算機科學)學士學位后,Eric又在加州大學伯克利分校獲得計算機科學碩士學位。作為Inktomi公司W(wǎng)eb服務(wù)引擎的技術(shù)領(lǐng)導(dǎo)者(Inktomi是第二個比較早出現(xiàn)的搜索引擎,Amazon.com,eBay,HotBot,MSN,Overture,WalMart.com,LookSmart,Excite,HotBot都是他的客戶,而通過這些頂級的門戶網(wǎng)站和目標站點,Inktomi向全世界半數(shù)以上的互聯(lián)網(wǎng)用戶提供最新、最相關(guān)的搜索結(jié)果),由于Inktomi在2003年被雅虎收購,Eric也隨之轉(zhuǎn)戰(zhàn)雅虎,并最終通過2年的努力,于2005年成為雅虎的Web搜索總設(shè)計師。更富傳奇的是,Eric在2006年毅然投入雅虎Apache Hadoop項目的懷抱,將其從20個節(jié)點的原型系統(tǒng)發(fā)展為42000個節(jié)點的服務(wù)。而后,當雅虎決定全力支持Apache Hadoop項目,并于2011年7月成立新公司Hortonworks時,Eric當之無愧地成為首任CTO。作為資深技術(shù)人士,但當CTO的Eric感覺自己面臨了諸多挑戰(zhàn)。但他對Hadoop的前景非常樂觀,“大家多貢獻一點,Hadoop將會創(chuàng)造奇跡。”Eric將來到HBTC 2012,并發(fā)表關(guān)于Hadoop技術(shù)經(jīng)驗分享的主題演講。
從玩游戲到做Hadoop
Eric Baldeschwieler騎著“大象”意味深長
問:你從什么時候開始對技術(shù)感興趣?又是怎走上Hadoop之路的?
Eric Baldeschwieler:時間總是有著自己的軌跡。對我而言,后期的工作經(jīng)歷都是對初中學習的補充。那時,在學校中,我們都會通過早期的微型計算機來打游戲。而后,在我父親的加州理工學院實驗室,我學會了一些自動化實驗。這很非常有趣,也促成了我離開學校后對第一份工作的選擇。那是,我曾經(jīng)在父親的一個合作伙伴(關(guān)于博士后項目)Steve Crane的手下工作。他是Cubico的聯(lián)合創(chuàng)始人,后期加入了Digital F/X的企業(yè)。從他身上,我學會了電子藝術(shù)。我們一起在加州理工實驗室的實驗室系統(tǒng)中做三維渲染,并通過三維圖形處理來實現(xiàn)后期數(shù)字視頻制作。
所以,在大學中玩游戲,暑期在父親的實驗室工作的歷程使我在大學選擇專業(yè)的時候很自然地就填寫了計算機。幸運的是,在研究生院,我有機會與Eric Brewer(Inktomi聯(lián)合創(chuàng)始人)一起工作。加入Inktomi是我做的非常關(guān)鍵的一個決定。在那里,我得到了來自硅谷的那么多令人興奮的資源。直到2003年Inktomi被雅虎收購。我轉(zhuǎn)戰(zhàn)雅虎,慢慢坐到了Web搜索總設(shè)計師的職位(2005年)。而從那時起,我就已經(jīng)開始關(guān)注大數(shù)據(jù)問題,并在2006年正式參與了Apache Hadoop項目組。
我一直想要做的事情,就是在大數(shù)據(jù)領(lǐng)域如何理解計算機工作的原理。比如80年代,在PC并不快的時候,你需要透徹了解其原理才能更好地播放視頻和做游戲。在搜索領(lǐng)域也是如此,要回答盡可能多的問題,使用盡可能多的數(shù)據(jù),實現(xiàn)盡可能高的速度, 了解IT系統(tǒng)的體系架構(gòu)和運行是必須的。
問:你最敬佩的領(lǐng)導(dǎo)是誰?
Eric Baldeschwieler:我有幸與諸多偉大的技術(shù)人物共事。Steve Crane是我的第一個老板,也是很好的朋友和導(dǎo)師,我們一起做了很多事情,從他那里,我學到非常重要的一課,那就是無論做什么,如在不同工作中切換,都需要有不同技術(shù)的積累。而在Inktomi另外一個創(chuàng)始人Paul Gauthier的身上,我學到了實用主義。作為一個博學的人,真正的技術(shù)頂級專家,他告訴我:計算機越來越強大,最好的解決方案往往是最簡單和最直接的一個。有時你可以帶上一個“錘子”來解決你的問題(不用害怕用最簡單的方案來解決它)。
還有一個是雅虎CTO Raymie Stata,從他那里,我學到的是一種精神——樂觀。這很重要,這也是Hortonworks的價值所在。我們對于Hortonworks的前景已經(jīng)“無以倫比”的樂觀了,在他那里,我們還獲得了很多的支持和信任。此外,我還最欣賞他的這種想法:開源不是零和游戲,只要你積極參與社區(qū)作出貢獻就能有很大的回報。這其中,有太多的競爭與合作,你需要尋找到合作伙伴(即使他的目標只是在某些方面與你一致),但你們之間的合作將創(chuàng)造出很多價值。
開源社區(qū)的伙伴都是務(wù)實而富有激情的,我很幸運地擁有一群志同道合的,面對艱難問題卻能發(fā)明有趣的解決方案的朋友們。
問:作為CTO,面臨的最大挑戰(zhàn)是什么?
Eric Baldeschwieler:我想,最大的挑戰(zhàn)是如何在短期和長期目標之間實現(xiàn)務(wù)實的平衡。短期是尋找客戶,創(chuàng)造收入,有生意機會,長期是在此之外的目標,比如研發(fā)更好的方案,獲得更多技術(shù)提升,使企業(yè)活的更加長久等。Hortonworks有大量技術(shù)項目,但是面臨的挑戰(zhàn)還很多。而在參與Hadoop之前,我在Inktomi和雅虎的工作中,更多是試圖尋找如何通過構(gòu)建基礎(chǔ)社區(qū)來抓取頁面并建立搜索項目,不過也存在這樣的問題,就是如同通過管理一個龐大的隊伍和項目,平衡短期目標與長期規(guī)劃之間的關(guān)系。
另一方面,對我個人而言,在技術(shù)以外,還有一個很有趣的挑戰(zhàn)就是如何做生意。特別是在技術(shù)已經(jīng)可以引發(fā)商業(yè)變革的如今,現(xiàn)在技術(shù)變化更快,企業(yè)預(yù)算更加有限,所有公司都在尋找新的機會,這給技術(shù)尤其是開源市場帶來了更多的刺激性的機會,但也有不確定性,比如金融。
所以,你可以有雄心,但必須務(wù)實。
問:HBTC 2012哪些最吸引您?
Eric Baldeschwieler:作為Hortonworks的CTO,我的工作不是線性的。大部分時間是在線管理技術(shù)團隊,和聰明的同事們一起設(shè)計下一代技術(shù)框架。哈哈,在我看來,作為CTO,如果沒有直接領(lǐng)導(dǎo)的團隊,那么可能你一點私人空間都沒有了。另外,我很喜歡參加國外技術(shù)研討會,比如近期我將參加在中國北京舉行的HBTC 2012,在這樣的技術(shù)會議上,不僅可以分享很多技術(shù)觀點,還可以學到更多。想想看,當不同國家的技術(shù)人員都在糾結(jié)一樣的問題時,我們的探討可能會產(chǎn)生真正的聰明的答案,這多令人激動啊。
問:Hortonworks CTO的工作重點是什么?
Eric Baldeschwieler:我需要直接管理的人很少,盡管之前的工作中,我可能需要管理的人有60-100人,但現(xiàn)在反而沒有這么多。重點是三方面,畫圖,定目標及解決問題。我會畫一個表,將實現(xiàn)目標、溝通機制以及技術(shù)方案做規(guī)劃,并在隨后的執(zhí)行中保持一致,當特殊情況出現(xiàn)時,作出必要的調(diào)整。對于定位,我更多是一個技術(shù)領(lǐng)導(dǎo)者而不是過程領(lǐng)導(dǎo)者,這也是我能夠很自然地過渡到CTO崗位的原因。
Hortonworks和雅虎關(guān)系密切

“我是一個技術(shù)領(lǐng)導(dǎo)者”
問:Hortonworks和雅虎是什么關(guān)系?
Eric Baldeschwieler:大約五、六年以前Apache Hadoop只是一個包含20個節(jié)點的原型系統(tǒng)。從那時起雅虎開始致力于Apache Hadoop項目,組建了團隊并在過去的時間里一直專注于Apache Hadoop項目的推動工作。雅虎構(gòu)建了所有的發(fā)行版本,已經(jīng)成為了Hadoop所有發(fā)行版本的主要的貢獻者。作為一個團隊,我們已經(jīng)習慣于支持一個更為廣泛的社區(qū)。當然,不同之處在于現(xiàn)在我們明確地將雅虎作為一個客戶并為其提供支持。而Hortonworks是一家獨立的公司,而雅虎是Hortonworks的投資人,顧客以及開發(fā)合作伙伴。在雅虎仍將有大量人員繼續(xù)為Hadoop做出貢獻并在Hadoop之上構(gòu)建應(yīng)用。目前在雅虎有超過1000人的Hadoop活躍用戶。
問:你們在為雅虎做什么服務(wù)?
Eric Baldeschwieler:目前我們?yōu)檠呕⑻峁?級支持,包括開發(fā)者培訓,一般的問題甚至是解決Hadoop新開發(fā)者遇到的bug。同時我們將提供升級支持,而且如果他們發(fā)現(xiàn)了不能解決的有趣問題,我們將提供幫助。
問:除此以外,定位在哪些方面?
Eric Baldeschwieler:Hadoop形勢大好。新聞媒體對Hadoop很感興趣,數(shù)以千計的公司或部門已經(jīng)廣泛采用了Hadoop。Hortonworks是一家獨立的公司,我們將繼續(xù)推動Hadoop技術(shù)繼續(xù)前進并圍繞Hadoop實現(xiàn)新特性、新技術(shù)角色。而從商業(yè)模式來看,現(xiàn)在,Hadoop已經(jīng)提交給Apache基金會而且是開源的,我們認為應(yīng)該有一個能夠從Apache下載的完整版本。我們短期的業(yè)務(wù)模式是培訓與支持,并作為雅虎的戰(zhàn)略伙伴。雅虎具有濃厚的興趣看到Hadoop以某種方式持續(xù)演變,他們愿意支付費用讓我們進行設(shè)計與開發(fā)。短期內(nèi)我們僅關(guān)注企業(yè)更加容易安裝并使用Hadoop,第三方更加容易構(gòu)建業(yè)務(wù)(包括軟件業(yè)務(wù),OEM業(yè)務(wù)以及圍繞Hadoop的集成業(yè)務(wù)),增加Hadoop的市場份額。憑借豐富的技術(shù)經(jīng)驗,我們能夠幫助跨越目前存在的障礙,而且在保持核心免費的同時我們所做的存在巨大的機會。
如果人人都奉獻一點,Hadoop將會創(chuàng)造奇跡
“多奉獻點,Hadoop會是個奇跡”
問:目前有一些有資金支持的Hadoop的項目,比如DataMirror, Cloudera以及MapR。有些人使用Apache,有些人并不使用Apache。你怎么看?
Eric Baldeschwieler:這很難簡單地說清楚,但是我們相信開源的偉大之處在于你的合作伙伴非常廣泛。任何使用Apache Hadoop的公司將產(chǎn)品改進提交給Apache Hadoop,我們致力于與這些人合作。我們的工作就是讓Apache Hadoop成長得更加強大。
問:Hadoop還是多種發(fā)行版并行嗎?
Eric Baldeschwieler:任何健康的生態(tài)系統(tǒng)都存在變體,我們只想確保所有人都知道他們能夠到Apache網(wǎng)站下載一個不錯的Hadoop版本。現(xiàn)在人們?nèi)栽诖嬖谀承├Щ?,目前只有真正的專家才能安裝并使用Hadoop,因此你想讓Hadoop的安裝、使用更容易。
問:Hortonworks和其他公司有什么不同?
Eric Baldeschwieler: 在我們的商業(yè)模式中,開源是最重要的。很有意思的是,雖然我們已經(jīng)為Hadoop的項目忙碌了六年,但是公司成立到現(xiàn)在也就是一年多的時間。我的角色實際上就是做開源社區(qū),看Hadoop的發(fā)展就是一個合作路線圖,所以我需要更努力地去做社交,將我們在做的事情傳播出去,將其他人做的事情的信息帶回來,并說服大家,貢獻一點,就會有奇跡發(fā)生。
聰明好奇且有深厚計算機背景的人適合Hadoop
問:現(xiàn)在公司的組織架構(gòu)如何?
Eric Baldeschwieler:我們大概有25名核心員工是提交者和架構(gòu)師,他們構(gòu)建了Hadoop,pig,Zookeeper以及其他一些關(guān)鍵的Apache Hadoop項目。我們總有80名員工具有多年構(gòu)建Hadoop的經(jīng)驗對外提供服務(wù),這是我們強大的優(yōu)勢所在。首先我們招聘設(shè)計與構(gòu)建Hadoop的員工。因為我們有專家,我們能夠發(fā)揮純開源的作用,由于我們的專業(yè)知識,與我們合作的所有人都將受益。
問:你喜歡什么樣的手下?
Eric Baldeschwieler:我喜歡聰明、好奇的人。我在面試的時候,一般都會問他們具體的事情。比如你曾經(jīng)失敗過嗎?當時犯了什么錯誤,如何客服困難,從失敗中獲得了什么經(jīng)驗教訓。在我看來,從失敗中獲得經(jīng)驗遠比成功要多。如果有人和我說,他們從來沒有犯過錯,那我很擔心。
除此以外,我看中要能與其他人合作。我很珍惜能夠合作的團隊,因為對于Hadoop而言,并沒有劇本。所有的發(fā)展都是依靠這些來不同領(lǐng)域、不同學科的工程師們的創(chuàng)造,但扎實的計算機理論基礎(chǔ)還是很必要的。有些公司經(jīng)常會做邏輯謎語之類的考題,我想主要也是為了測試求職者是否有扎實的計算機科學基礎(chǔ)。
最后,我們有一個“no-prima donna rule”,主要是淘汰那些過于自我或者說過于天才的人。因為在開源社區(qū),過于自我,難以與人相處的人顯然無法實現(xiàn)更好的合作。盡管我也認可,天才和自我是一個硬幣的兩面。但是那些過于聰明的人往往無法融入企業(yè)文化,事實上,這方面,我有著深刻的教訓。決不能妥協(xié),因為我們需要的是可以良好相處的隊友。
問:緊張的工作之外,如何放松呢?
Eric Baldeschwieler:我有三個孩子,下班后我們經(jīng)常一起玩,他們讓我更加年輕。另外,我喜歡在健身房練習攀巖。攀巖不僅能幫助我鍛煉身體,還能讓我去思考如何來走一步來實現(xiàn)到達山頂?shù)哪繕恕?/p>
問:如果不做Hortonworks的CTO,你會選擇做什么?
Eric Baldeschwieler:哈哈,坦白說,還真是沒有答案。對于Hadoop,我很興奮于它的潛力,現(xiàn)在我真是無法想象下一個工作。