大數(shù)據(jù)時代 微軟被迫接受開源
微軟于2012年春季啟動了永久VM特性的一個社區(qū)技術(shù)預(yù)覽(Community Technology Preview, CTP)測試構(gòu)建(test-build)。微軟自己已經(jīng)為支持永久VM,特別是在上面支持Linux,作好了準(zhǔn)備。微軟將允許用戶在Azure上建立永久VM這一事件來得并不意外。雖然Azure擁有永久存儲能力,但其無法保持一個永久VM的缺陷已惹惱了許多人,而且他們不光是Linux服務(wù)器管理員。還有部分SharePoint和SQl Server管理員,他們曾為此缺陷而有意避開Azure。其實也有辦法彌補Azure無法保持永久VM的缺陷,但它們都不簡單。
在過年幾年的時間里,從SUSE Linux開始,微軟已經(jīng)在其Hyper-V 虛擬機平臺上對Linux提供了支持。今天,微軟還支持上了Red Hat Enterprise Linux (RHEL) 和CentOS。此外,還有傳言稱去年夏天,微軟打算在Hyper-V上支持Debian 和Ubuntu,但后來就不了不之了。微軟當(dāng)時沒支持Linux 是因為它太愛Linux 了;它當(dāng)時支持它,是因為它的顧客需要Linux服務(wù)器支持;現(xiàn)在,顧客更是更進一步地推動微軟去支持Linux,不過此時已經(jīng)是在云端。
而今,微軟的業(yè)務(wù)顧客正要求在云端有同樣的VM支持,而微軟則不得不提供這一支持。正如發(fā)言人Foley 報道的,“在Azure上運行Linux已經(jīng)成了一個大得驚人的業(yè)務(wù)顧客需求”。亞馬遜彈性計算云(EC2)上操作系統(tǒng)的云市場分析表明,相比1,120個Windows實例,有6,556個Linux實例在云上運行。幾乎6:1的比例。
大數(shù)據(jù)的泡沫在毫無止境的膨脹,它給IT企業(yè)帶來了顛覆性的改革。 Hortonworks的CEO Eric Baldeschwieler表示,目前企業(yè)中80%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù)。更為雷人的是這些數(shù)據(jù)在以60%的速度呈現(xiàn)指數(shù)級增長,到2020年,全球數(shù)據(jù)使用量預(yù)計將暴增44倍,達到35.2ZB(1ZB=10億TB)。大數(shù)據(jù)的急劇蔓延使得企業(yè)在存儲架構(gòu)方面逐漸面臨著史無前例的考驗,由此引發(fā)了數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商業(yè)智能、云計算等應(yīng)用的一連串連鎖反應(yīng)。
各大企業(yè)巨頭紛紛有所行動,雅虎、AOL、谷歌、Facebook等早期采用并使用Hadoop來存儲和分析PB級別的非結(jié)構(gòu)化數(shù)據(jù)。IBM也在 SmartCloud 平臺上新增基于 Apache Hadoop 的服務(wù) InfoSphere BigInsights 分析軟件。Oracle的Big Data機采用了NoSQL數(shù)據(jù)庫和Hadoop框架。EMC也推出了世界上第一個定制的、高性能的Hadoop專用數(shù)據(jù)協(xié)同處理設(shè)備——Greenplum HD數(shù)據(jù)計算設(shè)備。Google 的網(wǎng)絡(luò)搜索引擎在得益于算法發(fā)揮作用的同時,Hadoop的核心MapReduce 在后臺發(fā)揮了極大的作用。億貝的Hadoop系統(tǒng)能夠很好地處理大規(guī)模非結(jié)構(gòu)化數(shù)據(jù),高效處理用戶郵件數(shù)據(jù)。
Microsoft已經(jīng)將Hadoop作為自身大數(shù)據(jù)戰(zhàn)略的核心。Microsoft此舉的理由就是看中了Hadoop的潛力,在大數(shù)據(jù)領(lǐng)域Hadoop已經(jīng)成為分布式數(shù)據(jù)處理的標(biāo)準(zhǔn)。通過集成Hadoop技術(shù),Microsoft允許客戶訪問快速增長的Hadoop生態(tài)系統(tǒng)。同時隨著越來越多善于在Hadoop平臺進行開發(fā)的人才涌出,這對Hadoop發(fā)展極其有利。
Microsoft的目標(biāo)不僅僅是將Hadoop集成到Windows系統(tǒng)之中,Microsoft有意向Apache Hadoop社區(qū)貢獻代碼,并希望得到社區(qū)的采納。最終使任何人都可以在Windows上運行純粹開源的Hadoop。
Microsoft的Hadoop版本目前發(fā)展到“客戶技術(shù)預(yù)覽版”的階段。這意味著Microsoft在接受客戶群體的評價,預(yù)計正式版會在2012年中期推出。Microsoft的Hadoop基于Windows Server平臺或Microsoft云平臺Azure之上。在將要推出的1.0版本之中,產(chǎn)品核心包括MapReduce、HDFS、以及Hadoop組件Pig和Hive。
Microsoft的目標(biāo)是兼容所有的Hadoop組件。Hadoop生態(tài)系統(tǒng)中的Zookeeper、HBase、HCatalog和Mahout等組件也會被附加到Microsoft的Hadoop版本之中。在后端,Microsoft對Hadoop進行了其他的改善,Microsoft將整合Active Directory方便訪問控制。同時集成System Center用于管理人員管理。
Microsoft官方計劃在即將于6月舉行的TechED大會上公布有關(guān)WAAD(Windows Azure Active Directory)的更多細節(jié)。這與Microsoft在Windows Server系統(tǒng)上的Active Directory的概念如出一轍。未來使用ACS(Access Control Service)與現(xiàn)有的Active Directory部署時可保證良好的互操作性。
歷史回眸
1984年,Richard Stallman 發(fā)起GNU和Free SoftwareFoundation,至今,開源已經(jīng)有28年的歷史。從最底層的操作系統(tǒng)到高級桌面應(yīng)用,都有開源的足跡。而其中尤以開源操作系統(tǒng)Linux爭議引人注目,也受到許多的商業(yè)攻擊。很多人喜歡把開源和商業(yè)放到一起去比,以指責(zé)開源是如何的“不正規(guī)”、“耗費精力”、“不穩(wěn)定”等等,其中尤以微軟為甚。
對付開源微軟公司最擅長的莫過于專利,十幾年前只有200件專利,而現(xiàn)在的專利數(shù)就達到了每年3000件。紅帽公司的法律顧問韋布力克(Mark Webbink)認為微軟此舉的目的正是出于保護商業(yè)利益和限制競爭對手的考慮。 據(jù)悉,由于在查詢專利侵權(quán)方面成本很高(每查詢一次專利就耗費5000美元),很多Linux的客戶或開發(fā)人員在專利問題上投入的精力不多。一旦遭到侵權(quán)指控,他們將處于弱勢地位。
微軟對Linux有很多殺招,比如通過訪問與Linux相關(guān)的網(wǎng)站和新聞組,甚至直接與開源軟件的投資人電話交談,充分了解Linux的運作情況,以便最終摧毀Linux。雇傭大量的Linux開發(fā)人員,其中包括前IBM的Linux技術(shù)負責(zé)人,對大約20種開源軟件進行測試、研究,找出其弱點進行攻擊。(這就是微軟雇傭Linux開發(fā)人員的真相)
微軟還資助約13個有關(guān)Linux與其自己的產(chǎn)品進行比較的研究,發(fā)動"真相運動",攻擊Linux的成本優(yōu)勢。在Linux潛在用戶中制造不確定性,動搖其使用Linux的決心。為此資助SCO繼續(xù)與Linux的主要支持者IBM進行法律訴訟。獲得與Linux相關(guān)的專利,聲稱要起訴侵犯其專利的企業(yè)。采用靈活的價格策略,阻止用戶遷移到Linux上。針對Linux的中間銷售商,進行所謂的"深度談心",要他們同時銷售其產(chǎn)品。
【編輯推薦】