專訪微軟亞太研發(fā)集團CTO孫博凱:數(shù)據(jù)預見未來
原創(chuàng)作者:馬沛
對于大數(shù)據(jù)的特點,業(yè)界通常會這樣來概括:第一,數(shù)據(jù)必須是海量的。第二,數(shù)據(jù)類型多為非結(jié)構(gòu)化數(shù)據(jù),即除了文本之外的音頻、視頻、圖片、地理位置信息等多類型的數(shù)據(jù)處理能力。第三,數(shù)據(jù)在短時間內(nèi)要求快速處理,產(chǎn)生快速交互。
【51CTO專訪報道】對于大數(shù)據(jù)的特點,業(yè)界通常會這樣來概括:第一,數(shù)據(jù)必須是海量的。第二,數(shù)據(jù)類型多為非結(jié)構(gòu)化數(shù)據(jù),即除了文本之外的音頻、視頻、圖片、地理位置信息等多類型的數(shù)據(jù)處理能力。第三,數(shù)據(jù)在短時間內(nèi)要求快速處理,產(chǎn)生快速交互。
今年《紐約時報》曾撰文稱在商業(yè)、經(jīng)濟和其他領(lǐng)域中,決策行為將日益基于數(shù)據(jù)分析做出,而不是像過去更多憑借經(jīng)驗和直覺,“大數(shù)據(jù)”正在影響越來越多的領(lǐng)域。一個最新的例子就是Facebook在5月18日的IPO,5月18日之前,幾乎沒有人敢說自己有把握預測Facebook上市當天股價的走勢,但是Twitter卻神奇般的做到了。
社交媒體監(jiān)測平臺DataSift監(jiān)測了Facebook IPO當天Twitter上的情感傾向與Facebook股價波動的關(guān)聯(lián)。例如,在Facebook開盤前Twitter上的情感逐漸轉(zhuǎn)向負面,25分鐘之后,Facebook的股價便開始下跌。而當Twitter上的情感轉(zhuǎn)向正面時,F(xiàn)acebook股價在8分鐘之后也開始了回彈。最終,當股市接近收盤時,Twitter上的情感轉(zhuǎn)向負面,10分鐘后Facebook的股價又開始下跌。最終的結(jié)論是:Twitter上每一次情感傾向的轉(zhuǎn)向都會影響Facebook股價的波動,延遲情況只有幾分鐘到20多分鐘。
微軟亞太研發(fā)集團首席技術(shù)官孫博凱
這僅僅只是基于社交網(wǎng)絡產(chǎn)生的大數(shù)據(jù)進行“預見未來”的眾多案例之一,事實上“大數(shù)據(jù)”所能帶來的巨大商業(yè)價值已經(jīng)被人認為將引領(lǐng)一場足以匹敵20世紀計算機革命的巨大變革。在今年第二屆大數(shù)據(jù)世界論壇上,微軟亞太研發(fā)集團首席技術(shù)官孫博凱也展示了大數(shù)據(jù)應用的成功案例。
在成功案例中,孫博凱談到了微軟全面推出的大數(shù)據(jù)解決方案,包括基于Hadoop的Windows Server 2012和SQL Server 2012,Windows Azure基于大數(shù)據(jù)服務的應用商店等,因為Windows平臺市場占有率的優(yōu)勢,它與Hadoop的結(jié)合也引起了用戶廣泛的關(guān)注。“微軟已經(jīng)提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社區(qū)技術(shù)預覽版本的連接器”,孫博凱談到:“連接器可以在Hadoop和微軟數(shù)據(jù)庫服務器之間向前或者向后遷移數(shù)據(jù),讓用戶在Hadoop中分析非結(jié)構(gòu)化數(shù)據(jù),然后傳回到SQL Server環(huán)境中進行分析。“
Hive ODBC驅(qū)動程序可以將Hive和BI工具直接連接,例如PowerPivot和Power View可以通過Hive附加程序使Excel與Hadoop進行數(shù)據(jù)交互。
基于Hadoop的Windows Azure服務可以讓開發(fā)人員和用戶直接在Azure云上提交及運行Hadoop。“微軟希望提供簡單的下載、安裝及配置Hadoop相關(guān)技術(shù)的用戶體驗,包括HDFS、Hive以及Pig,幫助企業(yè)更平滑的使用Hadoop“,孫博凱談到:”對于開發(fā)人員,微軟也在Visual Studio開發(fā)平臺上提供JavaScript,實現(xiàn)使用JavaScript編寫高性能的MapReduce。“
孫博凱還特別興奮的提到了Windows Azure Marketplace中的數(shù)據(jù)市場,它可以令應用程序的開發(fā)變得更加簡單。“通過數(shù)據(jù)市場用戶可以搜索,瀏覽,試用和購買開發(fā)應用程序所需要的全部數(shù)據(jù)。并且通過統(tǒng)一的借口,標準的格式提供數(shù)據(jù)應用。數(shù)據(jù)市場提供OData格式的數(shù)據(jù),支持很多應用程序的訪問,包括PowerPivot for Excel。“
對于任何企業(yè)來說,數(shù)據(jù)都是商業(yè)皇冠上最耀眼奪目的那顆寶石。伴隨著傳統(tǒng)的商業(yè)智能系統(tǒng)向縱深應用的拓展,商業(yè)決策越來越依賴于數(shù)據(jù)。企業(yè)用以分析的數(shù)據(jù)越全面,分析的結(jié)果就越接近于真實。大數(shù)據(jù)帶來了這樣的洞察力,在身邊的系統(tǒng)平臺上更輕松應用大數(shù)據(jù),也將更加具有生命力。
責任編輯:馬沛
來源:
51CTO.com