自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

解讀微軟大數(shù)據(jù)

原創(chuàng)
大數(shù)據(jù) SQL Server 云計算
“微軟針對關系型數(shù)據(jù)、非關系型數(shù)據(jù)和數(shù)據(jù)流的管理,第一步是打造一個平臺,在這個平臺下,各種類型的數(shù)據(jù)都可以進來集中整合。第二步是提供一個工具,讓所有的數(shù)據(jù)可以進行清理和分析?!?/div>

 【51CTO獨家報道】“安裝在Windows server和System Center的大數(shù)據(jù)平臺叫Microsoft HDInsight Server,安裝在Windows Azure上的叫Microsoft HDInsight Service”這個定義來自MSDN的一篇博客,也許看上去有些抽象,TechEd 2012技術大會現(xiàn)場,微軟亞太研發(fā)集團首席技術官孫博凱的演講中,為大家Demo演示了HDInsight的應用場景。

 
Excel的用戶就可以ODBC讀取Hadoop資料
 
孫博凱在接受51CTO記者專訪時特別談到:“微軟針對關系型數(shù)據(jù)、非關系型數(shù)據(jù)和數(shù)據(jù)流的管理,第一步是打造一個平臺,在這個平臺下,各種類型的數(shù)據(jù)都可以進來集中整合。第二步是提供一個工具,讓所有的數(shù)據(jù)可以進行清理和分析。我們相信所有的洞察力都來自數(shù)據(jù)與數(shù)據(jù)之間的關聯(lián)度。”在大數(shù)據(jù)領域目前常用的案例,關于美國油價波動對汽車銷售的影響,也正是利用了這兩個數(shù)據(jù)的關聯(lián)產生的市場洞察。
 
技術之外,微軟的重要優(yōu)勢便是幫助消費者通過他們最熟悉的工具來開展應用。在Demo中可以看到,不論是Hadoop on Windows Server或Hadoop on Windows Azure都可以讓用戶通過Excel讀取Hadoop平臺的數(shù)據(jù)。并在Excel環(huán)境下,整合分析結構化數(shù)據(jù)與非結構化數(shù)據(jù)。孫博凱表示,目前相關的應用可以支持Excel、PowerPivot for Excel以及Power View等工具。 
 
在一些資料中了解到,用戶完成安裝Hive ODBC驅動程序,就可以通過Excel看到新增功能Hive Query,通過輸入要分析的Hadoop平臺數(shù)據(jù)源路徑,就可以在Excel環(huán)境中,以ODBC模式,讀取Hadoop平臺的數(shù)據(jù),分析結果以數(shù)據(jù)表Table或Cube形式,儲存在Excel或SQL Server中。微軟曾多次提出對Hadoop平臺的兼容與重視,這一演示也在TechEd 2012上也成為焦點,因為微軟再一次將大數(shù)據(jù)的應用直接推送到了用戶的面前。

與Apache Hadoop的深入合作
 
微軟的搜索技術Bing原本就有MapReduce分布式計算的概念。不過,微軟也選擇了支持越來越多的企業(yè)開始使用的Apache Hadoop,并作為非結構化數(shù)據(jù)處理架構的核心。讓企業(yè)可以在Windows環(huán)境中處理Hadoop平臺的非結構化數(shù)據(jù)。
 
“目前我們主要以Windows Server以及Windows Azure兩大平臺作為基礎,同時和Hortonworks Platform有很好的合作”,孫博凱特別向記者提到:“Hadoop、HDInsight這樣的技術,要采用更加開放的方式與合作伙伴共同推進?,F(xiàn)在包括PHP、MySQL、Wordpress都可以在Windows Azure上運行,越來越多的開源技術也將出現(xiàn)在微軟的平臺上”。在現(xiàn)場的技術演示中,微軟還特別針對Windows Azure上的Mobile Services和Media Services,演示了Streaming to iOS的過程。

In-Memory與一體機共同布局大數(shù)據(jù)
 
內存計算和一體機是大數(shù)據(jù)的熱點,今年11月SQL Server用戶組主辦的PASS年度峰會上,微軟副總裁Ted Kummert提出了In-memory Computing是微軟數(shù)據(jù)平臺交付戰(zhàn)略的核心元素之一,能夠讓用戶分析各種類型的數(shù)據(jù),同時加速數(shù)據(jù)訪問時間。能夠將數(shù)據(jù)直接寫入RAM進行操作,從而消除性能瓶頸。
 
在Ted Kummert的博客中了解到,微軟從2010年開始,就已經(jīng)在SQL Server中提供In-Memory技術,這個項目的代碼為“Hekaton”,將作為SQL server的重要升級模塊來提供,不過目前只是作為預覽版在一小部分用戶中使用。“Hekaton”將會完善微軟的In-Memomory數(shù)據(jù)組合,同時跨越數(shù)據(jù)分析與業(yè)務交易場景。將會有突破性的性能提高,而且是內置在SQL Server中的,因此企業(yè)不需要額外購買專用的硬件或軟件,并且能夠輕松的移植現(xiàn)有應用,就能夠讓這些應用獲得性能的突破性提升。
 
“歐洲某一在線博彩網(wǎng)站,當一場球賽上演的時候,可以有上億球迷在線觀看,需要在網(wǎng)上進行高復雜性一系列實時操作,他們都想進入這個交易平臺。這對于網(wǎng)站的提供者來說是一個很大的技術挑戰(zhàn)”,孫博凱用一個客戶的實例展現(xiàn)了內存計算技術的突破性提升,他談到:“我們通過內存計算技術,使整個在線交易效率提高了15~20倍。Hekaton是一個拉丁語的名字,是百倍的意思。我們設計這個技術最開始的時候,就希望達到百倍的效率,雖然現(xiàn)在還沒有達到,不過我們會不斷提升In-Memory的技術,希望有更好的突破。”
 
Ted Kummert在PASS年度峰會上也提到了微軟并行數(shù)據(jù)倉庫一體機PDW。是針對企業(yè)數(shù)據(jù)倉庫、高度可擴展而設計的軟硬一體機設備,采用“大規(guī)模并行處理”(MPP)體系結構。在數(shù)據(jù)處理方面基于SQL Server 2012的并行數(shù)據(jù)倉庫提供了全新的PolyBase數(shù)據(jù)處理技術,xVelocity 列存儲技術,滿足實時數(shù)據(jù)倉庫的需求,高密度 Direct Attached Storage,存儲容量提升7倍,橫向擴展可以實現(xiàn)從幾個TB到6PB的線性擴展。
 
關于數(shù)據(jù)的技術從未像現(xiàn)在這樣令人著迷,是大數(shù)據(jù)貫穿了應用、數(shù)據(jù)中心和云,最終化為一種能力。這種能力為是生活,工作與思維帶來變革,我們解讀大數(shù)據(jù),也在解讀世界。
 
編輯推薦:
責任編輯:馬沛 來源: 51CTO.com
相關推薦

2013-08-08 10:07:43

大數(shù)據(jù)存儲結構化數(shù)據(jù)

2013-10-24 09:49:41

微軟大數(shù)據(jù)

2015-08-04 09:22:37

2017-09-02 10:03:10

大數(shù)據(jù)分析大數(shù)據(jù)數(shù)據(jù)

2015-09-11 15:18:32

大數(shù)據(jù)留學

2013-08-14 09:48:02

微軟REEF

2013-10-18 15:27:30

微軟大數(shù)據(jù)微軟

2015-02-03 03:18:56

SparkSpark內核

2018-10-24 14:32:15

數(shù)據(jù)分析數(shù)據(jù)科學算法

2013-06-09 14:42:34

AdTime大數(shù)據(jù)數(shù)字營銷

2011-10-26 09:28:28

紅帽大數(shù)據(jù)Gluster

2016-10-08 22:02:01

大數(shù)據(jù)時代大數(shù)據(jù)

2016-10-09 13:19:54

大數(shù)據(jù)聯(lián)邦大數(shù)據(jù)研發(fā)戰(zhàn)略計劃

2012-04-01 14:57:46

2012-07-03 09:59:47

微軟Cloud Numer大數(shù)據(jù)

2013-11-12 14:15:45

2015-03-05 13:30:17

2013-11-08 10:19:10

2024-03-25 08:15:02

數(shù)據(jù)分析AI 一體化大數(shù)據(jù)

2012-10-23 09:48:37

點贊
收藏

51CTO技術棧公眾號