甲骨文喻思成:Oracle大數(shù)據(jù)方案橫跨各層IT架構(gòu)
2009年,H1N1流感肆虐全球,由于缺少有效的疫苗,監(jiān)測(cè)流感的傳播路徑并預(yù)測(cè)未來(lái)的感染地域成為對(duì)抗這場(chǎng)致命流行病的關(guān)鍵。在傳統(tǒng)的運(yùn)營(yíng)模式下,公共衛(wèi)生部門(mén)需要一兩周的時(shí)間才能獲得新病例的相關(guān)數(shù)據(jù),而就在這種分秒必爭(zhēng)的時(shí)刻,谷歌通過(guò)對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析和建模,幫助公共衛(wèi)生機(jī)構(gòu)獲得了更有效、及時(shí)的疾病傳播指標(biāo)。
值得人們注意的是,在這場(chǎng)對(duì)抗流行病的戰(zhàn)役中,所采用的手段已完全繞開(kāi)醫(yī)療檢測(cè)和醫(yī)師診斷——它建立于大數(shù)據(jù)分析的基礎(chǔ)之上。作為近年來(lái)炙手可熱的技術(shù)概念之一,大數(shù)據(jù)通過(guò)前所未有的方式,對(duì)海量數(shù)據(jù)進(jìn)行分析,并獲得深刻的洞見(jiàn)。利用大數(shù)據(jù),全球頂尖的智能信息提供商湯森路透可以經(jīng)濟(jì)高效地采集客戶(hù)活動(dòng)信息,追蹤銷(xiāo)售機(jī)會(huì);豐田汽車(chē)能夠?qū)崿F(xiàn)多渠道與客戶(hù)互動(dòng),提升消費(fèi)體驗(yàn);Regions 銀行降低了IT成本;日本軟銀集團(tuán)可以探索客戶(hù)的隱藏想法,解釋和預(yù)測(cè)客戶(hù)行為;美國(guó)國(guó)家癌癥研究所得以確定基因與癌癥之間的交互關(guān)系,深入了解疾病根源……如此種種,大數(shù)據(jù)正將人們的生活飛速帶入未來(lái)世界。
根據(jù)IDC發(fā)布的研究報(bào)告,2020年,全球新建和復(fù)制的信息量已經(jīng)超過(guò) 40ZB,是2012年的12倍;而中國(guó)的數(shù)據(jù)量則會(huì)在2020年超過(guò)8ZB,比2012年增長(zhǎng)22倍??焖倥蛎浀臄?shù)據(jù)量促進(jìn)了大數(shù)據(jù)技術(shù)和服務(wù)市場(chǎng)的繁榮發(fā)展。研究機(jī)構(gòu)Wikibon也指出,大數(shù)據(jù)技術(shù)和服務(wù)市場(chǎng)規(guī)模將會(huì)從2012年的51億美元增加到2017年的534億美元,未來(lái)5年的復(fù)合增長(zhǎng)率更是高達(dá)58%。大數(shù)據(jù)的飛速發(fā)展與深化,無(wú)疑會(huì)為商業(yè)與生活帶來(lái)方方面面的改變。
全面解析大數(shù)據(jù)生命周期
談及大數(shù)據(jù),不得不提及經(jīng)典的大數(shù)據(jù)4V,即數(shù)據(jù)體量巨大(Volume)、數(shù)據(jù)類(lèi)型繁多(Variety)、處理速度快(Velocity)與商業(yè)價(jià)值高(Value)。的確如此,能給企業(yè)帶來(lái)洞察與價(jià)值的大數(shù)據(jù)技術(shù),需要具備快速分析全部類(lèi)型的海量數(shù)據(jù)的能力。而隨著大數(shù)據(jù)應(yīng)用場(chǎng)景的不斷拓展,數(shù)據(jù)的類(lèi)型也在由結(jié)構(gòu)化拓展至半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),尤其是來(lái)自社交網(wǎng)絡(luò)的碎片信息,正受到企業(yè)極大的關(guān)注。為了得到全面、透徹、完善的市場(chǎng)洞察,大數(shù)據(jù)應(yīng)完全覆蓋傳統(tǒng)數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、流式數(shù)據(jù)和快數(shù)據(jù),共同為企業(yè)構(gòu)建全數(shù)據(jù)視圖,提供全面的信息支撐
盡管如今已有諸多大數(shù)據(jù)技術(shù)手段,諸如分布式計(jì)算、并行處理、實(shí)時(shí)計(jì)算、數(shù)據(jù)可視化、高級(jí)分析以及移動(dòng)商務(wù)智能,企業(yè)在走向大數(shù)據(jù)時(shí)仍然面臨諸多挑戰(zhàn)。如何跨越數(shù)據(jù)“孤島”,及時(shí)獲得精準(zhǔn)的數(shù)據(jù),進(jìn)而指導(dǎo)企業(yè)做出最佳決策并付諸行動(dòng),成為企業(yè)在大數(shù)據(jù)領(lǐng)域亟待解決的問(wèn)題。任何數(shù)據(jù),都需要經(jīng)過(guò)獲取、存儲(chǔ)、處理、分析和利用五大過(guò)程,才能最終和業(yè)務(wù)有效關(guān)聯(lián),成為切實(shí)指導(dǎo)決策與行動(dòng)的信息要素。圍繞這五大過(guò)程,大數(shù)據(jù)可在全生命周期中為企業(yè)提供支持。
在最初的數(shù)據(jù)獲取和發(fā)掘階段,企業(yè)需要解決的是如何通過(guò)數(shù)據(jù)搜索與可視化,更快地解答有關(guān)業(yè)務(wù)的諸多問(wèn)題;在數(shù)據(jù)分析階段,企業(yè)需要良好的平臺(tái)和性能,支撐隨時(shí)隨地的實(shí)施數(shù)據(jù)分析,監(jiān)測(cè)數(shù)據(jù)異常與趨勢(shì),進(jìn)一步得出洞見(jiàn);在最終的規(guī)劃與預(yù)測(cè)層面,企業(yè)則需結(jié)合歷史與統(tǒng)計(jì)數(shù)據(jù),搭建預(yù)測(cè)模型,最大化預(yù)測(cè)的精準(zhǔn)度,在戰(zhàn)略管理以及人財(cái)物為決策者提供建議。
多平臺(tái)共存大數(shù)據(jù)由概念轉(zhuǎn)入實(shí)踐
提到大數(shù)據(jù)的處理,很多人會(huì)首先想到Hadoop。的確,作為被廣泛采用的分布式系統(tǒng)基礎(chǔ)架構(gòu),Hadoop可以實(shí)現(xiàn)可靠、高效、可伸縮的數(shù)據(jù)處理。尤其是其開(kāi)源、初期投入低的特性,加之當(dāng)今的企業(yè)希望以更快的速度獲取更多非結(jié)構(gòu)化數(shù)據(jù),Hadoop乃至NoSQL數(shù)據(jù)庫(kù)在短時(shí)間內(nèi)都獲得了極大的發(fā)展。在此之前,即便企業(yè)渴望利用大數(shù)據(jù),獲取海量數(shù)據(jù)并進(jìn)行實(shí)時(shí)分析的高昂成本也令人望而卻步。可以說(shuō),Hadoop和NoSQL的出現(xiàn)大大改變了數(shù)據(jù)應(yīng)用的現(xiàn)狀。
然而,企業(yè)已經(jīng)意識(shí)到Hadoop并不是大數(shù)據(jù)的代名詞,主流的SQL關(guān)系型數(shù)據(jù)庫(kù)正在回歸大數(shù)據(jù)主流世界并在大數(shù)據(jù)處理和分析領(lǐng)域繼續(xù)發(fā)揮重要的作用,極大程度上完善了大數(shù)據(jù)的生態(tài)環(huán)境。由于Hadoop、NoSQL和SQL的共存與融合,大數(shù)據(jù)技術(shù)在成熟度方面將邁入全新的一步。隨著內(nèi)存、移動(dòng)以及虛擬化技術(shù)的不斷發(fā)展,大數(shù)據(jù)也正在從一個(gè)無(wú)形的概念逐漸走向落地實(shí)踐。在中國(guó),從互聯(lián)網(wǎng)企業(yè),到電信、金融、政府這樣的傳統(tǒng)行業(yè),都已開(kāi)始采用各種大數(shù)據(jù)分析和服務(wù),幫助企業(yè)聆聽(tīng)客戶(hù)之聲、品牌傳播、市場(chǎng)優(yōu)化、風(fēng)險(xiǎn)分析、優(yōu)化決策等方面。
全方位Oracle解決方案助企業(yè)決勝大數(shù)據(jù)
甲骨文公司堅(jiān)持全面、開(kāi)放、集成的產(chǎn)品策略,可以為企業(yè)提供全方位的大數(shù)據(jù)解決方案。Oracle大數(shù)據(jù)機(jī)、Oracle Exadata數(shù)據(jù)庫(kù)云服務(wù)器、Oracle Exalytics商務(wù)智能云服務(wù)器以及Oracle Endeca Information Discovery,依托于ERP/CRM等關(guān)鍵企業(yè)管理系統(tǒng)的商務(wù)智能軟件一起組成了甲骨文最廣泛、高度集成化產(chǎn)品組合,為企業(yè)提供了一個(gè)端到端的大數(shù)據(jù)解決方案。它可滿(mǎn)足企業(yè)對(duì)大數(shù)據(jù)治理的所有需求,幫助客戶(hù)進(jìn)一步提升數(shù)據(jù)處理效率、簡(jiǎn)化管理并洞察數(shù)據(jù)的內(nèi)在本質(zhì),從而最大限度地挖掘數(shù)據(jù)的商業(yè)價(jià)值。
Oracle大數(shù)據(jù)機(jī)是一款集成設(shè)計(jì)的系統(tǒng),旨在簡(jiǎn)化大數(shù)據(jù)項(xiàng)目的實(shí)施與管理,降低企業(yè)大數(shù)據(jù)獲取與組織的復(fù)雜性。近期,Oracle大數(shù)據(jù)機(jī)新增強(qiáng)了面向Hadoop的企業(yè)級(jí)安全功能,可以幫助企業(yè)保護(hù)數(shù)據(jù)安全、迅速把握具有戰(zhàn)略意義的業(yè)務(wù)動(dòng)向。藉此,通過(guò)Oracle統(tǒng)一信息架構(gòu),客戶(hù)可以輕松經(jīng)濟(jì)地整合Hadoop和NoSQL平臺(tái)與數(shù)據(jù)倉(cāng)庫(kù)和商務(wù)分析解決方案,以最大限度地利用大數(shù)據(jù)的價(jià)值。日前新推出的Oracle大數(shù)據(jù)機(jī)X4-2與Oracle大數(shù)據(jù)連接器和Oracle Exadata數(shù)據(jù)庫(kù)云服務(wù)器組成了面向大數(shù)據(jù)的集成平臺(tái),幫助企業(yè)輕松實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)的融合。
Oracle 大數(shù)據(jù)連接器是一套內(nèi)置軟件,旨在實(shí)現(xiàn) Apache Hadoop與Oracle數(shù)據(jù)庫(kù)、Oracle數(shù)據(jù)集成器以及Oracle R 分區(qū)之間的集成。增強(qiáng)的Oracle大數(shù)據(jù)連接器,提升了數(shù)據(jù)集成功能,可以更大地支持SQL語(yǔ)言從Oracle數(shù)據(jù)庫(kù)直接訪問(wèn)Hadoop上的數(shù)據(jù),并能更透明地訪問(wèn)來(lái)自R分區(qū)的Hadoop。
Oracle Exadata數(shù)據(jù)庫(kù)云服務(wù)器提供了高效數(shù)據(jù)存儲(chǔ)和計(jì)算能力,并且配備了超大容量的內(nèi)存和快速Flash,配合特有的軟硬優(yōu)化技術(shù),從而可以對(duì)大數(shù)據(jù)進(jìn)行高效的數(shù)據(jù)加工、分析和挖掘。憑借其最快的數(shù)據(jù)倉(cāng)庫(kù)和OLTP,Oracle Exadata可使數(shù)據(jù)的加載和查詢(xún)時(shí)間加快10倍,存儲(chǔ)容量節(jié)省10倍 ,功率降低80% ,占用空間大大減少,并能通過(guò)整合降低數(shù)據(jù)中心成本。
Oracle Exalytics商務(wù)智能云服務(wù)器采用業(yè)界標(biāo)準(zhǔn)硬件、市場(chǎng)領(lǐng)先的商務(wù)智能軟件和內(nèi)存數(shù)據(jù)庫(kù)技術(shù)而開(kāi)發(fā),可以通過(guò)超高帶寬的infiniband網(wǎng)絡(luò)從Oracle Exadata上加載和讀取數(shù)據(jù)。它是全球首款專(zhuān)門(mén)為提供高性能分析、建模、發(fā)現(xiàn)和規(guī)劃而設(shè)計(jì)的集成系統(tǒng),能夠以快捷的速度、智能性和簡(jiǎn)化性幫助企業(yè)應(yīng)對(duì)各種挑戰(zhàn)。此外, Oracle Endeca Information Discover針對(duì) Oracle Exalytics進(jìn)行了優(yōu)化和認(rèn)證,可以快速、直觀地分析任意來(lái)源組合產(chǎn)生的數(shù)據(jù)。
Oracle Endeca Information Discovery 是一個(gè)企業(yè)信息探索利器,用于對(duì)多維多變的數(shù)據(jù)進(jìn)行高級(jí)、直觀的探索和關(guān)聯(lián)分析。信息從不同的源系統(tǒng)加載,存儲(chǔ)在可動(dòng)態(tài)支持變化數(shù)據(jù)的分面數(shù)據(jù)模型中。這些集成、豐富的數(shù)據(jù)可通過(guò)交互式和可配置的應(yīng)用程序進(jìn)行搜索、挖掘和分析。Oracle Endeca Information Discovery 采用迭代式“隨需建模”方法,不僅能讓 IT 從繁重的傳統(tǒng)數(shù)據(jù)建模工作中解脫出來(lái),同時(shí)還能滿(mǎn)足業(yè)務(wù)用戶(hù)廣泛的探索和分析需求,讓業(yè)務(wù)人員對(duì)大數(shù)據(jù)的興趣直接通過(guò)信息探索轉(zhuǎn)變?yōu)闃I(yè)務(wù)價(jià)值。
Oracle事件處理是Oracle SOA套件的一部分,用于構(gòu)建應(yīng)用的完整解決方案,以便實(shí)時(shí)篩選、關(guān)聯(lián)和處理各個(gè)事件,從而通過(guò)真正實(shí)時(shí)的智能來(lái)驅(qū)動(dòng)下游應(yīng)用、面向服務(wù)的架構(gòu)和事件驅(qū)動(dòng)的架構(gòu)。
Oracle實(shí)時(shí)決策是一種高度可擴(kuò)展的服務(wù)導(dǎo)向型決策管理平臺(tái),可實(shí)現(xiàn)決策優(yōu)化。它利用實(shí)時(shí)和歷史數(shù)據(jù)、業(yè)務(wù)規(guī)則、預(yù)測(cè)模型、自動(dòng)化以及自助學(xué)習(xí)技術(shù),提供隨時(shí)間推移不斷調(diào)整的實(shí)時(shí)決策。其決策服務(wù)可嵌入到企業(yè)內(nèi)部的交易應(yīng)用中,以?xún)?yōu)化重復(fù)發(fā)生的運(yùn)營(yíng)決策成效。
R語(yǔ)言:在分析大數(shù)據(jù)時(shí),企業(yè)需要訪問(wèn)所有數(shù)據(jù),使用R語(yǔ)言進(jìn)行統(tǒng)計(jì)分析,但通過(guò)便攜機(jī)進(jìn)行分析速度較慢且不安全。甲骨文提供的Oracle R Enterprise實(shí)現(xiàn)了R開(kāi)源統(tǒng)計(jì)環(huán)境與Oracle Database11g的集成, 為進(jìn)行更進(jìn)一步的數(shù)據(jù)分析提供了一個(gè)企業(yè)就緒的、深度集成的環(huán)境。
甲骨文大數(shù)據(jù)方案贏得客戶(hù)認(rèn)可
憑借全面、軟硬一體化、高性能和高性?xún)r(jià)比的突出特點(diǎn),目前,Oracle大數(shù)據(jù)解決方案已獲得眾多企業(yè)用戶(hù)的支持,前文所提及的湯森路透、豐田汽車(chē)、Regions 銀行、美國(guó)國(guó)家癌癥研究所等等,都通過(guò)部署Oracle大數(shù)據(jù)解決方案,簡(jiǎn)化了IT架構(gòu),達(dá)成了更好的業(yè)務(wù)目標(biāo)。
由美國(guó)國(guó)家癌癥研究所(NCI)資助的Frederick國(guó)家圖書(shū)館,借助Oracle大數(shù)據(jù)機(jī)及其Apache Hadoop(CDH)Cloudera分區(qū),實(shí)現(xiàn)了 2000萬(wàn)生物樣本間進(jìn)行17000個(gè)基因與五大癌癥亞型的關(guān)系對(duì)照檢索,從而贏得了2012 年政府大數(shù)據(jù)解決方案獎(jiǎng)。
全球知名的汽車(chē)工業(yè)公司豐田汽車(chē)通過(guò)采用Oracle 大數(shù)據(jù)機(jī)、Oracle大數(shù)據(jù)連接器和Oracle Endeca Information Discover等產(chǎn)品,能夠更好的利用下一代車(chē)輛遙測(cè)技術(shù)預(yù)測(cè)組件故障,并發(fā)現(xiàn)組件故障之間的相互關(guān)聯(lián)。同時(shí)它借助社交媒體、市場(chǎng)調(diào)查和與經(jīng)銷(xiāo)商的互動(dòng),進(jìn)一步提升了客戶(hù)好感度,改善了用戶(hù)體驗(yàn)。
如何正確的利用數(shù)據(jù)對(duì)于湯森路透這樣的智能信息提供商來(lái)講顯得至關(guān)重要。通過(guò)Oracle大數(shù)據(jù)解決方案,湯森路透能夠更加經(jīng)濟(jì)的采集所有客戶(hù)活動(dòng)的信息,并以5000萬(wàn)個(gè)事件/秒的攝取率,測(cè)試進(jìn)入大數(shù)據(jù)機(jī)和Oracle NoSQL數(shù)據(jù)庫(kù)的數(shù)據(jù),同時(shí)向Oracle Exadata饋送數(shù)據(jù),以方便客戶(hù)進(jìn)行盈利和分段分析。Oracle大數(shù)據(jù)解決方案的部署幫助湯森路透實(shí)現(xiàn)了最大限度地增加交叉銷(xiāo)售的機(jī)會(huì),并降低運(yùn)維成本和系統(tǒng)復(fù)雜性。
甲骨文公司副總裁及大中華區(qū)技術(shù)總經(jīng)理喻思成表示:“大數(shù)據(jù)已經(jīng)和云計(jì)算、社交化、移動(dòng)化一起,深入人們生活的方方面面,也成為現(xiàn)階段驅(qū)動(dòng)企業(yè)IT模式變革的重要因素。Oracle大數(shù)據(jù)解決方案可以橫跨IT架構(gòu)的所有層面,與其他產(chǎn)品進(jìn)行創(chuàng)新集成,能給企業(yè)提供卓越的可靠性、可擴(kuò)展性和可管理性,幫助企業(yè)在未來(lái)的競(jìng)爭(zhēng)中立于不敗之地。”