大數(shù)據(jù)時代 甲骨文助企業(yè)走向精準(zhǔn)化管理提高商業(yè)價值
甲骨文公司副總裁及大中華區(qū)技術(shù)產(chǎn)品事業(yè)部總經(jīng)理吳承楊就企業(yè)如何利用大數(shù)據(jù)來幫助企業(yè)走向精準(zhǔn)化管理談到,企業(yè)需整合結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),從而獲得全且精準(zhǔn)的數(shù)據(jù)來實現(xiàn)企業(yè)的商業(yè)價值。甲骨文企業(yè)級用戶大數(shù)據(jù)除分析預(yù)測數(shù)據(jù)外,還可保護用戶的投資。
大數(shù)據(jù)正在給商業(yè)世界和人們的生活帶來哪些改變?
舉個簡單的例子,現(xiàn)在大家都講是精準(zhǔn)化營銷,也就說所謂精準(zhǔn)化營銷,對于一個企業(yè)來講,它希望能夠找到客戶,而且給客戶提供的是它正好所需要的東西。這個來講就是非常重要的一點,因此他不僅僅是需要了解你客戶你本身,你在這個企業(yè)過去的購買歷史,同時它希望能夠了解到這個客戶他在社交媒體上,在社會上各種各樣的行為。這樣的話把兩個結(jié)合起來,他就可以給你推薦你最喜歡的產(chǎn)品。光有其中的一個方面是做不到的,需要很多方面。這樣的話就等于是說你給這個客戶做了一個360度的試圖,所以從精準(zhǔn)化營銷來講,需要大數(shù)據(jù)。
當(dāng)然大數(shù)據(jù)還用各種各樣的方面,比如說天氣預(yù)報,比如說智能交通,都是需要一些大數(shù)據(jù)。這也就是說為什么今天大數(shù)據(jù)是這么熱的一個話題。其實大數(shù)據(jù)的概念,在企業(yè)的時候就不能像一般的民眾這樣去關(guān)心大數(shù)據(jù)。民眾你可以關(guān)心大數(shù)據(jù)帶來的好處,對企業(yè)來講它到底是怎么樣可以幫助到你的企業(yè)。而且你的投入和產(chǎn)出比是怎么樣,這個是很關(guān)鍵的問題,你需要多少時間,怎么樣能夠給你的企業(yè)帶來價值。這點來講在關(guān)系型數(shù)據(jù)庫,這個問題并不是很重要。為什么呢?關(guān)系型數(shù)據(jù)庫建立起來以后,你的企業(yè)應(yīng)用自然就會運行,所以你的價值是顯而易見的。但是在大數(shù)據(jù)就不是這樣,舉個例子,你要知道首先數(shù)據(jù)量比較大,100t大還是1000t大,其實現(xiàn)在你可以看到,像甲骨文的技術(shù)在一個機柜里面就可以做到3000tb,也就是3pb,只是在一個機柜里面就可以做,你說大嗎,其實也不大。
所以重要的我覺得大數(shù)據(jù)的概念應(yīng)該對企業(yè)來講是叫全數(shù)據(jù),什么叫全數(shù)據(jù),它的量不是最根本的問題,而在于是說它是有結(jié)構(gòu)化和非結(jié)構(gòu)化組合的。你只是看結(jié)構(gòu)化數(shù)據(jù)不可以,你只是看非結(jié)構(gòu)化數(shù)據(jù)不可以,你要把這兩個組合起來,這樣對你才有價值。就像我們剛才講的一個客戶精準(zhǔn)化營銷這樣的例子,各種客戶精準(zhǔn)化營銷的這樣一個例子你可以看到的問題是,其實你需要了解很多比如說銀行,你需要了解這個客戶在銀行里過去所有的這些記錄,這些都是結(jié)構(gòu)化數(shù)據(jù),但是同時你也需要了解這個客戶在一些社會上的行為,因為你了解了這些行為以后,你才能決定,我是不是今天可以給他一個信用額度,在沒有任何擔(dān)保的情況,我可以提高一倍。這就取決于所有這些數(shù)據(jù)的分析,所以你可以看到全數(shù)據(jù)是非常非常重要的一點。
大數(shù)據(jù)是可望而不可及的嗎,如何從大數(shù)據(jù)中獲取價值?
甲骨文有一個很好的短片講的是海洋里面捕魚,其實在海洋生物里面有各種各樣的生物。你可能有金槍魚,你可以看到烏賊,還有海馬,還有貝殼,還有海藻各種各樣的一些海洋生物,當(dāng)你捕魚的時候,你捕出來以后是各種各樣的東西在這,但是不同的海洋生物它的價值是不一樣的。它的商業(yè)價值,可能金槍魚的商業(yè)價值***,我可以賣到最多的錢。我希望一網(wǎng)打下去的魚全部是金槍魚,因此我就需要把它做分門別類。把我所選擇的一些最有價值的東西把它提取出來,提取出來以后,同時你還要決定,為什么,你還要決定說你今天市場上哪一種海洋的生物,海洋的這些食品,魚類,今天的整個市場價值***的,或者未來期貨價值***。你還要根據(jù)這個市場的變化來決定我要選擇哪一種海洋生物出來,這樣的話能夠讓我得到***的價錢。
這里面就取決于我要分門別類,然后把最有價值的取出來,而且我還根據(jù)未來的比如說你貨物有一個未來的價格變化,根據(jù)未來的市場變化來確定我到底選擇哪一種搭配是***的選擇。這個就需要我們把結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)整合起來,***幫你領(lǐng)導(dǎo)做一個判斷,幫行業(yè)的或者是企業(yè)的決策人做一個判斷,這樣可以讓整個企業(yè)的價值***化。
所以你可以看到這個里面最難的一個問題是怎么樣把它融合在一起做,今天很多人說我是不是可以用比如Hadoop的技術(shù)能夠解決所有的問題,還是一樣的問題,你用Hadoop的技術(shù)去解決非結(jié)構(gòu)化的數(shù)據(jù)是可以解決的,這個沒有問題。但是問題是你用Hadoop的東西去解決結(jié)構(gòu)化的數(shù)據(jù),剛才講了不可以,但是其實另外一點,如果你一定要用這樣的解決,那你就面臨一個問題,你要取火,你取火你在家里開個煤氣一點就可以。但是如果說你用Hadoop的方法來解決呢,你可能要鉆木來取火。
所以我們覺得今天你應(yīng)該用Hadoop去解決非結(jié)構(gòu)化的東西,重要的是說解決完了以后把你所感興趣的東西通過裝載的方法,裝載到結(jié)構(gòu)化數(shù)據(jù)里面。然后在結(jié)構(gòu)化數(shù)據(jù)里面去進行分析、判斷,然后得到你想要的結(jié)果。這點來講是非常非常重要的一點,其實他的難點,根本的難點,最重要的難點,就是它的裝載,是把它融合。而并不是Hadoop本身的技術(shù),因為今天從整個技術(shù)來講,Hadoop這點來講相對比較成熟的技術(shù)。
其實另外一個問題大家會講我理解了今天大數(shù)據(jù)應(yīng)該是一個結(jié)構(gòu)化和非結(jié)構(gòu)化的融合,難點是應(yīng)該我要把它裝載上來。我碰到另外一個問題,我自己的人是不是可以來我自己的非結(jié)構(gòu)化的數(shù)據(jù)呢?這一點來講有一個挑戰(zhàn)的問題在于,今天傳統(tǒng)的解決Hadoop的架構(gòu)是用了一個技術(shù)叫MapReduce技術(shù),這個技術(shù)今天來講,相對來講在互聯(lián)網(wǎng)這個行業(yè)使用的人比較多,但是對企業(yè)級,你使用的相對比較少。這樣問題在于你是不是應(yīng)該再雇這么多的人專門去解決MapReduce,學(xué)習(xí)這種技術(shù),然后來解決問題呢?這樣來講對你整個的投入又是很大的,所以今天在世界上你可以發(fā)現(xiàn)有一種新的技術(shù),我們是通過用SQL的方法來從Hadoop的架構(gòu)里面提取數(shù)據(jù),這個很有意思的一點,我是用一種你最熟悉的方法,在一種最傳統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù)所儲存的方法里面,來提取你所感興趣的東西,你不需要再去學(xué)習(xí)MapReduce,你完全沒有這個必要,你只需要懂得SQL就可以。
大家說大數(shù)據(jù)最重要是全,的確是這樣一回事。其實你會發(fā)現(xiàn)今天我們來講,比如說你如果是要求在上百個100t這樣的要求,上百個T這樣的量級,我們要求今天都是實時的效果。也就說如果你沒有達(dá)到一個p級,1000t的結(jié)構(gòu)化數(shù)據(jù),你都應(yīng)該要求是實時,也就說你領(lǐng)導(dǎo)如果今天說我希望判斷一下如果說我今天是一個漁業(yè)公司,如果我今天加大金槍魚的產(chǎn)量,翻一倍,我會對未來整個市場,我的整個收入這個季度的收入有多大的變化。他可以馬上不需要等待就可以得到一個結(jié)構(gòu),這個很重要的一點在于你需要實時,你需要非常實時,你所有這些都需要在結(jié)構(gòu)化里面,當(dāng)然你可以需要利用上所謂的內(nèi)存技術(shù)。你會發(fā)現(xiàn)其實很多的技術(shù)是在融合的,今天大數(shù)據(jù)不是一個把其他技術(shù)完全否定掉的一個技術(shù),而是一個大數(shù)據(jù)是和其他原來傳統(tǒng)技術(shù)相輔相成能夠達(dá)到效果。這個大概就是我們對大數(shù)據(jù)的理解。
甲骨文如何幫助企業(yè)從大數(shù)據(jù)的海洋中獲取價值?
企業(yè)級用戶大數(shù)據(jù)的整個思維方式和互聯(lián)網(wǎng)的方式是不一樣的。為什么呢?因為企業(yè)級你的整個數(shù)據(jù)的價值70%、80%,甚至90%都是基于結(jié)構(gòu)化。我們曾經(jīng)和一個銀行的CIO探討過,銀行的CIO跟我們說他說為什么我要用Hadoop技術(shù)呢?我現(xiàn)在結(jié)構(gòu)化數(shù)據(jù)我已經(jīng)清洗過很多次了,我已經(jīng)做的非常好了,我用傳統(tǒng)技術(shù)都可以解決了。當(dāng)然我們還要解釋說,你還需要到社交媒體上,很多地方去找一些非結(jié)構(gòu)化的數(shù)據(jù)。但是某一個程度來講,對于企業(yè)級***的財富,80%、90%的財富都是在結(jié)構(gòu)化里面。但是今天你需要從市場上,從你的社交媒體上互聯(lián)網(wǎng)上等等這方面,非結(jié)構(gòu)化的融入進來。甲骨文就是針對這樣一種發(fā)展的趨勢,所以甲骨文你可以看到,首先我們在非結(jié)構(gòu)化方面我們用的是Hadoop的技術(shù),我們用的是Cloudera的Hadoop,是現(xiàn)在商業(yè)化的Hadoop的架構(gòu)。同時,如果你用MapReduce,我們完全支持,做完了以后,我們有一個Oracle Loader,Oracle Loader是可以把非結(jié)構(gòu)化數(shù)據(jù)以后,當(dāng)你提取出你所謂的精華,把它裝載到結(jié)構(gòu)化里面來,這個Loader我們的速度是傳統(tǒng)速度的5倍以上。
裝載很關(guān)鍵,如果你裝載慢了,即使前面再快也沒有用。你說我還是不懂MapReduce,就像我剛才講的,甲骨文發(fā)明了一個Big Data SQL,你不懂MapReduce也沒有關(guān)系,你只要按照Hadoop裝好以后,你可以用Big Data SQL去讀取這些數(shù)據(jù),直接放在結(jié)構(gòu)化里面。放在結(jié)構(gòu)化里面你就有很多的想象空間,你可以去做數(shù)據(jù)分析,做數(shù)據(jù)挖掘,同時可以進行數(shù)據(jù)預(yù)測,數(shù)據(jù)倉庫,所有的這些傳統(tǒng)的工具都可以用上,你對你過去的投資是保護的,所以實際上這種我們認(rèn)為是一種***的方案。