2013數(shù)據(jù)庫(kù)技術(shù)大會(huì):大數(shù)據(jù)正當(dāng)時(shí)
NoSQL的春天
時(shí)光回溯2010年數(shù)據(jù)庫(kù)技術(shù)大會(huì),在這屆大會(huì)上51CTO編輯彭凡對(duì)Oracle知名專(zhuān)家蓋國(guó)強(qiáng)老師進(jìn)行專(zhuān)訪時(shí)談到了NoSQL。當(dāng)時(shí)大家還覺(jué)得NoSQL正在興起,還屬于Web和數(shù)據(jù)庫(kù)的前端技術(shù)。3年時(shí)間過(guò)去了,當(dāng)年還在襁褓中的NoSQL數(shù)據(jù)庫(kù)已經(jīng)遍地開(kāi)花,在本次數(shù)據(jù)庫(kù)技術(shù)大會(huì)上關(guān)于NoSQL方面的分享占據(jù)了較大的篇幅。
會(huì)場(chǎng)座無(wú)虛席
當(dāng)NoSQL在非結(jié)構(gòu)化數(shù)據(jù)方面的特殊能力被捆綁在大數(shù)據(jù)戰(zhàn)車(chē)上之后。大家一談到大數(shù)據(jù)必然會(huì)將NoSQL帶入到討論中。HBase、Cassandra等等都成為大數(shù)據(jù)的得力工具。經(jīng)過(guò)這幾年的飛速發(fā)展,NoSQL已經(jīng)逐漸落地成為數(shù)據(jù)庫(kù)市場(chǎng)的強(qiáng)勁力量。即使Oracle等傳統(tǒng)數(shù)據(jù)庫(kù)廠商,也會(huì)在MySQL 5.6等新版本數(shù)據(jù)庫(kù)中增強(qiáng)對(duì)NoSQL的支持。
大數(shù)據(jù)模型與處理能力
從一開(kāi)始,大數(shù)據(jù)就需要優(yōu)秀的模型來(lái)實(shí)現(xiàn)復(fù)雜的分析和預(yù)測(cè)模型,產(chǎn)生針對(duì)目標(biāo)業(yè)務(wù)的輸出。傳統(tǒng)的數(shù)據(jù)庫(kù)對(duì)于數(shù)據(jù)挖掘和分析做的還是不夠好,對(duì)于大數(shù)據(jù)的處理能力低下。
人人網(wǎng)陳繼東
來(lái)自人人網(wǎng)的陳繼東講師表示,未來(lái)大數(shù)據(jù)作更深入的分析,數(shù)據(jù)清洗ETL的開(kāi)銷(xiāo)會(huì)很大。需要并行數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的能力,大數(shù)據(jù)不再是模型的競(jìng)爭(zhēng),而是計(jì)算能力的競(jìng)爭(zhēng)。能不能在更短時(shí)間內(nèi)清洗和處理完呈幾何爆炸式增長(zhǎng)的數(shù)據(jù),是各位DBA或者CTO首先考慮的問(wèn)題。
傳統(tǒng)數(shù)據(jù)庫(kù)的發(fā)展和升級(jí)之路
當(dāng)Oracle 11g已經(jīng)推出若干年之后,還有不少用戶的數(shù)據(jù)運(yùn)行在Oracle 10g之上。來(lái)自上海新炬網(wǎng)絡(luò)技術(shù)有限公司的技術(shù)總監(jiān)楊志洪就為大家分享了如何從Oracle 10g R2遷移到11g的案例。在Oracle 12c都呼之欲出的今天,用戶處于數(shù)據(jù)安全和穩(wěn)定性的考慮,并不急于升級(jí)。只有出現(xiàn)如下情況時(shí),升級(jí)才顯得那么的逼不得已。
1.Oracle已經(jīng)通知用戶,對(duì)于Oracle 10g將在2013年7月停止新補(bǔ)丁的發(fā)行,并從此不再保證7X24的第一級(jí)支持。
2.運(yùn)維系統(tǒng)遇到多處全球首次發(fā)現(xiàn)的Bug,DBA處理難度提升。
3.核心數(shù)據(jù)庫(kù)已經(jīng)安裝幾十兆甚至上百兆的Patch,系統(tǒng)繼續(xù)維持的成本上升。
下面是楊志洪老師分享的第一個(gè)案例場(chǎng)景,用戶已經(jīng)將操作系統(tǒng)和硬件都進(jìn)行了變更。
第二種場(chǎng)景是保留操作系統(tǒng),升級(jí)和更改硬件的模式。
在升級(jí)到11g之后,我們還需要在從SQL優(yōu)化集創(chuàng)建SQL計(jì)劃基準(zhǔn),在生產(chǎn)庫(kù)中記錄完整的生產(chǎn)庫(kù)的負(fù)載,包括實(shí)際負(fù)載,時(shí)間和并發(fā)情況。在測(cè)試環(huán)境中完全按照生產(chǎn)庫(kù)的負(fù)載情況進(jìn)行充放,嚴(yán)格的事務(wù)提交順序等等。
總結(jié)
大數(shù)據(jù)在目前是一個(gè)炙手可熱的名詞,它已經(jīng)在社交媒體,網(wǎng)絡(luò)游戲,電子商務(wù)等領(lǐng)域落地。電子商務(wù)網(wǎng)站用大數(shù)據(jù)分析用戶的購(gòu)買(mǎi)行為,為他們推薦合適的促銷(xiāo)產(chǎn)品。網(wǎng)絡(luò)游戲廠商通過(guò)大數(shù)據(jù)處理用戶留存率,道具購(gòu)買(mǎi)率等數(shù)據(jù),從而確保公司的整體盈利效果。社交媒體則走的更遠(yuǎn),已經(jīng)有美國(guó)政治分析家透過(guò)Facebook和推特分析美國(guó)選民的投票傾向和廣告投放策略。大數(shù)據(jù)讓本來(lái)看似雜亂無(wú)章的世界,變得有跡可循。