自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)到底會是誰的機會?

原創(chuàng)
系統(tǒng) 大數(shù)據(jù)
從2011年開始,英文IT界開始時不時的蹦出“Big Data”這一詞匯;到了2012年,大數(shù)據(jù)成為了一發(fā)不可收拾的一個行業(yè)熱門概念,仿佛出口不提大數(shù)據(jù),都不好意思說自己是搞IT的。整個網(wǎng)絡(luò)的數(shù)據(jù)積累速度之快,對于從上個世紀(jì)成長起來的人們而言實在是非常震驚。接下來的問題就是,究竟誰會對這些數(shù)據(jù)感興趣?

“大數(shù)據(jù)是機會,但只是少數(shù)人的機會,更多是巨頭們的商業(yè)障眼法,比如 IBM 、Oracle、微軟,他們提倡甚至夸大大數(shù)據(jù)的目的還是為了向你兜售他們的工具,兜售他們的解決方案,確切的說,從你身上賺錢。更有甚者,居然是向你兜售硬件,這不完全是扯淡么? 大硬件還差不多。”

—— fenng @ dbanotes

從2011年開始,英文IT界開始時不時的蹦出“Big Data”這一詞匯;到了2012年,大數(shù)據(jù)成為了一發(fā)不可收拾的一個行業(yè)熱門概念,仿佛出口不提大數(shù)據(jù),都不好意思說自己是搞IT的。

究竟“大數(shù)據(jù)”和“數(shù)據(jù)”之間有啥區(qū)別,業(yè)界公認(rèn)的定義分三方面:數(shù)據(jù)量(Volume)、處理速度(Velocity)以及數(shù)據(jù)種類(Variety)。不過說實在的,之前筆者跟IT界同行聊天時提到大數(shù)據(jù),說這種量級的數(shù)據(jù)很久以前不就有了嘛,只不過是在研究所、氣象局、金融中心、醫(yī)藥中心之類的地方,跑在昂貴的大型機和超級計算機上面,而現(xiàn)在則跑到了一批互聯(lián)網(wǎng)公司們的廉價x86服務(wù)器集群上而已。從這個角度而言,大數(shù)據(jù)帶來的變革有點類似于二十多年前的PC革命(其實更像是30多年前的小型機革命),并非前沿創(chuàng)新,而是從前沿到普及的過渡。

普及的范圍有哪些?以下是維基百科上列出的一些例子

網(wǎng)站日志,RFID,感應(yīng)器網(wǎng)絡(luò),社交網(wǎng)絡(luò)和社交數(shù)據(jù),互聯(lián)網(wǎng)上的文本和文檔,互聯(lián)網(wǎng)搜索索引,通話記錄,天文,氣象科學(xué),基因?qū)W,生物化學(xué)、生物以及其他復(fù)雜的跨領(lǐng)域?qū)W科,軍隊,醫(yī)療,影像檔案,視頻檔案,大型電子商務(wù)。

下面還給了一些具體的數(shù)字:

  • 斯隆數(shù)字化巡天項目(SDSS),起始于2000年,啟動后1周內(nèi)收集的數(shù)據(jù)量超過了天文學(xué)歷史上數(shù)據(jù)量的總和。其目前的收集速率在每晚200GB,總量超過140TB。而SDSS的后繼者一旦啟動,又能夠在5天的時間內(nèi)收集SDSS總量的這個量級。
  • 大型粒子對撞機(LHC)的四個感應(yīng)器在2010年內(nèi)制造了13PB的數(shù)據(jù)。
  • 沃爾瑪平均每小時處理一百萬個用戶交易,相應(yīng)的數(shù)據(jù)庫量級已經(jīng)超過2.5PB。
  • Facebook的數(shù)據(jù)庫里儲存了超過400億張照片。(平均4張照片1MB,總量100PB。來源

這個對比很有意思:沃爾瑪?shù)臄?shù)據(jù)比SDSS高一個量級,LHC的數(shù)據(jù)比沃爾瑪?shù)臄?shù)據(jù)量高一個量級,而Facebook的數(shù)據(jù)則比LHC還高一個量級!

筆者在2005年左右的時候看到過一張圖,因為很喜愛其中的含義,所以用在了自己的簽名上:

但是前兩天忽然發(fā)現(xiàn),這張圖里的Internet被23,993,564,998 MB的數(shù)據(jù)代表,換算過來只不過23PB,還不到一個Facebook的數(shù)據(jù)量!整個網(wǎng)絡(luò)的數(shù)據(jù)積累速度之快,對于從上個世紀(jì)成長起來的人們而言實在是非常震驚。

接下來的問題就是,究竟誰會對這些數(shù)據(jù)感興趣?

廣告主

“我的廣告費有一半被浪費了,但問題是我不知道是哪一半。”

—— 現(xiàn)代廣告業(yè)之父 John Wanamaker

廣告、市場營銷涉及的范圍很廣,底層平臺有網(wǎng)絡(luò)媒體、社交網(wǎng)絡(luò)、紙媒、電視、公交站旁的牌子、電梯口墻上的屏幕、學(xué)校食堂的桌子等等;中間層有廣告投放系統(tǒng)、數(shù)據(jù)分析服務(wù)、做報告的;轉(zhuǎn)化層有電子商務(wù)和實體店。

“今天我們放一個路牌廣告,我可以告訴你西單路口一天兩千萬人可以看得到,這個數(shù)據(jù)是什么呢?真的是有一個人站在那去數(shù)這個事情嗎?其實都不是。”

筆者前日拜訪國雙科技,其高級副總裁續(xù)揚先生這樣描述起廣告行業(yè)的萬年問題——被浪費掉的一半。接下來,續(xù)揚先生開始感嘆互聯(lián)網(wǎng)帶來的變革:

“互聯(lián)網(wǎng)的出現(xiàn),使在線的數(shù)據(jù)全部被采集成為了可能。”

也就是說,要了解用戶的互聯(lián)網(wǎng)行為,調(diào)查問卷、采樣這些手段已經(jīng)不需要,所有的數(shù)據(jù)在技術(shù)上都可以通過瀏覽器等終端自動收集,然后分析出來的結(jié)論,不再是針對某一個樣本,而是完整的目標(biāo)群體。這就是“全數(shù)據(jù)”。

這意味著什么?廣告主不再需要依賴基于某個隨機的樣本群做出的用戶報告進(jìn)行決策了,他們可以拿到所有搜索過、查看過、購買過自己產(chǎn)品的用戶們的互聯(lián)網(wǎng)行為數(shù)據(jù)!而且數(shù)據(jù)收集合理完整的情況下,他們完全有可能計算出來自己每一分廣告投入帶來的回報。

為什么會這樣說?筆者拜訪國雙科技當(dāng)天,看到許云先生做的一次產(chǎn)品演示,其中有一點令人印象深刻:

一條時間線。

簡單來說,這條時間線是一個用戶訪問某化妝品品牌官網(wǎng)的一個歷史記錄。包含的信息很簡單:一個來訪時間,進(jìn)入網(wǎng)站的來源,使用的瀏覽器,以及是否進(jìn)行了購買。用戶的識別一般是通過cookie的手段和注冊用戶的機制實現(xiàn),不過許云先生表示現(xiàn)在也有其他的技術(shù)手段;而且隨著用戶的數(shù)據(jù)越來越多的分享給互聯(lián)網(wǎng)服務(wù)商,辨認(rèn)用戶的手段還會越來越多,越來越精準(zhǔn)。

在許云先生展示的時間線當(dāng)中,用戶在不同的時間段訪問了這家網(wǎng)站,并且在第四次訪問的時候進(jìn)行了購買。其中可以發(fā)現(xiàn)一些細(xì)節(jié):

1、用戶的第一次來訪是從微博(e.weibo.com)進(jìn)入的

2、過了一個星期,用戶有意識的通過搜索又進(jìn)來一次

3、用戶第三次還是通過搜索,這次訪問已經(jīng)確定了購買意向,然而

4、最后購買之前,用戶換了一次瀏覽器(Chrome->IE)

所以,如果你是該企業(yè)市場部那位決定在微博平臺投放廣告的決策人,或者是負(fù)責(zé)企業(yè)微博運營的市場人員,那么通過這樣一個歷史記錄,這個廣告的效果跟最終成交的這筆單子就有了直接的聯(lián)系。當(dāng)然,影響用戶最終購買的因素有很多,第一次曝光可能只是起到一個通知用戶的作用,但至少這能夠讓人有一個概念:企業(yè)微博做了是有效果的。具體算市場人員績效的時候,也好看個清楚。

就國雙科技而言,提供數(shù)據(jù)收集和展示的工具只是第一步;如果客戶需要,他們可以生成一份有針對性的報告,并進(jìn)一步提出廣告投放或改版的建議。最重要的是,這些數(shù)據(jù)都是實時的——這在上世紀(jì)末可是金融界才能享受到的待遇!而且,這樣一家公司的客戶如果能夠覆蓋到一個行業(yè)的幾個巨頭企業(yè),比如化妝品業(yè)的幾個跨國企業(yè),那么國雙科技這樣一家200多人的小企業(yè),也完全有可能掌握整個化妝品行業(yè)在中國區(qū)的大部分網(wǎng)絡(luò)廣告數(shù)據(jù)。如果要做一個行業(yè)報告出來,那么國雙科技手上掌握的有關(guān)國內(nèi)廣告市場的資料,有可能連Gartner、IDC這樣的傳統(tǒng)的權(quán)威報告發(fā)布方手上都沒有。這在以前是不可想象的。

這就是大數(shù)據(jù)時代的機會之一。而這其中的關(guān)鍵點之一,就在于你在這個行業(yè)收集的數(shù)據(jù)是否有專業(yè)性。筆者跟續(xù)揚先生聊天的時候談到有的企業(yè)可能不愿意把這種數(shù)據(jù)的工作交給第三方的企業(yè)來做,比如處于信息安全的考慮等等。對此,續(xù)揚先生是這樣回復(fù)的:

大家越來越意識到尊重專業(yè)性,就是說,與其他做,他不一定有我做得專業(yè)、專注。中國人有一個特點,什么都想自己干,但是有的時候有一些非常尊重專業(yè)性的話,他就去用你這些數(shù)據(jù)。”

事實上,對數(shù)據(jù)上的這種專業(yè)性的尊重,在北美、歐洲等市場早已成為常識。對于小企業(yè)而言,可能只需要找到一個合適的模式執(zhí)行下去就好;但是對于上了一定規(guī)模的企業(yè),需要決定要做哪些事情,將多少資源投入到這些事情上,都需要準(zhǔn)確的數(shù)據(jù)進(jìn)行判斷,以避免資源的無謂耗損。好的數(shù)據(jù)提取出來的結(jié)論如果能夠幫助他們減少哪怕1%的損耗,那也是非常有價值的。

對于廣告行業(yè)而言,互聯(lián)網(wǎng)全數(shù)據(jù)索引只是一個起步。隨著網(wǎng)絡(luò)的觸角從智能手機往人們的身邊發(fā)展的同時,數(shù)據(jù)收集的范圍也在迅速的擴大至現(xiàn)實的世界當(dāng)中。比如今年開始出現(xiàn)在很多電梯間門口的刷q卡的機子。出租車后座上的觸屏設(shè)備。公交站旁邊的廣告牌、大學(xué)食堂的桌子,以后也很可能會能夠與我們進(jìn)行互動。這種數(shù)據(jù)的廣泛性、散落性、多樣性和實時性,很可能會帶來更多的機會,對整個廣告行業(yè)造成巨大的變革。

您對于這樣的變革有何看法?歡迎留言討論!

 

責(zé)任編輯:yangsai 來源: 51CTO.com
相關(guān)推薦

2013-01-16 10:03:36

2016-12-12 13:51:32

2022-04-20 11:41:45

Kafka數(shù)據(jù)解決方案

2012-12-18 12:55:45

2023-08-02 00:22:47

2023-12-22 15:49:02

大數(shù)據(jù)科學(xué)家Python數(shù)據(jù)分析師

2020-09-29 08:33:17

基站信號健康

2019-01-21 16:54:24

車聯(lián)網(wǎng)智能手機系統(tǒng)iOS

2020-08-23 10:39:37

語言開發(fā)程序員

2016-11-23 18:10:34

云計算

2009-11-19 10:17:06

面試經(jīng)歷

2016-05-24 16:19:58

公有云私有云混合云

2016-10-25 08:38:53

大數(shù)據(jù)DNA 變種癌癥

2012-02-27 09:10:09

大數(shù)據(jù)商業(yè)

2016-11-07 12:30:59

大數(shù)據(jù)互聯(lián)網(wǎng)

2020-09-21 09:27:02

芯片半導(dǎo)體技術(shù)

2013-05-31 10:07:59

大數(shù)據(jù)時代電影產(chǎn)業(yè)

2018-08-09 21:17:01

小程序微信BAT

2017-07-10 10:15:34

2012-11-09 11:24:51

移動云計算數(shù)據(jù)平臺
點贊
收藏

51CTO技術(shù)棧公眾號