數(shù)據(jù)如何變現(xiàn)、定價
8月29日-30日,以“數(shù)據(jù)重構(gòu)未來”為主題的D-Future七牛數(shù)據(jù)時代峰會在上海舉行。七牛攜百名創(chuàng)業(yè)明星,技術(shù)大咖匯聚國際時尚中心,共話數(shù)據(jù)發(fā)展,探討行業(yè)未來!
360 高級總監(jiān)劉鵬在30日的會議上帶來《大數(shù)據(jù)交易與變現(xiàn)》演講,主要講述如何把數(shù)據(jù)變成錢,怎么給數(shù)據(jù)定價,以及大數(shù)據(jù)時代隱私安全的問題。以下是他的演講實錄:
劉鵬:今天非常的誠惶誠恐在這么一個高逼格的地方做演講。那數(shù)據(jù)到底有沒有價值,從廣告的行業(yè)來看的話,數(shù)據(jù)的價值和數(shù)據(jù)怎么樣變成錢這個事,已經(jīng)完全不需要討論了,它已經(jīng)有了十年以上的歷史了,而且是在規(guī)?;膭?chuàng)造整個互聯(lián)網(wǎng)的營收。
今天主要是闡明一個問題,數(shù)據(jù)是如何創(chuàng)造價值的,重點是說的關(guān)于用戶的行為價值,別的變現(xiàn)的手段不在我們的討論范圍里。第二點是比較有意思的,以廣告市場為基礎(chǔ),我們實際上已經(jīng)形成了一個比較完成的數(shù)據(jù)的交易和定價的這么一個機(jī)制。我們知道在中國,今年有二個數(shù)據(jù)交易所誕生,一個是貴陽的,一個是武漢的長江以交易所,我也和他們一些人做過溝通,我特別強(qiáng)烈的建議,所有的對數(shù)據(jù)有興趣的人,不管是從事數(shù)據(jù)變現(xiàn),還是從事數(shù)據(jù)交易的,必須是要了解一下廣告,因為廣告的商業(yè)化的機(jī)制有過非常多的探索,而且有過非常多的彎路。
今天看一下廣告相關(guān)的數(shù)據(jù)的交易,真正的理解數(shù)據(jù)的價值,做好數(shù)據(jù)交易有非常多的幫助。另外數(shù)據(jù)交易是非常前沿和不成熟的。它有一些什么問題呢,也是我們今天要討論的一部分。
我經(jīng)常在一些報告里提我的觀點,互聯(lián)網(wǎng)思維是什么,第一點我要提一下,互聯(lián)網(wǎng)就是三個不要,首先是不要錢。我們用免費的產(chǎn)品加上后向變現(xiàn)的商業(yè)模式,最大的價值使我們過去很多不能做的事,現(xiàn)在在互聯(lián)網(wǎng)可以做了,過去是沒有商業(yè)模式的,為什么可以賺錢,它的價值是在哪里呢,有沒有這種后象變現(xiàn)的邏輯,使數(shù)量和流量可以變成錢,這是互聯(lián)網(wǎng)真正的創(chuàng)造了價值的地方。我個人認(rèn)為互聯(lián)網(wǎng)巨大的發(fā)展,并不是顛覆過去的行業(yè),而是創(chuàng)造新的行業(yè)。
第二個是不要臉,這是每一個做互聯(lián)網(wǎng)的人必須堅守的行為準(zhǔn)則,中國的互聯(lián)網(wǎng)的傳播是一種無底線迎合用戶的產(chǎn)品與營銷方式,很難說對或者是錯,這是市場的趨勢。
最后一點是不要命,如何讓產(chǎn)品的程序員以自愿的以996或者是007的方式加班,硅谷就是強(qiáng)調(diào)的做到這一點。有的時候變成了一種常態(tài)。
我的個人的觀點三個不要。和什么有關(guān)呢,和不要錢有關(guān)系。我們看一下不要緊,我們把所有的傳播信息的商品,包括了我們的網(wǎng)站,比如是我們推廣一下,電影也是一種傳播信息的商品,價格會趨向編輯成本。那是怎么賺錢的呢,就是把流量和數(shù)據(jù)變成錢,流量變成錢比較好理解,數(shù)據(jù)變成錢是最近幾年特別熱的話題。
所以要做一個廣告,為什么要做這個廣告呢,我還是建議大家要了解和數(shù)據(jù)相關(guān)的東西,并不是因為我做廣告的說這個話,但是你不了解廣告的話,會走很多很多的彎路。市場上沒有人系統(tǒng)的整理廣告里面的產(chǎn)品技術(shù),所以我寫的內(nèi)容當(dāng)然也不成熟,有興趣的話,大家可以去計算廣告就可以了。內(nèi)容會比較的簡單粗暴一點。包括象三個不要這樣子的論調(diào)也會比較多。
我們切入我們的正題及這個會是關(guān)于大數(shù)據(jù)的,我個人覺得我對大數(shù)據(jù)的認(rèn)識和其他的人有一點不一樣。不一樣在什么地方呢,我并不認(rèn)為傳統(tǒng)的數(shù)據(jù)的分析問題是屬于大數(shù)據(jù),這是從我的實踐來說的,比如是我統(tǒng)計360公司在每一個省的用戶的比例,這個問題要處理大量了日志,這個我個人這個不是大數(shù)據(jù),這個我是屬于傳統(tǒng)的數(shù)據(jù)分析的問題,大數(shù)據(jù)的問題是屬于怎么樣的呢?就是我們在圖里畫的,A類這樣子的問題,如果是通過你的數(shù)據(jù)采樣解決這個問題,如果這個問題解決的效果是迅速的下降,那這才是大數(shù)據(jù)的問題。我舉一個例子,廣告就是典型的大數(shù)據(jù),為什么呢?我需要對全中國每一個人分析他的行為的特征,分析他的購物的偏好,十億人里面的100萬分析,進(jìn)行廣告的RPM的優(yōu)化,顯然最后的受益也只有在這100萬人產(chǎn)生,這樣子的才是大數(shù)據(jù)的問題。只有這樣子的問題,才需要用到快速的處理大量數(shù)據(jù)的基礎(chǔ)架構(gòu),否則的話,我是不需要的。
我曾經(jīng)說過一句話,多少也得罪了不少的人,象IBM,思科這種公司,他們對大數(shù)據(jù)也是說了很多,但是我覺得他們整個的產(chǎn)品線和大數(shù)據(jù)是毫無關(guān)系的。就好比是你去麥當(dāng)勞吃西餐,真正的大數(shù)據(jù)應(yīng)該是處理海量的用戶行為數(shù)據(jù),并且是在不能采樣的情況下進(jìn)行的。當(dāng)然不是說大數(shù)據(jù)處理的難度要高,因為它對移植性的要求,為它的困難的程度,但是它不是必備的,這是我個人的觀點。
數(shù)據(jù)有二類的基礎(chǔ)應(yīng)用,我們總結(jié)一下,這二類的基礎(chǔ)應(yīng)用,對應(yīng)了我剛才說的觀點,我們叫做洞察和自動化。洞察是全局或者是局部統(tǒng)計,比如是我要統(tǒng)計360在每一個省的用戶占比,我要的是一張表,與它相對應(yīng)的是個體的行為統(tǒng)計,這個個體可能是人,可能是一個網(wǎng)站,大量的個體的非聚合的特征。洞察我們大多數(shù)是用于宏觀的決策支持,說的簡單一點,給人看,而自動化比如說是定向的廣告,個人的信用,面向的是機(jī)器的。用于微觀業(yè)務(wù)的實施。所以最后的數(shù)據(jù)的結(jié)果是給人看的,還是給機(jī)器看的,如果是給機(jī)器看的話,我覺得應(yīng)該是在大數(shù)據(jù)的今天,應(yīng)該是放在更優(yōu)先的地位。這是我的想法。
然后我用一個詞來和大家說一下,數(shù)據(jù)是怎么變成錢的,大家對廣告熟悉的人都很熟悉,不熟悉的人,正好可以了解這一點。數(shù)據(jù)變成錢的方式非常的簡單。比如這是一個廣告位,流量價值一萬塊錢,投的是吉列剃須刀的廣告,很顯然一半的女性的用戶對吉列購買的潛在的可能性是比較小的,我說的是理論,實際上不一定,如果是把流量區(qū)分開,比如說把吉列的廣告投給男性的用戶,這樣子的話,對廣告主是好事,因為只要付出六千塊錢,有效的用戶沒有損失,并且成本變化程度了60個,剩下的一半的流量,女性的流量,我可以再投給另外一個化妝品的廣告。
6000+6000=1.2萬,等于流量價值的一萬塊,二千塊錢這個就是數(shù)據(jù)的價值了。為什么是數(shù)據(jù)的價值呢,因為你知道每一個用戶是男是女,使你多賺了這二千塊錢,這個是廣告行業(yè)對用戶的屬性和變現(xiàn)的非常簡單的原理,用這種方式來賺錢,特別特別的容易,數(shù)據(jù)一定是在規(guī)?;罅康馁嶅X,我們知道性別就可以多賺2000塊,知道的更細(xì),就可以賺更多的錢。
比如是有一塊地,有的地的下面是有金子,有的是有銀子,你知道有金子的話,把地買下來,把金子買下來,地還是原來的價格,但是你知道了這個信息,就得到了下面的金子,這個是數(shù)據(jù)變現(xiàn)的基本的原理。在互聯(lián)網(wǎng)的廣告里是可以規(guī)模化的變現(xiàn)的。有一個圖,這個圖是很有名的,如果是大家做廣告的話,應(yīng)該都知道,有一個咨詢公司盧馬(音)畫的廣告產(chǎn)品的示意圖。
在廣告市場上面這一大部分是從事廣告交易的公司,廣告交易是很復(fù)雜的。下面的一大塊,全部是從事數(shù)據(jù)加工和交易的公司,所以實際上在廣告的市場上存在這么一個分工,有人專門的從事數(shù)據(jù)加工交易,和廣告絲毫沒有關(guān)系,在廣告的市場里是非常的核心的。大家也就可以知道數(shù)據(jù)對于整個互聯(lián)網(wǎng)變現(xiàn)的核心的地位。所以在這個市場里面,其實就是存在著所說的數(shù)據(jù)加工交易的問題。
要說一下概念,我們說的數(shù)據(jù)交易,因為我了解的都是和廣告相關(guān)的,其他的數(shù)據(jù)交易,現(xiàn)在并沒有發(fā)展起來。說幾個概念,所謂的三方數(shù)據(jù),第一方的是廣告的第一方的數(shù)據(jù),廣告平臺比如是Facebook給我提供的用戶的標(biāo)簽,這是第二方的數(shù)據(jù),其他的來源數(shù)據(jù),他的手里就是有數(shù)據(jù),愿意從事廣告的活動,把數(shù)字變成錢,這種數(shù)據(jù)叫做第三方數(shù)據(jù),需要一個交易的過程,我把這個數(shù)據(jù)提供出來怎么樣收到錢,這個數(shù)據(jù)的規(guī)模也是很大,但是還很不成熟。我們看一下下面有一些什么問題,這些問題也是需要我們在座的各位一起好好的想想,把它給解決了。
我們現(xiàn)在的數(shù)據(jù)交易的產(chǎn)品是叫做數(shù)據(jù)交易所,我會聚合很多人的數(shù)據(jù),比如是你開的小網(wǎng)站,你想把數(shù)據(jù)變現(xiàn),說實話不現(xiàn)實,不如把數(shù)據(jù)托管過數(shù)據(jù)交易所,把你的數(shù)據(jù)拿走以后,通過廣告的過程賣了去,然后和你分成,這個是在北美市場和其他的市場很成熟的流程,交易量也很大。聚合了多種原始的數(shù)據(jù)加工成統(tǒng)一標(biāo)簽以后售賣,但是它不從事廣告交易,很典型的只從事數(shù)據(jù)交易,不從事廣告交易,但是又是寄生在廣告市場的這么一種產(chǎn)品。
那說到了比較有意思的東西,數(shù)據(jù)交易有怎么樣的特點呢?從今年開始,中國有很多的談數(shù)據(jù)交易,我個人對數(shù)據(jù)交易有這么幾點認(rèn)識,我把它的叫做三定律,這個是有一點大話,只是我個人的觀點,為了給大家加深印象,我用了這個詞,我個人對數(shù)據(jù)交易的認(rèn)識是這樣子的。
第一定律,我認(rèn)為數(shù)據(jù)只能交易,不能交換或者是共享。
第二定律,只有按效果而非購買量付出費,才能有足夠的需求。
第三定律,同一數(shù)據(jù)被越多的人使用價值越低,流量是這個廣告位投一次展示,只能是一個人在用,數(shù)據(jù)是可以告訴十個人,價值自然的就下降了,那會對數(shù)字產(chǎn)生一些什么影響呢,我們一會看一下。
關(guān)于第一個問題,為什么我個人認(rèn)為數(shù)據(jù)不能共享?首先大家會有一些疑問,數(shù)據(jù)共享似乎是在發(fā)生的,各個公司之間在相互的交換數(shù)據(jù),希望能夠?qū)Ρ舜说臉I(yè)務(wù)產(chǎn)生一些貢獻(xiàn),但是我發(fā)現(xiàn)結(jié)果無非是二個,成功的有在線上系統(tǒng)進(jìn)行大規(guī)模數(shù)據(jù)共享交換的數(shù)據(jù),目前的話,有投訴的關(guān)系。就是母公司和子公司控股關(guān)系以后才會發(fā)生的數(shù)據(jù)交換。實際上這個定價或者是交易是發(fā)生在更高的之間。另外很多的人的交換或者是共享,往往我只看到了一個測試,大家測一下,你的數(shù)據(jù)對我有沒有用,我的數(shù)據(jù)對你有沒有用,測完了怎么樣呢,就結(jié)束了。所以BAT和360有這么多的數(shù)據(jù),為什么你們這些土豪不把數(shù)據(jù)拿出來。
我希望大家走出這個會場不要問這個荒謬的問題了,數(shù)據(jù)就是錢。數(shù)據(jù)很容易的在互聯(lián)網(wǎng)的市場上變成錢,那你是不是可以要求百度你把現(xiàn)金拿出來,我們分一下,這是不可能的事。可是百度也會拿出一些數(shù)據(jù),就比如是嘀嘀打車,為了讓大家用,可以貼給用戶一些錢,刺激市場的流動性,這種事情,短期是可行的,長期的話,很難形成規(guī)模。
唯有一點可以共享的是政府?dāng)?shù)據(jù),政府沒有盈利的需求,但是如果是政府沒有無邊界的共享,也會成為一種災(zāi)難,仍然是要一個做架的方式去做數(shù)據(jù),這是我的看法。
關(guān)于第二點數(shù)據(jù)交易應(yīng)該怎么樣做的問題,我們看到長江交易所和貴陽,那個交易我還是很初級的。為什么這么說呢,它的沒有摸到數(shù)據(jù)交易的一個特別重大的問題,就是我買數(shù)據(jù)的人,首先是我必須買一部分的數(shù)據(jù),如果是你只給我的前二步,那買的人是很少的。比如是我就服務(wù)上海的幾個廣告主,可能我只要數(shù)據(jù),我就要上海的這一點數(shù)據(jù),你給了我多了也沒有用,我還造成了成本。在廣告的交易里,這個問題已經(jīng)解決了,一點也不困難。
廣告的程序化的交易過程中,如果是你就要上海的數(shù)據(jù),我可以同時的把數(shù)據(jù)帶出去,你要什么數(shù)據(jù),我就給你什么,同時結(jié)算的來說,我也不是說根據(jù),我給了你一百萬個標(biāo)簽,你就給我這個錢,是根據(jù)最后贏得的廣告的展示量,數(shù)據(jù)展示的效果來付費的。這個是整個在廣告市場里做交易,為什么規(guī)模還可以做的比較大,這一點解決了部分的購買的數(shù)據(jù)和按照效果來購買數(shù)據(jù),如果是整體的購買數(shù)據(jù),我認(rèn)為這個市場根本就做不起來,沒有幾家可以參與。互聯(lián)網(wǎng)所有的產(chǎn)品,不管是廣告,還是將來的數(shù)據(jù),一定是靠頭部的客戶。
這一點我認(rèn)為現(xiàn)在是初步的有了一些解決的方案,但是又不能是全部的解決方案,因為只適合廣告產(chǎn)業(yè),其他的場景怎么樣部分的交易,需要結(jié)合每一個場景來討論,前二個交易沒有前景。
第三點就是最困難的怎給數(shù)據(jù)定價,今天沒有辦法展開了講,廣告行業(yè)解決了一個特別重要的定價的問題,互聯(lián)網(wǎng)的廣告和傳統(tǒng)的廣告不一樣,我們是通過拍賣的方式競價,完全是用市場經(jīng)濟(jì)的方式定價,定價權(quán)是掌握在需求方的,誰買這個流量,你自己說是多少錢,這樣子解決了一個什么問題呢,就是廣告的本身,有可能對我來說值五毛,對他來說是值二塊,我是定五毛或是二塊,都不合適,大家競價解決資源的分配,數(shù)據(jù)遲早是會走向競價的模式,但是數(shù)據(jù)的交易和流量的交易有一個本質(zhì)的交易,流量交易本身是受限的。數(shù)字一個標(biāo)簽可以給十個人?,F(xiàn)在實際上的數(shù)字交易是不限量的,帶來了什么問題呢,我覺得發(fā)生了數(shù)據(jù)的價格向流量價格的轉(zhuǎn)移,比如是地下埋了一塊金子,我告訴一個人,他得到了信息,把金子挖走了,現(xiàn)在我賣了十個人,他們都去搶這一塊地,地價就太高了,使他們拿到金子的交易就變少了,所以付出信息提供方的價格也就降低了。
現(xiàn)在的數(shù)據(jù)交易市場本身的交易量很大,但是價格偏低,這是為什么呢,我覺得是因為上面的這種交易的方式,競價的交易方式,不限量的供應(yīng)商品,是無法競價的,這個對交易的過程,有很多深層次的影響和變化,這是一個問題,只有把這個問題解決了,限量供應(yīng)和競價的問題解決了,數(shù)據(jù)才能真正的給合理的定價。我特別的反對有一個定價委員會,給這個數(shù)據(jù)說值五毛還是二塊,這個大家想也不用想,根本不可能,因為技術(shù)不是值二毛也不是值二塊,對A需求方和B需求方是不一樣的,根據(jù)自己的方式調(diào)整才是王道。
數(shù)據(jù)交易很有意思,我覺得是未來我們的大數(shù)據(jù)行業(yè)最有意思的一個點之一。誰可以徹底的解決數(shù)據(jù)交易的問題,一個沒有交易的商品,很難說大規(guī)模的發(fā)展。
最后還要提醒一下大家,關(guān)于隱私,大家根本不知道隱私是什么問題,大多數(shù)的人,我覺得在座的各位,90%的人不知道什么是隱私的問題。隱私呢,就是希望你個人的數(shù)據(jù)不要被泄露給不相關(guān)的人,他可以采取一些動作,最早的時候,發(fā)現(xiàn)這個隱私是在歐盟的A29協(xié)會有過一些討論,他們給出了一些基本的原則,這些基本的原則非常的好,也是現(xiàn)在的歐美的互聯(lián)網(wǎng)公司的共識,因為在歐洲作業(yè)必須是要符合這種表現(xiàn)。
第一個是PII不能使用,一個字段看上去可以找到你的這個是叫PII,比如是家庭地址,你的電話,你的名字,這種是PII。PII是嚴(yán)格的禁止使用的,也不能變成標(biāo)簽。
第二個用戶可以要求系統(tǒng)停止記錄和使用自己的行為數(shù)據(jù),中國的廣告有的也開始做了。
第三點不能長期保存和使用戶的行為數(shù)據(jù)。應(yīng)該是一年半的周期,一年半以上的你備份也不可以,備份的話,就可能會泄露出去。
那實際的隱私碰到的問題比這個要嚴(yán)重的多,比如說朝陽區(qū)35歲在360上班,如果是熟悉我的人,對我有背景信息的了解,那你沒有任何的PII,非常的容易定位成我的信息,如果是后面跟上我的月薪,這個就泄露了。所以電信運營商他們討論脫隱,可以解決問題嗎,完全的不解決問題。
互聯(lián)網(wǎng)真正嚴(yán)重的是什么,稀疏的行為數(shù)據(jù),曾經(jīng)有一個100萬美金的推薦大賽,讓你們?nèi)ヮA(yù)測對新的影片是不是喜歡,打幾分,有一個人參加了這個比賽,就看到了一條記錄,里面的ABC影片,什么時候看評價如何,他看了以后馬上反映出來,這個記錄一定是我同事的,這種事情的特點是什么,他發(fā)現(xiàn)了一個問題,除了這些觀影記錄之外那條記錄很多是關(guān)于同性戀的電影,也就是說,這個同事他不想讓別人知道自己在看這個影片,然后他把這個事告訴了他同事,他同事就把Intflix給告了,認(rèn)為是泄露了自己的隱私,所以這個比賽搞了一屆,就搞不下去了。隱私是什么問題,隱私并不是說有人把我們的信息八毛錢一條賣出去,我們關(guān)心的是熟人之間的隱私,他對你有一定的背景信息的了解,同時他在了解你的隱私的時候是不計成本的。上海電信的數(shù)據(jù)是拿出來的交易的,但是做了脫敏,如果是有一天發(fā)生了這樣子的情況如果我在里面找上海市的某一個領(lǐng)導(dǎo),我對他有足夠的背景的了解,絕對是有信心把他找出來,因為我不計成本的,找到了以后,還可以發(fā)現(xiàn)很多的事情。這個絕對不是危言聳聽。我們現(xiàn)在還沒有技術(shù)的手段去規(guī)避這種問題,很多的科學(xué)家包括數(shù)學(xué)家都在一起研究,怎么樣在一個個性化的系統(tǒng)里和數(shù)據(jù)交易里降低風(fēng)險,但是現(xiàn)在還沒有答案。這個也是大數(shù)據(jù)交易的一個問題。
我就說這么多,希望大家對幾個問題有印象,就沒有白聽,首先數(shù)據(jù)是怎么變成錢的,希望大家都能夠了解,另外大家一起的想一下交易里的問題,主要的二個問題,一個是定價的問題,一個是隱私的問題。這都是很前沿的,未解決的問題,我相信這些問題隨著我們大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,一定有一天會有一個比較好的答案,需要在座的各位共同的努力,謝謝各位!