自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

淘寶車品覺:數(shù)據(jù),你準備好了沒有?

大數(shù)據(jù)
4月11日杭州舉辦的“淘寶開放日”活動中,阿里集團數(shù)據(jù)委員會會長車品覺在論壇上分享了其在大數(shù)據(jù)領(lǐng)域的從業(yè)經(jīng)驗。

車品覺在加盟阿里集團前曾在匯豐銀行、電信盈科、微軟、eBay等多家MNC擔任總監(jiān)職務(wù),積累大量中小企業(yè)在互聯(lián)網(wǎng)發(fā)展的經(jīng)驗,論壇上討論的主題為《數(shù)據(jù),你準備好了沒有?》。

分享主題有十點,我們節(jié)選了部分的主要內(nèi)容:

一切從問題開始

[[70498]]

提到數(shù)據(jù)中表現(xiàn)明智,不是要增加更多東西,而是要去除過份復(fù)雜和裝飾性的東西。理解了問題 ,就能化解問題,問題本身就是答案。

車品覺列舉一個親身經(jīng)歷:有不少做電商的從業(yè)者向其提出疑問,B2C企業(yè)里大數(shù)據(jù)使用幾年了,真的有效么?車會反問道,你知道你的老板在過去六個月里的困難是什么?分析師往往5-10分鐘都無法回答,這表明從業(yè)者自己都不了解應(yīng)該把數(shù)據(jù)用在哪里,這樣如何能使用好數(shù)據(jù)?。“懂問問題的本身,便找到了答案。”

如果分析師能把問題拆分成三個問題:公司現(xiàn)面對的頭三個問題是什么?未來三個月要解決的是什么?過去一個月作對了什么?事情便好辦多了。車再次舉出了一個在面試中自己常問的問題:“今天早上九點,我是淘寶的CEO,你是我的分析師,請給我三個指標,讓我對上周的業(yè)績安心。”

面試者常常不假思索的回答:“流量”,“交易量”,碰到第三個問題,才需要思考。這表明面試者并不了解問題:問題的核心在于對象是淘寶,不是所有的電商,目標是CEO,而不是產(chǎn)品總監(jiān),第三問題表明這是一個周敏感的數(shù)據(jù)(參考答案會在后文解答)。

“數(shù)據(jù)的力度是無窮的,你可以在不同維度里一直拆分下去,分析師只需要知道哪些數(shù)據(jù)對自己有用即可。”而數(shù)據(jù)收集的難度在于,你的起步應(yīng)該有多寬,如何預(yù)判哪些數(shù)據(jù)是可以為將來所用,這個問題困難了車半年的時間。

在實踐中提煉數(shù)據(jù)的敏捷性

big-data

在動態(tài)中試驗,找出數(shù)據(jù)的規(guī)律性規(guī)律性就是不僅我會用,只要你知道了,你也會用。數(shù)據(jù)必須不停的時候,若僅憑借記錄的數(shù)據(jù),是難以還原當時的場景:有一個人在下雨天買了面包,如果不再當時去考慮,是無法推斷出影響此行為的決定性因素。背景數(shù)據(jù)無法還原當時情況。

航海日志是一個很好的例子,收集數(shù)據(jù)后定位——進而做出決策——發(fā)現(xiàn)差異——回饋從新定位收集數(shù)據(jù)的范圍。這個過程中需要不斷的反饋,最后做成一個表格,數(shù)據(jù)便是這么提煉出來。

讓數(shù)據(jù)——獲取、使用、分享、協(xié)同、連接、組合

由于現(xiàn)在的數(shù)據(jù)統(tǒng)計得極不規(guī)范,使用數(shù)據(jù)的人很難有效的獲取信息,讓用戶輕松感受到數(shù)據(jù)的價值,過去在做數(shù)據(jù)時,很少會有人考慮用戶體驗,這恰恰是最重要的。比如數(shù)據(jù)里面出現(xiàn)了SQL,便使得很多技術(shù)以外人士無法讀懂,美國現(xiàn)在已經(jīng)有企業(yè)提倡去除SQL,便是為了減低交流成本。

上面說的是使用。如何獲取同樣也是十分重要的問題。Google Glass這款產(chǎn)品為何如此重要?因為它能收集的數(shù)據(jù)與傳統(tǒng)渠道的區(qū)隔是天翻地覆的:從一個人早上起來遇到的每一個場景、每一個回饋所得的數(shù)據(jù)都收集起來,一個人50%-60%的數(shù)據(jù)都能收集到。讓數(shù)據(jù)盡可能簡單的收集起來。

顛覆創(chuàng)新來自分裂或重組

一個人注冊網(wǎng)站的時候,可能性別會是男。但仔細調(diào)查可以發(fā)現(xiàn),或許早上的性別是男,晚上是女?;蛘?0%是男,30%是女。過去是0與1的關(guān)系,現(xiàn)在是0-1的關(guān)系,這是一個立體的數(shù)據(jù),年齡也是同樣的情況。

車品覺在這里舉了一個鮮活的例子:“現(xiàn)購物人群趨勢里,出現(xiàn)了diaos高帥富化與高帥富diaos化,三四十歲的人群,去買顏色很鮮艷的手機;而工薪族會去以數(shù)個月的工資來買一個LV包,這些都是很常見的。”分析的時候需要具體進行分裂。

4

以假設(shè)數(shù)據(jù)都能獲取去思考問題

大數(shù)據(jù)是眾多事物的數(shù)據(jù)化,獲取數(shù)據(jù)的成本越來越低。阿里數(shù)據(jù)科學(xué)部的楊滔先生舉出了四個特點:

量變到質(zhì)變:小樣本下,模型無法達到滿意精度,大眾就覺得模型不行,但當樣本達到一定量,模型精度會顯著提升,從而使模型具備以前不具備的功能。

片段到全局:大數(shù)據(jù)能從多個角度判斷一個對象,許多模型都是對象的片段信息,但將這些片段組合在一起時,就會在整體判斷有爆發(fā)提升。

應(yīng)用到資源:小數(shù)據(jù)下,數(shù)據(jù)是為了具體場景的效果提升,但當大數(shù)據(jù)模型能夠辨識全局,數(shù)據(jù)得出的信息就會成為許多創(chuàng)新及應(yīng)用的源泉。

大數(shù)據(jù)包括多個數(shù)據(jù)處理和挖掘的環(huán)節(jié),每一個環(huán)節(jié)都是科學(xué)+藝術(shù),建模能力需要非常強,才可能深度挖掘其價值。

數(shù)據(jù)開放是硬道理

清華大學(xué)科學(xué)學(xué)院經(jīng)濟學(xué)教授、清華大學(xué)華商研究中心副主任劉鷹在談到“從數(shù)據(jù)、信息到知識的演變”,他的邏輯是:從數(shù)據(jù)中獲取信息,從信息中提煉知識(見圖)。

9

我的問題是如何完成這個從數(shù)據(jù)到知識的提煉過程?誰來來完成這個過程?我的理解是,任何個人是不能在大數(shù)據(jù)時代做成一件事的。如果說在農(nóng)業(yè)時代是“三個和尚沒水喝”的話,在大數(shù)據(jù)時代則是“只有三個和尚在一起才有水喝”。

同時,這三個和尚還不能是同一個師傅教出來的,第一個和尚要會statistics and machine learning;第二個和尚要有專業(yè)知識,例如經(jīng)濟學(xué)、社會學(xué)和心理學(xué)等;第三個和尚要懂計算機的硬件和軟件。

三角鼎力方可百戰(zhàn)百勝!阿里研究中心將各部門打散,不同部門的人組成若干項目小組,大量動用各方專家進行合作研究,可見他們Boss的洞察力和領(lǐng)導(dǎo)力了!

利用數(shù)據(jù)拿到更多數(shù)據(jù)

77

電子科技大學(xué)計算機學(xué)院教授尚明生指出:數(shù)據(jù)“大小”自然是不重要的,或者說“數(shù)據(jù)”本身就不重要,重要的是數(shù)據(jù)中隱含的“信息”。比較麻煩或者復(fù)雜的是,這個“信息”的效用沒有一般的準則,因為它通常是為了解決不同的具體問題而言的,而問題又可能是多種多樣的,甚至無法預(yù)知。

我們無法直接抓住所有可能的信息,只好去抓信息的來源,也就是數(shù)據(jù)。從這個角度出發(fā),這個數(shù)據(jù)就需要越大越好,這實際上是我們事先不確定其中可能有用的信息,又不想失去某個部分,再加上想偷懶,就想用同一份數(shù)據(jù),來滿足不同(的人對于他們自己感興趣)的問題需求。

在實際應(yīng)用中,如果問題比較固定,從抽樣理論出發(fā),數(shù)據(jù)規(guī)模是可以限定大小的;如果問題本身發(fā)展變化,數(shù)據(jù)還會越來越大。

數(shù)據(jù)化營運是一種對待數(shù)據(jù)的態(tài)度

大數(shù)據(jù)的核心是以數(shù)據(jù)作為決策的依據(jù),而不是拍腦袋。大數(shù)據(jù)時候需要改變的是管理的模式,而數(shù)據(jù)量的增加僅僅是使得這種改變更加緊迫、更有基礎(chǔ)。這件事在10年前我開始給學(xué)生講商務(wù)智能課的時候就是這樣,再回去20年這種思路就有。

從這個角度來說,數(shù)據(jù)的大小確實不重要,重要的是管理的模式和文化。今天之所以提出大數(shù)據(jù)管理,對于許多企業(yè)講其實是補10年(甚至更多年前)前管理理念上的課。

但是,電商在這方面占據(jù)了先機,現(xiàn)有的人員、技術(shù)和管理理念基本上可以支持大數(shù)據(jù)管理,這是一些線下企業(yè),或者數(shù)據(jù)基礎(chǔ)、管理基礎(chǔ)比較差的企業(yè)望塵莫及的。數(shù)據(jù)量的積累對于這個企業(yè)而言還是重要的。

原文鏈接:http://www.leiphone.com/s-big-data-ready.html

責(zé)任編輯:彭凡 來源: 雷鋒網(wǎng)
相關(guān)推薦

2011-01-11 15:06:02

Linux安裝準備

2016-07-08 15:54:00

創(chuàng)業(yè)

2013-01-28 16:51:45

2010-08-25 15:49:04

面試

2016-05-31 16:50:33

2015-06-24 16:03:24

大數(shù)據(jù).SAS

2021-04-28 11:38:10

“熄燈”數(shù)據(jù)中心數(shù)據(jù)中心運維

2011-05-25 17:08:29

ibmdwLinux

2016-11-21 17:39:08

云計算

2015-01-07 10:45:05

Dockerkubernetescontain

2015-10-19 16:51:01

2018-10-11 17:43:15

人臉識別人工智能AI

2019-04-18 15:32:45

Serverless騰訊云TVP

2011-07-08 10:18:09

海量數(shù)據(jù)數(shù)據(jù)挖掘

2020-03-26 17:28:22

CIO觀點MES系統(tǒng)制造企業(yè)

2011-01-12 09:37:59

2018-10-16 18:26:52

人工智能AI

2016-11-01 13:31:27

2017大數(shù)據(jù)

2015-10-15 17:11:47

賽思股份

2011-08-30 09:28:36

編程
點贊
收藏

51CTO技術(shù)棧公眾號