自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

沒有數(shù)據(jù)科學(xué)家大數(shù)據(jù)就玩不轉(zhuǎn)了?

云計算
如今, 一談到大數(shù)據(jù), 一個普遍的說法就是人才的缺乏。 數(shù)據(jù)科學(xué)家成為了21世紀(jì)最性感的職業(yè)等等。 哈佛商業(yè)評論以及咨詢公司麥肯錫的報告都這么說, 再加上數(shù)據(jù)科學(xué)家們自身也樂意被打上這樣的標(biāo)簽。

 [[106642]]

 

數(shù)據(jù)科學(xué)家被媒體譽(yù)為21世紀(jì)最性感的職業(yè),是企業(yè)界身價不菲、一將難求的的超級明星,這嚇跑了很多準(zhǔn)備嘗試大數(shù)據(jù)的企業(yè),實際上沒有數(shù)據(jù)科學(xué)家企業(yè)一樣可以玩轉(zhuǎn)大數(shù)據(jù)。

如今, 一談到大數(shù)據(jù), 一個普遍的說法就是人才的缺乏。 數(shù)據(jù)科學(xué)家成為了21世紀(jì)最性感的職業(yè)等等。 哈佛商業(yè)評論以及咨詢公司麥肯錫的報告都這么說, 再加上數(shù)據(jù)科學(xué)家們自身也樂意被打上這樣的標(biāo)簽。

然而, 這種說法, 也讓很多準(zhǔn)備考慮大數(shù)據(jù)戰(zhàn)略的企業(yè)面對大數(shù)據(jù)的機(jī)會望而卻步了。 那么, 如果缺少數(shù)據(jù)科學(xué)家, 企業(yè)的大數(shù)據(jù)就真得玩兒不轉(zhuǎn)了嗎? 其實也未必。

這里, 當(dāng)然不是說數(shù)據(jù)科學(xué)家不重要。 相反, 數(shù)據(jù)科學(xué)家這個職業(yè)在大數(shù)據(jù)時代非常重要。 在企業(yè)中, 數(shù)據(jù)科學(xué)家的工作, 實際上是聯(lián)系企業(yè)的IT技術(shù)和企業(yè)所在行業(yè)專業(yè)知識的紐帶。 這樣的知識交集上的人才, 本身確實匱乏, 而且, 即使大數(shù)據(jù)又再大的發(fā)展,同時具備這樣的知識的人才也還是少數(shù)。 然而, 就像我們在計算機(jī)行業(yè)發(fā)展的早期, 不能說因為喬布斯, 蓋茨這樣的人才太少就制約了行業(yè)發(fā)展一樣。 如今, 街邊柯達(dá)店的小伙子都能用PS修人像, 而我們也不需要要求柯達(dá)店的小伙子具備編寫圖像處理軟件能力。

大數(shù)據(jù)時代也是一樣, Google, Twitter, Facebook那樣的大公司, 可以負(fù)擔(dān)得起那些高精尖的數(shù)據(jù)科學(xué)家, 而小企業(yè), 也可以有自己的方式來更好地利用數(shù)據(jù)。 下面, 以電子商務(wù)的公司為例子, 結(jié)合數(shù)據(jù)科學(xué)家的工作, 來看看如何能夠在企業(yè)現(xiàn)有能力范圍內(nèi)進(jìn)行數(shù)據(jù)方面的工作。

數(shù)據(jù)科學(xué)家的工作, 大致分為三個方面:

第一, 數(shù)據(jù)架構(gòu)的搭建, 第二, 數(shù)據(jù)模型的建立, 第三, 數(shù)據(jù)分析。

下面我們來看看那些雇不起或找不著數(shù)據(jù)科學(xué)家的屌絲企業(yè)如何玩轉(zhuǎn)大數(shù)據(jù):

數(shù)據(jù)架構(gòu)的搭建:

首先, 確定企業(yè)對數(shù)據(jù)的需求點。 對絕大部分商業(yè)企業(yè)來說, 其實每個業(yè)務(wù)經(jīng)理都可以告訴你, 他們所需要的數(shù)據(jù)就是用戶行為的數(shù)據(jù), 比如, 用戶購買行為, 用戶對促銷或者廣告的反應(yīng), 用戶的社交信息等等, 基本上, 每一類這樣的信息, 都可以比較容易的進(jìn)行歸類。

這里的關(guān)鍵, 就是盡量把需要的數(shù)據(jù)范圍進(jìn)行限定, 這樣就可以設(shè)定一些簡單的數(shù)據(jù)輸入模板, 從而把數(shù)據(jù)采集和數(shù)據(jù)整理問題簡單化。 這里可以采用一些開源工具, 如Hadoop, Hbase, Hive, Pig等, 把各類數(shù)據(jù)進(jìn)行整合。 2/8 原則一般是適用的, 也就是, 80%的進(jìn)行運營支撐的需求可以來自于20%的數(shù)據(jù)。 對企業(yè)來說, IT技術(shù)人員和業(yè)務(wù)專家共同的協(xié)作, 加上一部分外部咨詢的幫助, 應(yīng)該可以搭建一個可用的架構(gòu)。

數(shù)據(jù)模型的建立

數(shù)據(jù)科學(xué)家的另一部分工作就是數(shù)據(jù)模型的建立。 這些模型可能是描述型的模型, 也可能是預(yù)測性的模型。 這部分的工作, 也是數(shù)據(jù)科學(xué)家經(jīng)常被神化的部分。 其實, 這部分工作, 比如說推薦系統(tǒng), 用戶個性化系統(tǒng)等等。 數(shù)據(jù)科學(xué)家所做的大量工作, 在于提取數(shù)據(jù)的“特征”, 選擇合適的模型, 并把它們輸入模型, 等待模型輸出結(jié)果, 再驗證, 調(diào)整特征的循環(huán)。 這部分的工作, 需要第一, 熟悉各類統(tǒng)計模型或者機(jī)器學(xué)習(xí)模型的建立。 第二, 也是更重要的一點, 就是行業(yè)知識的了解。 比如一個推薦系統(tǒng), 最重要的就是把提取用戶特征, 提取商品的特征。 如果建模的人對行業(yè)知識不了解的話, 那么模型就會很龐大和復(fù)雜, 也未必精確。 在這里, 行業(yè)的專家, 盡管對建模未必很精通, 他們的市場感覺往往是選擇合適特征值的關(guān)鍵。

因此, 對電商企業(yè)來說, 招幾個學(xué)統(tǒng)計的員工(或者外包), 再配合企業(yè)內(nèi)部的行業(yè)專家, 也可以建一些適合企業(yè)需要的基本模型。 也許沒有Google或者Facebook那么地精確, 但是對絕大部分企業(yè)來說, 也夠用了。 這也不失為是一條在找不到合適的數(shù)據(jù)科學(xué)家(事實上精通本行業(yè)又精通建模的人才本來也是鳳毛麟角)的情況下的解決之道。

數(shù)據(jù)分析

數(shù)據(jù)分析的本質(zhì), 是把“數(shù)據(jù)”變成“信息”, 并從中發(fā)現(xiàn)對企業(yè)運營有價值的東西。 這其實和任何理科或者工科的“觀察 — 歸納 —關(guān)聯(lián) — 分析 —驗證”的研究方法從本質(zhì)上是一致的。 從這個角度來講, 行業(yè)的專業(yè)知識, 在數(shù)據(jù)分析的時候, 更加重要。

即使你把歐洲大型強(qiáng)子對撞機(jī)的數(shù)據(jù)給數(shù)據(jù)科學(xué)家, 他也發(fā)現(xiàn)不了“上帝粒子”。

國內(nèi)的很多人都會津津樂道 美國百貨公司Target通過數(shù)據(jù)分析給懷孕少女推送嬰兒產(chǎn)品的例子,而很多數(shù)據(jù)分析師或者數(shù)據(jù)科學(xué)家在提到這樣的例子的時候, 也在有意無意的進(jìn)行誤導(dǎo)。 其實, 如果沒有對用戶和產(chǎn)品方面的專業(yè)知識, 光靠數(shù)據(jù)分析或者數(shù)據(jù)模型, 是很難做到的。 而事實上, 任何機(jī)器生成的模型, 要想實用的話, 也都得需要人工在反饋路徑上進(jìn)行一定程度上的調(diào)整。

在數(shù)據(jù)分析領(lǐng)域, 已經(jīng)有很多的分析工具。 然而, 現(xiàn)在的這些工具, 大多數(shù)也還是比較復(fù)雜。 需要類似數(shù)據(jù)科學(xué)家或者數(shù)據(jù)分析師這樣的專門人員來使用。 由于企業(yè)精細(xì)化運營的程度普遍不高。 數(shù)據(jù)分析師或者是BI的分析師本來就稀缺, 更不要說精通行業(yè)專業(yè)領(lǐng)域知識同時具備數(shù)據(jù)分析工具使用能力的人才了。 一個解決的方式, 就是把常用的分析盡量模板化, 數(shù)據(jù)的整理盡量簡化。 盡量采用Excel這樣簡單大眾的分析工具。 歸根結(jié)底, 企業(yè)進(jìn)行數(shù)據(jù)分析的目的, 是為了經(jīng)營服務(wù)的。 簡單的工具, 在使用,分享和溝通方面都有優(yōu)勢。 這樣的解決方案當(dāng)然不算得完美, 但是, 如果能讓具備豐富行業(yè)經(jīng)驗的專家以行業(yè)經(jīng)驗來彌補(bǔ)數(shù)據(jù)分析工具的不足, 對企業(yè)來說, 也算得上是一個在缺乏數(shù)據(jù)科學(xué)家情況下的可以從數(shù)據(jù)分析中獲益的方式。

在大數(shù)據(jù)時代, 數(shù)據(jù)科學(xué)家的重要性當(dāng)然是毋庸置疑的。 不過, 就像網(wǎng)站內(nèi)容管理系統(tǒng)那樣, 大型網(wǎng)站可以雇頂級工程師來自建系統(tǒng)。 小企業(yè)也可以利用WordPress這樣的系統(tǒng)來滿足自身的需求一樣。

企業(yè)在這個人才匱乏的大數(shù)據(jù)時代, 利用已有的工具, 結(jié)合自身對行業(yè)的專業(yè)知識, 采取合適的策略, 同樣也可以從數(shù)據(jù)和數(shù)據(jù)分析中獲益。

對于那些準(zhǔn)備淘金大數(shù)據(jù)的企業(yè)來說,還有一個好消息是:ClearStory這樣的創(chuàng)業(yè)公司正致力于大數(shù)據(jù)的可視化和易用化,讓那些雇不起高水平數(shù)據(jù)科學(xué)家的企業(yè),以及非IT部門的業(yè)務(wù)人員也能使用大數(shù)據(jù)。正如電腦進(jìn)入windows時代后,普通用戶操作電腦不再需要逐條記憶繁冗的DOS命令行。

原文鏈接:http://www.ctocio.com/hotnews/10429.html

責(zé)任編輯:王程程 來源: IT經(jīng)理網(wǎng)
相關(guān)推薦

2012-12-26 10:18:47

大數(shù)據(jù)數(shù)據(jù)科學(xué)家

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2013-11-12 09:27:01

大數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2015-10-16 09:44:51

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2013-05-10 09:28:14

大數(shù)據(jù)數(shù)據(jù)科學(xué)家SAS

2012-12-25 09:58:50

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2018-10-16 14:37:34

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析數(shù)據(jù)科學(xué)

2012-06-12 09:33:59

2015-10-08 10:09:42

2013-11-13 10:20:19

數(shù)據(jù)科學(xué)家大數(shù)據(jù)Gartner

2016-08-17 09:50:27

大數(shù)據(jù)數(shù)據(jù)科學(xué)家

2018-08-20 19:24:40

數(shù)據(jù)科學(xué)數(shù)據(jù)清理數(shù)據(jù)分析

2012-12-27 09:52:23

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2014-07-03 09:38:19

2019-08-26 09:47:56

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析

2016-08-02 17:00:12

Hadoop大數(shù)據(jù)系統(tǒng)

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具
點贊
收藏

51CTO技術(shù)棧公眾號