不能成為數(shù)據(jù)科學(xué)家?沒關(guān)系,你還可以擁有數(shù)據(jù)思維
原文作者: Christian Bonilla
選文&翻譯: 吳佳樂 薛菲
校對:Aileen
數(shù)據(jù)科學(xué)家日益突顯的影響力令人驚嘆——每次讀到這種論調(diào)的文章我都感到好笑。雖然不是所有文章都像《哈佛商業(yè)評論》一樣宣稱數(shù)據(jù)科學(xué)家將是“21世紀(jì)最熱門的職業(yè)”,但是,幾乎都是千篇一律的“我們預(yù)見了未來”的語氣。我認(rèn)為這種觀點(diǎn)并沒有錯,但是在這種趨勢中,我沒有發(fā)現(xiàn)什么是值得驚奇或者是新鮮的。如果《洋蔥報(bào)》(The Onion, 美國***的幽默諷刺雜志)要報(bào)道,我想標(biāo)題應(yīng)該是:
“***研究表明,精通數(shù)學(xué)和編程的人被大量地雇傭”。
這有什么新鮮的呢?自從上世紀(jì)70年代以來,擅長數(shù)學(xué)和編程的人們就在華爾街發(fā)家致富了。隨著越來越多的公司產(chǎn)生海量的數(shù)據(jù),對于數(shù)學(xué)和編程技能的需求已經(jīng)延伸到了新興的行業(yè),更不必說技術(shù)部門了。但是,數(shù)學(xué)和編程只是價(jià)值正在迅速上升的量化分析能力中的一部分。去年8月紐約時(shí)報(bào)的一篇文章是一個極好的例子,能夠說明新聞媒體對此的熱切關(guān)注度:一位在舊金山工作的服務(wù)生Paul Minton,在決心成為一名數(shù)據(jù)科學(xué)家后,經(jīng)過3個月的編程和數(shù)據(jù)分析課程,年薪就從2萬變成了六位數(shù)??磪?,一個數(shù)據(jù)科學(xué)的奇跡!
補(bǔ)充一點(diǎn)細(xì)節(jié)(這篇文章指出了此點(diǎn)非常值得贊揚(yáng),雖然只是略帶而過):Minton擁有數(shù)學(xué)專業(yè)的本科學(xué)位。換句話說,他是一位非常聰明的服務(wù)生。我不了解Minton,也不想妄加評論他本人或者紐約時(shí)報(bào)或者服務(wù)生。但是,大多數(shù)人是沒有天資在如此短的時(shí)間內(nèi)實(shí)現(xiàn)同樣的轉(zhuǎn)變的。我在以前的博客和書中曾經(jīng)說過,我是編程學(xué)校和非傳統(tǒng)學(xué)習(xí)平臺的忠實(shí)擁護(hù)者。但是不能只注意到Minton“僅僅3個月”就完成了他的非凡轉(zhuǎn)變,卻忽略了他之前數(shù)年的教育中包含了微積分,統(tǒng)計(jì)學(xué),概率論和其他這些除了編程技術(shù)以外的高深課程,這些都是取得數(shù)學(xué)本科學(xué)位所必須的。我猜Minton至少對MATLAB有一點(diǎn)印象。對于大多數(shù)人而言,他們不僅沒有數(shù)年的相關(guān)訓(xùn)練,而且即使接受免費(fèi)培訓(xùn)他們也不一定能夠掌握編程能力。我就是其中之一。
相比于我大學(xué)時(shí)期,現(xiàn)在的就業(yè)市場需要數(shù)學(xué)和統(tǒng)計(jì)學(xué)能力已經(jīng)不再是秘密,但是這并不意味著它們更容易學(xué)習(xí)。在我大學(xué)的朋友中,我的量化分析能力至多是略高于平均水平。雖然我的微積分和統(tǒng)計(jì)學(xué)學(xué)得非常好,但是良好的數(shù)學(xué)基礎(chǔ)使我能夠應(yīng)付我的經(jīng)濟(jì)學(xué)專業(yè)的同時(shí),也讓我發(fā)現(xiàn)擅長數(shù)學(xué)不再是我的長期優(yōu)勢。我清楚地認(rèn)識到,我的職業(yè)生涯無法僅僅建立在我比其他人數(shù)學(xué)更好的基礎(chǔ)上。對于數(shù)學(xué),我想大多數(shù)人有這樣的意識后都會比周圍人更加困擾。
我之所以提出這些是希望當(dāng)你為自己的數(shù)學(xué)學(xué)位感到害羞,聽到數(shù)據(jù)科學(xué)家的需求量巨大就如聽到國家橄欖球聯(lián)盟的四分衛(wèi)收入很高一樣時(shí),能夠清醒地說,“是的,當(dāng)然如此。”
好消息是,即使不能成為一位數(shù)據(jù)科學(xué)家,通過培養(yǎng)自己的數(shù)據(jù)思維,你仍然能夠提升自身價(jià)值,使工作更出色。
當(dāng)今職場秘密武器:用數(shù)據(jù)說話
這些年有一件讓事情讓我震驚:大多數(shù)人對自己公司的數(shù)據(jù)的了解少之又少。我接觸過的大多數(shù)公司里根本沒有幾個人有能力用最基本的方法分析他們的數(shù)據(jù),更別提有足夠的數(shù)據(jù)科學(xué)家人手了。最近有個大型酒店集團(tuán)的營銷經(jīng)理向我吐槽:公司里“也就2-3個人”可以分析原始的銷售數(shù)據(jù),只有他們對業(yè)務(wù)和內(nèi)部信息系統(tǒng)都有足夠的了解。我接觸的另一個商用品分銷公司有幾萬名員工,但是只有5、6個人可以快速地回答公司高層提出的問題,其他的人要么不夠了解數(shù)據(jù)庫要么不夠了解公司業(yè)務(wù)。還有一個大型零售連鎖集團(tuán)里只有很小一撮人可以很快地分析他們的原始數(shù)據(jù)。很多公司甚至專門設(shè)立了”客戶洞察”部門。他們的使命是專門幫助其他部門解決跟那些該死的數(shù)據(jù)有關(guān)的問題。
是什么造成了這種現(xiàn)象呢?
這些公司的信息系統(tǒng)應(yīng)該負(fù)一部分責(zé)任?,F(xiàn)在有很多企業(yè)因?yàn)闀r(shí)間的積累或者是多次并購,繼承了很多個不同類型的信息系統(tǒng)。這些系統(tǒng)對于沒有技術(shù)背景的人來說非常難以使用。僅僅這一條就可以讓大多數(shù)的人對于公司的原始數(shù)據(jù)望而卻步。但是更大的障礙其實(shí)是人的惰性。就算公司有還不錯的分析數(shù)據(jù)的工具(比如一個關(guān)系型數(shù)據(jù)庫),也只有少數(shù)的人有耐心和好學(xué)心去了解。其他大多數(shù)人只是想等待數(shù)據(jù)出現(xiàn)在一個Excel表格里或者一個展示板上供他們使用。這不簡單是需要學(xué)習(xí)一門新的查詢語言(SQL)的問題。要想要明白公司的數(shù)據(jù)模型是怎樣的,數(shù)據(jù)是怎么樣存儲的這些都需要反復(fù)實(shí)驗(yàn),這會消耗很多耐心和精力?,F(xiàn)實(shí)世界中的數(shù)據(jù)和在商學(xué)院中用的數(shù)據(jù)是完全不一樣的,手里的數(shù)據(jù)永遠(yuǎn)沒有書里的那么整潔可靠。這就是為什么絕大部分人都直接使用他們的IT部門整合好的數(shù)據(jù)。這些數(shù)據(jù)比較靠譜,不需要考慮太多跟數(shù)據(jù)本身無關(guān)的事情。
但是僅僅使用這些別人寫好的數(shù)據(jù)報(bào)告和展示板有一個問題,就是你很難在職場中脫穎而出。因?yàn)榇蠹业男畔⒍际菍ΨQ的,這些數(shù)據(jù)的一絲一毫所有人都看的清清楚楚。雖然數(shù)據(jù)的質(zhì)量很重要,但這會大大限制你創(chuàng)新的能力。當(dāng)你手中別人給你做好的數(shù)據(jù)并不能幫助你解答你想知道的問題時(shí)怎么辦?舉個例子,假設(shè)你想測試一下那些全家自駕游的客人在酒店的消費(fèi)特征。這時(shí)你需要自己篩選分析那些只來過酒店一次,點(diǎn)了兒童菜單的東西到房間里而且還加了一張折疊床的客戶。這種分析可以讓你的老板認(rèn)真聽取你報(bào)告的內(nèi)容。這種問題如果可以自己解決比要要別人幫助好十倍。
解決這些問題并不難,不需要高中畢業(yè)就可以搞定。你只需要合適的數(shù)據(jù)加上一顆好學(xué)心。
提出簡單的問題可以事半功倍
有人說聰明的人喜歡問復(fù)雜的問題,但是絕頂聰明的人往往會問簡單的問題。的確,最重要的業(yè)務(wù)問題往往也是最簡單的問題。比如:為什么客戶沒有選擇競爭對手的產(chǎn)品而是選擇了我們的產(chǎn)品?為什么曾經(jīng)選擇了我們產(chǎn)品的人卻最終放棄了這個產(chǎn)品?我們應(yīng)該為了增加銷售量而降價(jià)嗎?當(dāng)你是職場新人的時(shí)候你往往在埋頭做一些細(xì)節(jié)的工作,沒人會問你這種問題。但隨著你經(jīng)驗(yàn)增多,真正可以搞定這些問題的時(shí)候你可以開始為解決公司最根本最重要的問題做貢獻(xiàn),升職加薪走向人生***!
回顧我的職業(yè)生涯,我學(xué)到最有用的業(yè)務(wù)技能就是SQL,用這個語言我可以直接查詢一個公司的原始運(yùn)營數(shù)據(jù),直接了解關(guān)于這個公司業(yè)務(wù)的基本特點(diǎn)。我漸漸發(fā)現(xiàn)自己很擅長提出不錯的問題,需要的只是一些能幫我解決這些問題的工具。更重要的是,當(dāng)一個人用過內(nèi)部的數(shù)據(jù)庫查詢過公司的信息后你就會發(fā)現(xiàn),使用數(shù)據(jù)庫的經(jīng)驗(yàn)可以教你提出更好的問題。說白了就是,用過數(shù)據(jù)庫之后就知道怎樣可以提出一個在數(shù)據(jù)庫中可以精確回答的問題。這讓人沒有以前那么懶惰,因?yàn)橛?jì)算機(jī)和人不一樣,它并不懂得怎樣揣摩你真正的意圖。這樣在不知不覺中就學(xué)會了如何更加系統(tǒng)地思考。
原文鏈接:http://www.smartlikehow.com/blog-native/2015/12/1/not-a-data-scientist-no-problem-you-can-still-be-data-savvy-than-most
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】