自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

身為數(shù)據(jù)科學(xué)家,你必須要掌握這四大技能!

大數(shù)據(jù)
想成為一名高級數(shù)據(jù)科學(xué)家除了擁有卓越的專業(yè)技能,你還需要其它技能來拉近和業(yè)務(wù)經(jīng)理的距離。這看起來簡單,但隨著每年新技術(shù)的不斷累積,技術(shù)和業(yè)務(wù)之間的距離會繼續(xù)增大。因此,我們發(fā)現(xiàn)管理者和數(shù)據(jù)科學(xué)家有清晰的合作方向是非常重要的。

想成為一名高級數(shù)據(jù)科學(xué)家除了擁有卓越的專業(yè)技能,你還需要其它技能來拉近和業(yè)務(wù)經(jīng)理的距離。這看起來簡單,但隨著每年新技術(shù)的不斷累積,技術(shù)和業(yè)務(wù)之間的距離會繼續(xù)增大。因此,我們發(fā)現(xiàn)管理者和數(shù)據(jù)科學(xué)家有清晰的合作方向是非常重要的。

 

業(yè)務(wù)和IT知識都是十分專業(yè)的,然而由于技能的專業(yè)化,許多企業(yè)都出現(xiàn)了兩個專業(yè)間的空白。我們的任務(wù)是幫助填補它!

業(yè)務(wù)和IT知識都是十分專業(yè)的,然而由于技能的專業(yè)化,許多企業(yè)都出現(xiàn)了兩個專業(yè)間的空白。我們的任務(wù)是幫助填補它!

數(shù)據(jù)科學(xué)家必須有技術(shù)方面的扎實基本功,這包括編程、查詢、數(shù)據(jù)清洗等。然而隨著數(shù)據(jù)科學(xué)家的成長,他們需要更多地關(guān)注設(shè)計決策以及與管理者的溝通,這會大大增強經(jīng)驗豐富的數(shù)據(jù)科學(xué)家的影響力。他們可以做出更高層次的決策,并幫助陷入困境的年輕數(shù)據(jù)科學(xué)家,而不是被困在日復(fù)一日的編碼中。更有經(jīng)驗的數(shù)據(jù)科學(xué)家能利用他們的經(jīng)驗來做出簡化復(fù)雜系統(tǒng)、優(yōu)化數(shù)據(jù)流的設(shè)計決策,同時協(xié)助決定哪些項目最為恰當(dāng),這使得數(shù)據(jù)科學(xué)家自身及其公司都能有更大獲益。

能夠做到化繁為簡

數(shù)據(jù)科學(xué)家往往希望將他們所知道的每一種技術(shù)和算法都應(yīng)用于每一個問題的解決方案上。相應(yīng)地,這就會使系統(tǒng)非常復(fù)雜難以維護。

數(shù)據(jù)科學(xué)確實需要復(fù)雜抽象的模型及大量的復(fù)雜技術(shù)(從Hadoop到Tensorflow)。在這個充斥著復(fù)雜性的領(lǐng)域,人們會傾向于開發(fā)復(fù)雜的系統(tǒng)和算法,稍不留神就會在開發(fā)中涉及四、五種不同的技術(shù)并使新的熱門算法或框架。然而,像大多數(shù)涉及工程的其他領(lǐng)域一樣,減少復(fù)雜性往往會帶來諸多好處。

 

如果馮· 諾依曼,埃爾溫· 薛定諤和愛因斯坦可以幫助我們理解數(shù)學(xué)和物理驅(qū)動領(lǐng)域的復(fù)雜性,那么我們數(shù)據(jù)科學(xué)家不能在復(fù)雜性背后。

如果馮· 諾依曼,埃爾溫· 薛定諤和愛因斯坦可以幫助我們理解數(shù)學(xué)和物理驅(qū)動領(lǐng)域的復(fù)雜性,那么我們數(shù)據(jù)科學(xué)家不能在復(fù)雜性背后。

工程師的角色就是去簡化任務(wù)。如果你曾經(jīng)建造或看到過魯布· 戈德堡機械(Rube Goldberg machine),你會理解什么是用復(fù)雜方法去完成簡單任務(wù)。一些數(shù)據(jù)科學(xué)家的算法和數(shù)據(jù)系統(tǒng)看起來像是用膠帶和口香糖粘起來的老鼠夾,而不是簡潔有效的解決方案。更簡單的系統(tǒng)意味著隨著時間推移系統(tǒng)會更加容易維護,并且未來的數(shù)據(jù)科學(xué)家能夠按需添加和刪除模塊。但若你使用三種不同的語言,兩個數(shù)據(jù)源,十個算法且沒有留下任何文檔資料,未來的工程師可能會默默詛咒你哦。

簡單的算法和系統(tǒng)也應(yīng)使添加和刪減模塊是容易的。因此當(dāng)需要技術(shù)進行改變和更新或者需要刪除模塊時,可憐的未來數(shù)據(jù)科學(xué)家不會陷入和你的代碼一起玩疊疊樂積木游戲(Jenga)的困境 。但會糾結(jié)于“如果刪了這段代碼,系統(tǒng)會不會崩潰”。(這一糾結(jié)的根源是怕出現(xiàn)技術(shù)債務(wù))

知道如何在沒有主鍵的情況下關(guān)聯(lián)匹配數(shù)據(jù)

強大的數(shù)據(jù)專家能做的重要工作之一是:將可能沒有主鍵或明顯聯(lián)系的數(shù)據(jù)集關(guān)聯(lián)在一起。數(shù)據(jù)可以呈現(xiàn)人之間或業(yè)務(wù)之間的日常交互。能夠在這些數(shù)據(jù)中找出統(tǒng)計模式,是數(shù)據(jù)科學(xué)家可以幫助決策者作出明智決定的重要能力。然而,你想要關(guān)聯(lián)在一起的數(shù)據(jù)并不總是位于相同的系統(tǒng)或有著相同粒度。

與數(shù)據(jù)打交道的人會知道,數(shù)據(jù)并不總是很好的整合在一個數(shù)據(jù)庫中。比如,財務(wù)數(shù)據(jù)與IT服務(wù)管理數(shù)據(jù)通常是分開存放的,外部的數(shù)據(jù)源往往可能并不是在同一個維度進行的聚合。這會成為一個問題,因為找出數(shù)據(jù)中的價值有時確實會需要來自其他部門或系統(tǒng)的數(shù)據(jù)。

 

數(shù)據(jù)嚙合是需要在相同的粒度級別上進行的。一種理解的方式是:將一塊大拼圖與由許多小塊數(shù)據(jù)拼圖組成的大拼圖組合起來。

數(shù)據(jù)嚙合是需要在相同的粒度級別上進行的。一種理解的方式是:將一塊大拼圖與由許多小塊數(shù)據(jù)拼圖組成的大拼圖組合起來。

例如,假如給你提供了醫(yī)療保單、信用卡和社區(qū)犯罪率的數(shù)據(jù),想由此找出這些社會經(jīng)濟因素如何影響病人,你會怎樣處理?一些數(shù)據(jù)可能是以人為單位,而另一些數(shù)據(jù)可能是街道或城市級別,而且沒有明確的方式來關(guān)聯(lián)這些數(shù)據(jù)集。最好的處理方式是什么?這成為了一個不能忽視且必須被解決的問題。

對項目進行優(yōu)先排序

作為數(shù)據(jù)科學(xué)家,你需要知道如何解釋可能不劃算的項目的投資回報率(ROI)。這與良好的直接溝通有關(guān)(我們的團隊永遠不會停止討論如何溝通),也與能夠清楚表達價值并且對長短期目標進行優(yōu)先排序有關(guān)(重申一遍,說起來容易做起來難)

團隊總是會有超出他們處理能力的過多的項目和項目要求。有經(jīng)驗的團隊成員需要起帶頭作用來幫助決策者決定哪些項目是值得進行的。在有很大機會成功但可能不會有最高投資回報率的短期項目和很有可能會失敗但同時也會產(chǎn)生較大投資回報率的長期項目之間需要有一個良好的平衡。

這種情況下,決策矩陣會有助于簡化過程。

經(jīng)典的決策矩陣之一是一個2*2矩陣,行和列分別為重要性和緊迫性。多數(shù)的大學(xué)商業(yè)課程中都會出現(xiàn)這種矩陣,它很簡單,這也是它很棒的原因。

我曾在公司和一些很聰明的人共事,但還是工作中的每個項目都被列為優(yōu)先。如果你沒聽過這個說法,我會在這里講出來:

如果每件事都被優(yōu)先考慮,那么,相當(dāng)于沒有事情被排在優(yōu)先。

 

選擇正確的項目意味著必須做出取舍。不是所有的事情都是高優(yōu)的。

選擇正確的項目意味著必須做出取舍。不是所有的事情都是高優(yōu)的。

許多公司都存在這個問題,這就是為什么對于數(shù)據(jù)科學(xué)家團隊中有經(jīng)驗的成員,能夠清晰表達出哪些項目需要當(dāng)下執(zhí)行還是以后執(zhí)行是非常重要的。而使用這個簡單的矩陣能帶來一定幫助。

(簡潔十分重要,使用矩陣來明確投資回報率是有幫助的)。

有了簡明直接的溝通,項目繼續(xù)向前推進,信任也隨之建立起來了。

能夠開發(fā)出穩(wěn)健且最優(yōu)的系統(tǒng)

做出能在受控環(huán)境中操作的算法或模型是一回事。將穩(wěn)健模型集成到實時且能處理大量數(shù)據(jù)的系統(tǒng)又是另一回事。根據(jù)公司的不同,有時數(shù)據(jù)科學(xué)家只需開發(fā)算法本身,之后開發(fā)人員或機器學(xué)習(xí)工程師會負責(zé)將其轉(zhuǎn)為上線的產(chǎn)品。

然而還會有其他的情況,小的公司和小的團隊可能會需要數(shù)據(jù)科學(xué)家團隊來將代碼轉(zhuǎn)為上線產(chǎn)品。這意味著算法需要能以合理的速度控制數(shù)據(jù)流量。如果算法要運行三個小時并且需要被實時訪問,這顯然不能在產(chǎn)品上使用。因此,良好的系統(tǒng)設(shè)計及優(yōu)化是必要的。

 

隨著數(shù)據(jù)增多,越來越多的人會與系統(tǒng)交互,模型跟上腳步是十分重要的。

隨著數(shù)據(jù)增多,越來越多的人會與系統(tǒng)交互,模型跟上腳步是十分重要的。

當(dāng)高級數(shù)據(jù)專家的技術(shù)能力和其他能力相結(jié)合時,才能對他們自身和其公司產(chǎn)生最大的影響。數(shù)據(jù)科學(xué)家寶貴的經(jīng)驗是非常有價值的,這些經(jīng)驗?zāi)軌蛑笇?dǎo)年輕的開發(fā)人員做出更好的設(shè)計決策,幫助管理者找出哪些項目會帶來最好的投資回報率,從而也放大了他們的參與對于團隊的影響。

責(zé)任編輯:未麗燕 來源: 大數(shù)據(jù)文摘
相關(guān)推薦

2018-02-07 15:45:37

數(shù)據(jù)科學(xué)家數(shù)據(jù)技術(shù)

2023-04-20 10:29:46

數(shù)據(jù)管理數(shù)據(jù)分析

2019-03-25 21:18:41

數(shù)據(jù)科學(xué)家大數(shù)據(jù)技能

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2021-01-22 15:25:42

數(shù)據(jù)科學(xué)數(shù)據(jù)分析IT

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2012-12-27 09:50:36

Facebook

2019-07-05 10:29:17

大數(shù)據(jù)數(shù)據(jù)科學(xué)家

2019-11-29 18:03:27

數(shù)學(xué)R語言算法

2019-01-29 10:53:07

數(shù)據(jù)開發(fā)Python

2019-01-28 18:43:02

數(shù)據(jù)科學(xué)家Python技巧

2018-08-10 08:35:49

2018-01-25 14:19:32

深度學(xué)習(xí)數(shù)據(jù)科學(xué)遷移學(xué)習(xí)

2020-08-28 13:49:13

數(shù)據(jù)統(tǒng)計學(xué)面試

2022-09-07 23:54:17

機器學(xué)習(xí)無監(jiān)督學(xué)習(xí)算法

2020-08-03 10:37:01

Python編程語言工具

2018-05-03 09:11:51

數(shù)據(jù)科學(xué)家職業(yè)數(shù)據(jù)科學(xué)

2019-07-03 16:10:27

數(shù)據(jù)科學(xué)家數(shù)據(jù)庫數(shù)據(jù)工程師

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家
點贊
收藏

51CTO技術(shù)棧公眾號