如何面對(duì)繁雜的數(shù)據(jù)需求?
大家好,我是一哥,最近有一位數(shù)據(jù)新人小伙伴私聊我:在平時(shí)的工作中會(huì)面臨著大量的數(shù)據(jù)需求,不僅多,而且雜,請(qǐng)問(wèn)如何處理面對(duì)這些問(wèn)題?有沒(méi)有什么好的提高工作效率的方法?
其實(shí)不止是作為數(shù)據(jù)新人會(huì)面臨這樣的“困境”,很多數(shù)據(jù)工程師都有著這樣的困惑,干了一兩年感覺(jué)沒(méi)意思,抱怨天天就是“提數(shù)”。一哥之前寫(xiě)過(guò)一篇文章《數(shù)倉(cāng)工程師如何避免淪為“提數(shù)機(jī)”》,大家可以參考下。
面對(duì)這位小伙伴的困惑,我思考后給了她一些建議的,今天也系統(tǒng)的整理一下,給大家作為參考。
01業(yè)務(wù)的重要性
一哥做數(shù)據(jù)工作,呆過(guò)三家公司,做過(guò)新人也帶過(guò)新人。經(jīng)過(guò)“被工作的毒打”后,建議大家入職后較好的順序是先理解業(yè)務(wù),多跟業(yè)務(wù)打交道,對(duì)底層數(shù)據(jù)和業(yè)務(wù)之間的邏輯關(guān)系先大致心里有個(gè)譜。然后自己開(kāi)始梳理業(yè)務(wù)體系,心里有個(gè)框架,一般純業(yè)務(wù)的需求都比較平常,基本跳不出體系框架,一哥之前也寫(xiě)過(guò)另一篇文章來(lái)說(shuō)業(yè)務(wù)的重要性《業(yè)務(wù)重要?還是技術(shù)重要?》。
熟悉業(yè)務(wù)后,開(kāi)始對(duì)接需求。有時(shí)候不同業(yè)務(wù)有時(shí)可能會(huì)提重復(fù)的需求,對(duì)于這種需求,要么把代碼和計(jì)算流程優(yōu)化好,要么覺(jué)得不合理“懟”回去(當(dāng)然不是硬懟哈,我們有業(yè)務(wù)滿意度考核……),要么你就得開(kāi)始研究下,看可不可以在平臺(tái)上做成固化的數(shù)據(jù)產(chǎn)品。比較特別的,尤其是探索性的分析項(xiàng)目,是可以接受稍長(zhǎng)一些時(shí)間的,中間可以和業(yè)務(wù)做探討。
業(yè)務(wù)是可以分門(mén)別類(lèi)的,最好可以自己梳理好,做好一些好的小工具。不過(guò)只接提數(shù)需求確實(shí)沒(méi)啥意思,慢慢對(duì)業(yè)務(wù)熟悉了,就可以參與業(yè)務(wù)流程的制定,也可以自己給自己提的業(yè)務(wù)問(wèn)題做數(shù)據(jù)分析(瞎折騰)才是真好玩。
02提數(shù)神器的重要性
有時(shí)候確實(shí)沒(méi)辦法拒絕業(yè)務(wù)部門(mén)需求,各種姿勢(shì)各種要求,由于有績(jī)效這座大山,提高自己的效率來(lái)應(yīng)對(duì)層出不窮的需求可謂最好的方法,同時(shí)提數(shù)的過(guò)程也有助于加強(qiáng)業(yè)務(wù)理解(熟能生巧嘛)。
正所謂你有政策我有對(duì)策,好的方法和工具往往能高效完成工作以免不必要的加班,在這列舉幾個(gè)常用的提數(shù)加工神器:
Excel
熟練數(shù)據(jù)透視表,Vlookup等常見(jiàn)公式,不要瞧不起Excel,有時(shí)候它的效率確實(shí)挺高的。
針對(duì)業(yè)務(wù)部門(mén)需求固定格式的數(shù)據(jù)或者報(bào)表,可用Excel將模版寫(xiě)好備用,有新數(shù)據(jù)需求時(shí)直接復(fù)制套入,即刻完成。
Sql
數(shù)據(jù)人必備語(yǔ)言,針對(duì)業(yè)務(wù)定時(shí)需求的數(shù)據(jù)或者報(bào)表,可以用類(lèi)似navicat的定時(shí)功能,提前將查詢語(yǔ)句寫(xiě)好排版,軟件會(huì)在指定時(shí)間將結(jié)果文檔推送至郵箱。
Python
python的numpy,pandas,matplot是數(shù)據(jù)分析三個(gè)神器 。python可以直連數(shù)據(jù)庫(kù),連接Hive,連接Spark(好像沒(méi)有它不能連的……)。也可以導(dǎo)入現(xiàn)有數(shù)據(jù),只需提前將數(shù)據(jù)處理語(yǔ)句寫(xiě)好,需要的時(shí)候應(yīng)用就行,一勞永逸。
shell
前幾天有同學(xué)問(wèn)shell除了執(zhí)行部署的jar包,還能做什么?那么你一定不知道awk、sed有多強(qiáng)大。曾經(jīng)用shell腳本寫(xiě)過(guò)上千行的數(shù)據(jù)處理腳本,離開(kāi)公司4年了,聽(tīng)說(shuō)還在用呢!
每天一個(gè)shell命令,趕緊學(xué)起來(lái)吧!
03工作方法論的重要性
首先,需求多,說(shuō)明你們公司數(shù)據(jù)需求很多,給你施展才華的機(jī)會(huì)很多!
現(xiàn)在流行一個(gè)詞——“套路”,工作同樣也是有“套路”的,我們稱(chēng)之優(yōu)雅的稱(chēng)之為為“方法論”。
需求優(yōu)先級(jí)
1)繁雜的需求
需要抽絲剝繭,把復(fù)雜的類(lèi)目整理成簡(jiǎn)單的條目,并且明確其中的主次重點(diǎn),再逐條拆解。不過(guò)數(shù)據(jù)分析本身,有些需求,的確是很復(fù)雜,需要一些時(shí)間去思考整理的。這就要看你手上的工作情況了,包括判斷個(gè)人在處理這些問(wèn)題上的難易程度。
2)突然的需求
說(shuō)明需求很緊急,這就需要對(duì)工作需求的輕重緩急,有個(gè)明確的判斷。再結(jié)合完成需求的時(shí)間長(zhǎng)短,有的需求的確比較著急,是需要優(yōu)先處理,有的相對(duì)可以緩一緩,復(fù)雜度高的需求,又急的話,可以先給其中個(gè)別重要的,其他的給出完成計(jì)劃。
溝通
自己對(duì)需求有了上述判斷后,并不是立刻就開(kāi)始執(zhí)行了,一定要和業(yè)務(wù)溝通,否則可能會(huì)出力不討好。
如果兩個(gè)需求方都要的比較急,必要的時(shí)候讓他們自己協(xié)調(diào)下,畢竟你一個(gè)人時(shí)間有限,而且數(shù)據(jù)需求,又要求精確細(xì)致,不能通過(guò)壓縮分析時(shí)間來(lái)完成任務(wù),要有自己的工作標(biāo)準(zhǔn),保證給出的數(shù)據(jù)都是準(zhǔn)確率的,可使用的。
三人行,……
如果是日常的工作,總結(jié)出方法論,快速處理即可;如果是難度較高、挑戰(zhàn)較大的工作,也是值得花更多心思的,就理應(yīng)花更多心思去研究;如果是難到自己不能完成,需要求助的,一定要和同事多討論。古人有云:三人行,必有我?guī)熝?。雖然我們可能是諸葛亮,但古人亦有云:三個(gè)臭皮匠頂個(gè)諸葛亮。在討論過(guò)程中或許你就會(huì)會(huì)發(fā)現(xiàn)一些其他方法。
個(gè)人認(rèn)為,不論是數(shù)據(jù)工程師,或是產(chǎn)品經(jīng)理、運(yùn)營(yíng),亦或是其他崗位的工作,都是會(huì)遇到這樣類(lèi)似的情況,提高效率最有效的方法:總結(jié)方法論,找到最為快捷解決復(fù)雜問(wèn)題的工作思路。學(xué)會(huì)對(duì)本質(zhì)問(wèn)題的分析,善于抓住重點(diǎn),這樣就不會(huì)被紛繁瑣碎的事情干擾而浪費(fèi)掉大量的時(shí)間。善于利用自己的時(shí)間去處理更為緊要更有價(jià)值的事情,用最少的時(shí)間,掙更多的錢(qián)。
本文轉(zhuǎn)載自微信公眾號(hào)「數(shù)據(jù)社」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系 數(shù)據(jù)社公眾號(hào)。