學(xué)Python就能做好數(shù)據(jù)分析?萬能語言背后是一片韭菜地
“會python的大學(xué)生,找工作有多賺?“
“python到底是什么鬼,學(xué)姐靠他拿了5個offer"
“數(shù)據(jù)分析還在用Excel?學(xué)會python效率高10倍!“
......
這樣的標題你在朋友圈、公眾號一定見過,不管是技術(shù)類公眾號,還是求職公眾號,甚至情感雞湯類公眾號都會時不時地給你推一篇讓你學(xué)python的文章,尤其在數(shù)據(jù)分析領(lǐng)域,“python數(shù)據(jù)分析“的公眾號或者文章遍地都是,當然,你隨手點開一個類似上述標題的文章,拉到最后一定都是一個python課程的報名廣告...
在鋪天蓋地廣告的洗腦下,讓很多想要學(xué)習(xí)數(shù)據(jù)分析或者已經(jīng)從事數(shù)據(jù)分析的人產(chǎn)生了這樣的疑問:python真的很厲害嗎?學(xué)數(shù)據(jù)分析一定要python嗎?它為什么可以這么火?
首先,不可否認,python的確是一門非常好的編程語言,應(yīng)用非常廣泛,語法簡潔、代數(shù)邏輯清晰,而且擁有海量的第三方庫。
在數(shù)據(jù)分析領(lǐng)域功能十分強大, 數(shù)據(jù)爬取、清洗、可視化分析,挖掘....python無所不能。開發(fā)效率高、運營速度快、而且入門簡單,據(jù)說,部分地區(qū)的小學(xué)生信息課程甚至也加入了Python,看起來學(xué) python是大勢所趨,勢不可擋。
但是數(shù)據(jù)分析的都要學(xué)python嗎?
答案顯然不是。
不管是python、R還是Excel、spss,這些都是數(shù)據(jù)分析的工具,對于數(shù)據(jù)分析,我一直強調(diào)核心是業(yè)務(wù),通過業(yè)務(wù)的分析邏輯影射到數(shù)據(jù)分析的處理邏輯,而數(shù)據(jù)分析工具則是幫助我們實現(xiàn)結(jié)果的手段。
如果把數(shù)據(jù)分析的結(jié)果比喻成你要去的一個目的地,那么python只是可以到達這個目的地的一個交通工具,換句話來說,你換個工具也能做到,所以python和數(shù)據(jù)分析之間,并沒有不可分割的關(guān)系。
既然關(guān)乎到選工具,肯定是選擇最好用工具才能夠最快達到目的,那python是不是數(shù)據(jù)分析工具的最佳選擇呢?
不一定是。不一樣的路適合的交通工具不一樣,同樣,不一樣的類型的數(shù)據(jù)分析工作,合適的數(shù)據(jù)分析工具也不一樣。
在實際工作中,數(shù)據(jù)分析這個大類的崗位層次不一,崗位職能也大不相同,在不同的公司,同樣都叫數(shù)據(jù)分析師的崗位,可能一個就是給業(yè)務(wù)取數(shù),提供基礎(chǔ)數(shù)據(jù)支撐,而另一個卻要涉及數(shù)據(jù)建模、挖掘。這兩種人需要掌握的工具技能肯定也大不相同。
我這里把數(shù)據(jù)分析籠統(tǒng)的分類業(yè)務(wù)向和技術(shù)向兩類:
業(yè)務(wù)類分析師,側(cè)重業(yè)務(wù)分析,一般掛靠在業(yè)務(wù)部門,或者有單獨數(shù)據(jù)分析部門,最要工作內(nèi)容就是對特定業(yè)務(wù)做專題分析,通過對數(shù)據(jù)分析來做一些業(yè)務(wù)規(guī)劃、方案等。日常的工作大多就是整理報表,做一些探索性的業(yè)務(wù)分析,解決業(yè)務(wù)問題。
技術(shù)類分析師,一般都在IT部、數(shù)據(jù)中心。根據(jù)從事的工作環(huán)節(jié)不同,被分成數(shù)據(jù)庫工程師,ETL工程師,爬蟲工程師,算法工程師等角色,主要的工作一般有數(shù)據(jù)倉庫搭建、專題分析、建模分析、數(shù)據(jù)挖掘預(yù)測等。
說完數(shù)據(jù)分析師的工作內(nèi)容,再來看目前市場流行的幾類數(shù)據(jù)分析工具:Excel、python/R、BI工具
先說大家都熟悉的Excel,excel在數(shù)據(jù)分析領(lǐng)域的地位不可動搖,尤其對入門新手來說,大部分的人在進入工作之前都多少接觸Excel,所以在此基礎(chǔ)上要做數(shù)據(jù)分析,學(xué)習(xí)Excel是最合適不過的,從簡單的表格制作,數(shù)據(jù)透視表,寫公式,再到VBA語言,基本能夠滿足80%業(yè)務(wù)人員的分析需求。而且學(xué)習(xí)Excel的成本比學(xué)習(xí)一門編程語言低多了。
(見過有很多機構(gòu)開始利用職場焦慮忽悠普通職場人學(xué)python,說句良心話,花費大幾千甚至破萬的價格去報班學(xué)python,沒有基礎(chǔ)幾個月也只能學(xué)個皮毛,回到自己的工作中根本用不上,除非你認真考慮轉(zhuǎn)行,當然轉(zhuǎn)行也不可能像培訓(xùn)機構(gòu)說的那么簡單)
回到正題,我們再說BI工具,BI的誕生,目的是為了縮短從業(yè)務(wù)數(shù)據(jù)到經(jīng)營決策的時間,提高決策效率,所以它的產(chǎn)品設(shè)計理念就是圍繞提高數(shù)據(jù)分析的過程展開的。
和Excel相比,BI工具在分析流程上更加簡化,以我用過的FineBI為例,從數(shù)據(jù)鏈接、數(shù)據(jù)處理、到可視化圖表分析,很多功能都是封裝好的,鼠標點擊拖拽就能迅速完成一次分析。這樣的可視化操作界面讓BI的學(xué)習(xí)門檻大大降低,更適合面向企業(yè)中的業(yè)務(wù)分析人員。
另外,在面對大數(shù)據(jù)量分析時,BI工具也能彌補Excel的不足,還有一個吸引人的點,就是BI工具的可視化效果,在Excel中制作動態(tài)圖表或者高級的可視化圖表效果,需要經(jīng)過諸多復(fù)雜的步驟,用編程語言實現(xiàn),也需要一行行代碼調(diào)整,才能得到想要的效果,但是在BI工具中,簡單拖拽設(shè)置,就能制作出令人驚艷的可視化圖表
不過,因為BI工具是非開源的,所以在功能上有局限性,如果產(chǎn)品沒有設(shè)計某一項功能,可能就沒有辦法完成分析工作。這時候python或R這類編程語言就顯得更加靈活了,只要代碼寫得好,基本沒有實現(xiàn)不了的東西。
而且在數(shù)據(jù)挖掘、機器學(xué)習(xí)領(lǐng)域,BI和Excel就更加無能為力了,在這個階段,python語言是一個絕佳選擇,它對復(fù)雜的數(shù)據(jù)處理、建模、預(yù)測更加游刃有余。
最后總結(jié)一下,工具的選擇要根據(jù)自身需要,而不是哪個火學(xué)哪個,只有最適合自己的才是最好的。
像財務(wù)、人事、運營這類的基礎(chǔ)業(yè)務(wù)分析,excel完全就夠用了,如果想要提升效率,追求可視化效果,BI工具也是不錯的選擇,完全沒有必要花費極大的精力去湊Python的熱鬧,當然如果你對編程很感興趣,那當我沒說。
最后再來回答最后一個問題,為啥python這么火?
當然是因為好賺錢,以前互聯(lián)網(wǎng)興起的時候,各種java、C++的培訓(xùn)炒的火熱,培訓(xùn)機構(gòu)大把大把撈金,現(xiàn)在大數(shù)據(jù)時代來了,數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能的概念又火了,一片新的韭菜地出現(xiàn)在眼前,培訓(xùn)機構(gòu)們還能放著這么多的錢不賺?
隨便拿個業(yè)內(nèi)TOP數(shù)據(jù)分析師的薪資給你畫個月入2W的大餅,實際上你入職大概率6-8K,而且你在培訓(xùn)課里學(xué)到那點皮毛功夫還要面臨全網(wǎng)被割韭菜的各行各業(yè)神仙轉(zhuǎn)行來和你PK,最后能找到心儀工作的少之又少。
更慘的是一些無辜小白,在原來的崗位干的好好的,看到營銷文案,一股心血來潮要轉(zhuǎn)行,花了大價錢大精力去報班學(xué)python,最后轉(zhuǎn)行也轉(zhuǎn)不了,反而沒在自身的崗位上有什么提升,掙大錢的夢破碎了。
最后再強調(diào)一下,大部分的數(shù)據(jù)分析師本質(zhì)是個業(yè)務(wù)輔助崗位,核心是對業(yè)務(wù)的理解能力和數(shù)據(jù)敏感度,像下面這張圖里寫的,那些告訴你學(xué)python就能入門數(shù)據(jù)分析,學(xué)python就能做好數(shù)據(jù)分析的,百分之90都是為了賺錢,另外,想轉(zhuǎn)行數(shù)據(jù)分析的也要慎重考慮,這一行也并不是你想象的那么美好。