對大數(shù)據(jù)開發(fā)工程師的能力新要求
阿里流傳著這樣一句話,“一切業(yè)務數(shù)據(jù)化,一切數(shù)據(jù)業(yè)務化”。
作為大數(shù)據(jù)從業(yè)者,你一定明白有數(shù)據(jù)是一回事,可要想讓數(shù)據(jù)發(fā)揮價值、成為生產(chǎn)力是另一回事。手里得有兩把刷子,才能成為大數(shù)據(jù)圈兒的“大拿”!
如何實現(xiàn)智能路經(jīng)檢測,查詢出符合條件的路徑詳情及符合路徑的用戶數(shù)?
關于有序漏斗轉(zhuǎn)化,如果想要更準確一些該怎么做?
面對大量的訂單記錄,如果想按照地域、時間、來源等維度等進行實時分析,該怎么實現(xiàn)?
對于海量評論數(shù)據(jù),想要查詢好評差評的比例,如果進行準實時分析想要秒級實現(xiàn)的話,如何來完成?
不管是面試還是實際工作過程中,數(shù)據(jù)工程師要時時刻刻面對這些層出不窮的技術(shù)演進。隨著數(shù)據(jù)的爆發(fā)式增長以及指標維度多元化, T+1 的數(shù)據(jù)報表早已無法滿足需求。如何在保證高時效性的同時,讓數(shù)據(jù)發(fā)揮更大的價值是篩選“王牌”大數(shù)據(jù)開發(fā)工程師的重要門檻。
01
對大數(shù)據(jù)開發(fā)工程師的能力新要求
OLAP型大數(shù)據(jù)開發(fā)能力
隨著全行業(yè)數(shù)字化轉(zhuǎn)型和新基建時代的到來,對技術(shù)人才提出了更高的要求。
對數(shù)字化轉(zhuǎn)型的公司來說,公司的業(yè)務可以分為兩類:一類是OLTP型的業(yè)務,一類是OLAP型的業(yè)務。對優(yōu)秀的IT工程師來說,我們需要同時具備OLTP的技術(shù)能力和OLAP的技術(shù)能力。進一步來講對于前者,我們需要具備線上滿足高并發(fā)、高可用、高擴展的開發(fā)能力,比如根據(jù)公司業(yè)務發(fā)展階段給出優(yōu)雅的線上微服務架構(gòu)解決方案;對于后者,我們需要具備線下海量大數(shù)據(jù)處理和分析的開發(fā)能力,比如電商公司收入趨勢的分析和預測、抖音等短視頻平臺日活用戶分析等開發(fā)解決方案。
伴隨數(shù)字化轉(zhuǎn)型的向廣向深發(fā)展,具備OLAP型大數(shù)據(jù)開發(fā)能力的工程師在人才市場上將具備更強的競爭力和更豐厚的薪資收入,也必然成為新時代的香餑餑。
必備技術(shù)棧
那么如何成為大數(shù)據(jù)開發(fā)工程師呢?
和大多數(shù)人一樣,非常看好大數(shù)據(jù)的前景。剛好前幾天,問過前58集團大數(shù)據(jù)首席架構(gòu)師孫玄(江湖人稱“玄姐”)兩個問題。
怎么才能成為獨當一面的大數(shù)據(jù)開發(fā)工程師呢?
大數(shù)據(jù)開發(fā)工程師需要具備大數(shù)據(jù)采集、大數(shù)據(jù)ETL、大數(shù)據(jù)計算、大數(shù)據(jù)存儲、大數(shù)據(jù)建模、大數(shù)據(jù)智能分析等等能力。
那在這么多能力中,哪些能力是最核心最重要的呢?
大數(shù)據(jù)計算是整個大數(shù)據(jù)生態(tài)非常重要的一環(huán),一定要牢牢掌握。
你一定知道,大數(shù)據(jù)計算根據(jù)業(yè)務需求不同,又分為離線批量計算和在線實時計算。比如基于MapReduce的海量計算屬于離線計算范疇;基于ClickHouse的計算屬于實時在線計算范疇。特別是支持任意指標、任意維度并且秒級給出結(jié)果的在線實時計算的技術(shù)能力,對大數(shù)據(jù)開發(fā)工程師而言就更加重要了。
(100M數(shù)據(jù)集跑分結(jié)果,1億數(shù)據(jù)查詢速度:ClickHouse比Vertica快5倍,比Hive快279倍,比MySQL快801倍!)
為了應對大數(shù)據(jù)高時效性的發(fā)展需求,很多實時計算和在線交互式數(shù)據(jù)分析技術(shù)應運而生。實時OLAP數(shù)據(jù)庫ClickHouse正是這樣一款計算處理引擎,是業(yè)界公認的一匹黑馬,它能夠優(yōu)雅解決企業(yè)任意指標和任意維度組合,并且實時給出處理結(jié)果的復雜業(yè)務場景需求。
02
玩轉(zhuǎn)ClickHouse
怎么學能快速應用?
當然,通過看書、看文章的確是一種自學方式,不過ClickHouse相對復雜,它在很多方面不像其他系統(tǒng)那樣高度自動化,而正是某些看似不夠自動化的設計,反過來卻在使用中帶來了極大的靈活性。如果把數(shù)據(jù)庫比作汽車,那么ClickHouse儼然就是一輛手動擋的賽車,對技術(shù)人員來說會有諸多不適應。找到專家?guī)ьI才是掌握從原理到真實線上使用的更快更有效的學習方式。
(ClickHouse 框架)