爬了100萬碼農(nóng)招聘需求,我竟發(fā)現(xiàn)這些技能最值錢!
現(xiàn)在流行這么一句話:“找工作的時候,只有兩種專業(yè)——計算機系的和非計算機系的。”這些年,選擇了計算機系的人都在虐人模式的人生游戲里開掛,而非計算機系的人則在被虐模式里掙扎。
可是你注意到了嗎?即使是同為計算機專業(yè)的人,薪酬待遇也有高低差別。
計算機方向不同行業(yè)的薪酬價值,各大招聘網(wǎng)站每天寫來寫去,想必大家都看煩了。今天想和大家聊聊不同的東西——拋開物質(zhì)回報不談,身為碼農(nóng)的你,在工作中積累的各種技能,究竟值多少錢?
從招聘需求中挖掘技能價值
從招聘網(wǎng)站上爬取了 100 多萬條有關(guān)計算機專業(yè)的職位招聘文本,每條文本主包含職位工資和職位要求。我們要做的是從文本中識別“技能”,然后將其和職位工資關(guān)聯(lián)起來。
為了從職位要求描述中抽取技能,我們采用 weak-supervised learning 的方法。
我們首先對職位招聘文本進行句法分析,生成一個粗略的職位技能集合,這個集合是滿足語義樹正則表達式的所有名詞或動名詞短語。
然后進行少量的人工標(biāo)注建立訓(xùn)練集,采用 BiLSTM 的實體識別模型對招聘要求描述中的技能進行識別和抽取。
***不斷迭代“標(biāo)注-訓(xùn)練-預(yù)測”這個過程,優(yōu)化識別結(jié)果。
算法框架如圖所示:
圖一
***,將抽取的技能實體和職位工資關(guān)聯(lián),并人工分為了幾組。下面讓我們看看每一組技能價值的結(jié)果吧。
PHP 是***的語言?
好吧,這其實是一個廣為流傳的笑話。說是有三個程序員坐在格子間里編程。***個程序員一言不發(fā)。第二個程序員寫一會兒就按一下編譯,然后就玩會兒手機。
第三個程序員坐在那里瀏覽網(wǎng)頁,不時飛快的鍵入一些字符,看起來不怎么干活,盡在上網(wǎng)。請問,他們分別是用的什么語言?
圖二
言歸正傳,學(xué)會各種編程語言究竟能給你增加多少身價?
我們的文本挖掘結(jié)果顯示,排名***的編程語言是 Scala,價值 17.68k,而***一名是 C 語言,僅有 9.46k,是Scala的一半多一點。
Scala 作為大數(shù)據(jù)處理、建模的函數(shù)式語言,之所以這么值錢,主要源于前些年大數(shù)據(jù)產(chǎn)業(yè)的爆發(fā)。但隨著近幾年大數(shù)據(jù)產(chǎn)業(yè)重歸理性,以及 Scala 人才數(shù)量的增加,其價值也會逐漸回歸到正常價值。
還有一個在數(shù)據(jù)挖掘領(lǐng)域討論比較激烈的話題是,我該學(xué) Python 還是學(xué) R?
文本挖掘結(jié)果顯示,Python 的價值比 R 高出 30%。這可能是由于,在近年來越來越火的人工智能領(lǐng)域里,很多算法框架都優(yōu)先支持 Python,從而導(dǎo)致 Python 的價值逐年升高。所以,如果是初入數(shù)據(jù)分析行業(yè),還是學(xué) Python 吧。
其他的處座就不一一分析了,反正除了 PHP,你們都是***的語言……
碼農(nóng)生存工具鄙視鏈
聊完了編程語言,我們再聊聊碼農(nóng)們賴以生存的開發(fā)工具。
如今,做移動應(yīng)用的碼農(nóng)要使用 Recat Native、Weex、Cordova 或者 Ionic 等框架;做深度學(xué)習(xí)的算法工程師要使用 keras、theano 或者 tensorflow 等框架;做項目管理的架構(gòu)師要使用 word、excel 和 ppt 等。
那么,不同的開發(fā)工具,在價值上有多大的差別呢?
圖三
分析結(jié)果顯示,排名前三的工具分別是 keras、theano 和 tensorflow,其價值分別達到了 45k、29.29k 和 26.71k,在碼農(nóng)生存工具鄙視鏈上遠遠超過其他工具。
隨著人工智能概念的火爆和深度學(xué)習(xí)人才的稀缺,掌握這三款用來進行深度學(xué)習(xí)建模的框架,對碼農(nóng)個人價值的提升是極大的。
當(dāng)然,從另一個角度來看,這不合理的差距,也說明了深度學(xué)習(xí)產(chǎn)業(yè)存在泡沫。作為深度學(xué)習(xí)的算法工程師,也當(dāng)居安思危,多掌握一些其他的工具框架,以應(yīng)對泡沫破滅的到來。
另一個有趣的點是處于碼農(nóng)生存工具鄙視鏈***端的辦公三兄弟 word、excel 和 ppt。
十年前有一句老話說:寫 word 的不如寫 excel 的,寫 excel 的不如寫 ppt 的,寫 ppt 的不如講 ppt 的,講 ppt 的不如聽 ppt 的……
從鄙視鏈上來看,確實如此,ppt 技能價值 8.36k,excel 技能價值 8.05k,而 word 技能僅價值 7.30k。
在這一節(jié)的***,處座想說,其實生存工具鄙視鏈并不應(yīng)該存在,做深度學(xué)習(xí)的并不優(yōu)于做移動開發(fā)的。這不過是因為技術(shù)的發(fā)展和經(jīng)濟結(jié)構(gòu)的轉(zhuǎn)型而造成的誤會而已。
有人曾感嘆:“現(xiàn)在在公司的格子間里面哼哧哼哧做 ppt 的那些人,和當(dāng)年踩著縫紉機的女工們,其實沒有本質(zhì)的區(qū)別。”
是的,沒有本質(zhì)的區(qū)別,而我們的表現(xiàn)并沒有優(yōu)于我們的父母,這一切都不過是經(jīng)濟結(jié)構(gòu)轉(zhuǎn)型造成的生存工具的變化而已。
哦,不,還是有區(qū)別的。起碼紡織工做完一個成品以后,可不會被關(guān)到一個小房間里,投到一個大屏幕上,然后讓一群人圍著羞辱你……
學(xué)子們該如何選專業(yè)?
計算機專業(yè)出身的學(xué)生有很多方向可以選擇(你在問為什么只說計算機?請重讀本文***句話)——計算機硬件、大數(shù)據(jù)、人工智能、互聯(lián)網(wǎng)開發(fā)等。下面處座列出了這四個方向技能樹價值,供學(xué)子們選專業(yè)時參考。
計算機硬件技能價值表
圖四
大數(shù)據(jù)技能價值表
圖五
互聯(lián)網(wǎng)開發(fā)技能價值表
圖六
人工智能技能價值表
圖七
***,希望這篇文章對于處在人生節(jié)點的你能有所幫助,愿你能活在自己的節(jié)奏里,修煉內(nèi)功,點好自己的技能樹,讓自身越來越有價值。
文若
Gammar Lab成員
自然語言處理愛好者一枚,致力于將人工智能技術(shù)應(yīng)用于金融領(lǐng)域。
勃勃
Gammar Lab成員