操什么語言的程序員掙得多?
幾個星期前,我在博客中描述我如何使用 Git 的元數(shù)據(jù)和 RapLeaf 的 API 來構(gòu)建 GitHub 組織的人口統(tǒng)計概況(查看博客文章點此, 查看每個組織的數(shù)據(jù)點此)。
我也曾嘗試用不同方法截取數(shù)據(jù),得出針對每個編程語言而不是組織的人口統(tǒng)計概況。有關(guān)使用不同編程語言的開發(fā)人員的刻板印象比比皆是,我很好奇它們 如何與現(xiàn)實掛鉤。從每個編程語言使用人群的基本信息如年齡、收入、性別開始分析,根據(jù)我手上既有的數(shù)據(jù),要做到這一點并不困難:
- 我采用GitHub對每個數(shù)據(jù)資源庫編程語言組成情況的估算。例如,GitHub估計某個項目使用了75%的Java語言;
- 我從中得知每個項目中使用比例超過50%的是什么編程語言,某個項目中使用這一主要語言的開發(fā)人員是誰,并把他們的收入累加;
- 我進而篩選出得到大于100收入數(shù)據(jù)點的編程語言。
以下便是收入情況的統(tǒng)計,根據(jù)家庭平均收入由低到高排列:
同樣的數(shù)據(jù)以圖表的形式體現(xiàn)如下:
多數(shù)的排行結(jié)果大致符合我的預(yù)期:
- Haskell是種非常學(xué)術(shù)的語言,因此在收入方面并不可觀;
- PHP是種較為容易掌握的語言,方便非專業(yè)的或初級編程人員使用,也因此收入相對不高
- Java和ActionScript則被認為是高級的語言,多用于企業(yè)軟件的開發(fā),因此收入頗豐。
另一方面,我對處在低端和高端的某些語言并不十分了解,比如 XSLT, Puppet, and CoffeeScript , 也不清楚它們排名前后的原因。
我們也要看到使用這些數(shù)據(jù)得出結(jié)論的局限性:
- 這些項目是開源的,無法適用于封閉程式開發(fā)人員的報酬;
- Rapleaf數(shù)據(jù)不涉及總收入信息,樣本可能因此有所偏差;
- 我忽略了年齡、性別等因素對造成數(shù)據(jù)分布偏態(tài)的可能性;
- 我沒有分析所有的GitHub數(shù)據(jù)資源庫,作為樣本的用戶資料可能不具代表性。
綜上,即使在絕對值上有所偏差,這仍然是比較不同編程語言間相對收入差別的一個開始。
原文鏈接:http://bpodgursky.wordpress.com/2013/08/21/average-income-per-programming-language/