每種編程語(yǔ)言的平均收入
幾周前我提到過(guò)如何通過(guò)使用git的提交元數(shù)據(jù)(metadata)和Rapleaf API 來(lái)收集Github上熱門組織的一些統(tǒng)計(jì)資料(日志, 每個(gè)組織的數(shù)據(jù))?,F(xiàn)在我又對(duì)這些數(shù)據(jù)按編程語(yǔ)言而不是組織進(jìn)行劃分產(chǎn)生了興趣。網(wǎng)上關(guān)于各編程語(yǔ)言對(duì)應(yīng)的屌絲程序員的描述比比皆是,但我還是很好奇它們 是如何與現(xiàn)實(shí)中的人們對(duì)應(yīng)起來(lái)的。
幾周前我提到過(guò)如何通過(guò)使用git的提交元數(shù)據(jù)(metadata)和Rapleaf API 來(lái)收集Github上熱門組織的一些統(tǒng)計(jì)資料(日志, 每個(gè)組織的數(shù)據(jù))。
現(xiàn) 在我又對(duì)這些數(shù)據(jù)按編程語(yǔ)言而不是組織進(jìn)行劃分產(chǎn)生了興趣。網(wǎng)上關(guān)于各編程語(yǔ)言對(duì)應(yīng)的屌絲程序員的描述比比皆是,但我還是很好奇它們是如何與現(xiàn)實(shí)中的人們 對(duì)應(yīng)起來(lái)的。一開始,我想先簡(jiǎn)單地統(tǒng)計(jì)一下每種編程語(yǔ)言使用者的年齡、收入和性別。基于我已經(jīng)收集的數(shù)據(jù),這一工作還是比較輕松的:
- 對(duì)于統(tǒng)計(jì)每個(gè)repo使用的編程語(yǔ)言,我使用Github自帶的語(yǔ)言統(tǒng)計(jì)結(jié)果。例如,Github估計(jì)這個(gè)項(xiàng)目中75%是java代碼。
- 統(tǒng)計(jì)了每個(gè)項(xiàng)目中某種語(yǔ)言代碼占用大于50%的那些貢獻(xiàn)者的收入
- 過(guò)濾出那些收入點(diǎn)>100的編程語(yǔ)言
下面是收入的統(tǒng)計(jì)結(jié)果,升序排列:
Language | Average Household Income ($) | Data Points |
Puppet | 87,589.29 | 112 |
Haskell | 89,973.82 | 191 |
PHP | 94,031.19 | 978 |
CoffeeScript | 94,890.80 | 435 |
VimL | 94,967.11 | 532 |
Shell | 96,930.54 | 979 |
Lua | 96,930.69 | 101 |
Erlang | 97,306.55 | 168 |
Clojure | 97,500.00 | 269 |
Python | 97,578.87 | 2314 |
JavaScript | 97,598.75 | 3443 |
Emacs Lisp | 97,774.65 | 355 |
C# | 97,823.31 | 665 |
Ruby | 98,238.74 | 3242 |
C++ | 99,147.93 | 845 |
CSS | 99,881.40 | 527 |
Perl | 100,295.45 | 990 |
C | 100,766.51 | 2120 |
Go | 101,158.01 | 231 |
Scala | 101,460.91 | 243 |
ColdFusion | 101,536.70 | 109 |
Objective-C | 101,801.60 | 562 |
Groovy | 102,650.86 | 116 |
Java | 103,179.39 | 1402 |
XSLT | 106,199.19 | 123 |
ActionScript | 108,119.47 | 113 |
這是上表對(duì)應(yīng)的柱狀圖:
對(duì)于大多數(shù)語(yǔ)言的排名還是比較符合預(yù)期的,得出了一下結(jié)論:
- Haskell是一種非常學(xué)術(shù)化的(academic)語(yǔ)言,因此學(xué)術(shù)界不會(huì)以薪資而聞名。
- PHP是一種非常通用的語(yǔ)言,普通的、年輕的、低收入的程序員都可以上手。
- 從圖譜右側(cè)***的部分可看出,Java和ActionScript多用于企業(yè)級(jí)軟件的開發(fā),因此其薪資待遇是相當(dāng)?shù)目捎^。
另一方面,由于對(duì)某些語(yǔ)言,像XSLT, Puppet, CoffeeScript不太熟悉,大家知道為什么這些語(yǔ)言排名較高或收入較低嗎?感謝告知。
需要說(shuō)明的是:
- 所有這些數(shù)據(jù)都來(lái)自開源項(xiàng)目,因而可能無(wú)法精確地體現(xiàn)那些閉源開發(fā)者們的收入水平。
- Rapleaf并沒(méi)有完全統(tǒng)計(jì)所有人的收入,因此數(shù)據(jù)可能存在偏差。
- 數(shù)據(jù)(年齡、性別……)有誤差
- 沒(méi)有對(duì)Github上所有項(xiàng)目進(jìn)行統(tǒng)計(jì),因此結(jié)論可能不具有代表性。
***,對(duì)統(tǒng)計(jì)結(jié)果或方法有任何想法或建議請(qǐng)告知我,我還會(huì)再出一份按年齡、性別排名的編程語(yǔ)言報(bào)告。