Kaggle調(diào)查:2018年數(shù)據(jù)科學(xué)家常用(和推薦)的編程語言榜單
摘要
Kaggle對超過23,000名數(shù)據(jù)專業(yè)人員的調(diào)查結(jié)果為數(shù)據(jù)專業(yè)人員勾勒ei了最流行的編程語言。到目前為止,Python是最流行的編程語言,其次是SQL和R.毫不奇怪,Python是有抱負(fù)的數(shù)據(jù)科學(xué)家最推薦的編程語言,Python幾乎也成為數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的默認(rèn)編程語言。
數(shù)據(jù)科學(xué)的實(shí)踐需要使用分析工具,技術(shù)和編程語言來幫助數(shù)據(jù)專業(yè)人員從數(shù)據(jù)中提取見解和價值。Kaggle最近對近24,000名數(shù)據(jù)專業(yè)人員進(jìn)行的調(diào)查顯示,Python,SQL和R是最流行的編程語言。到目前為止,最受歡迎的是Python(使用率為83%)。此外,四分之三的位數(shù)據(jù)專業(yè)人士建議有抱負(fù)的數(shù)據(jù)科學(xué)家首先學(xué)習(xí)Python。
圖1. 2018年數(shù)據(jù)科學(xué)家中最流行的編程語言
Kaggle于2018年10月對23,859名數(shù)據(jù)專業(yè)人員進(jìn)行了全球調(diào)查(2018年機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)原始調(diào)查數(shù)據(jù)下載鏈接)。調(diào)查內(nèi)容包括有關(guān)數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),教育等方面的各種問題。Kaggle發(fā)布了原始調(diào)查數(shù)據(jù)(見上面的鏈接)。本文主要分析了調(diào)查數(shù)據(jù)中關(guān)于2018年數(shù)據(jù)專業(yè)人員使用的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)編程語言的情況。
最常用的編程語言
該調(diào)查包括一個問題,“您定期使用哪些編程語言?(選擇所有適用的選項(xiàng))。“平均而言,數(shù)據(jù)專業(yè)人員在2018年使用了3種(中位數(shù))語言。如圖1所示,2018年的頂級編程語言是Python(83%的受訪者表示他們使用這種語言),其次是SQL(44%)和R(36%)。前十種語言由C / C ++,Java,Javascript / Typescript,Bash,MATLAB,C#/。Net和Visual Basic / BVA完成。
在確定為數(shù)據(jù)科學(xué)家的數(shù)據(jù)專業(yè)人員中,93%使用Python,54%使用SQL,46%使用R.
該調(diào)查還詢問了受訪者,“您最常使用哪種特定的編程語言?”如圖2所示,超過一半(54%)的數(shù)據(jù)專業(yè)人員最常使用Python。剩下的編程語言不太受歡迎,只有13%的數(shù)據(jù)專業(yè)人士說他們使用R,8%的人說他們使用SQL。
比較2017年的編程語言使用情況,我們發(fā)現(xiàn)Python的使用率增加了23個百分點(diǎn)(2017年使用率為60%)SQL使用量增加了2個百分點(diǎn)(2017年使用率為44%)。然而,R使用率下降了10個百分點(diǎn)(2017年使用率為46%)。
數(shù)據(jù)科學(xué)家最推薦哪種編程語言?
該調(diào)查還詢問了受訪者會向有志成為數(shù)據(jù)科學(xué)家的人推薦哪種首選編程語言(見圖3)。結(jié)果顯示,4位數(shù)據(jù)專業(yè)人員中有3位會推薦Python作為首先學(xué)習(xí)的編程語言。其他編程語言的推薦率要低得多(12%的受訪者推薦使用R; 5%的受訪者推薦使用SQL。
將統(tǒng)計(jì)范圍縮小到數(shù)據(jù)科學(xué)家身份的數(shù)據(jù)專業(yè)人士時,推薦數(shù)據(jù)為:Python(78%),R(13%)和SQL(5%)