自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

2017數(shù)據(jù)科學與機器學習行業(yè)現(xiàn)狀調(diào)查:Python是最受歡迎的語言

人工智能 機器學習 后端
今年,Kaggle有史以來第一次對人工智能領域進行了深度調(diào)查,旨在全面了解數(shù)據(jù)科學和機器學習的概況。本次調(diào)查收到了16000 多份答卷,龐大的調(diào)查數(shù)據(jù)為我們提供了有關從業(yè)者、業(yè)界最新動態(tài)以及如何進入該行業(yè)的數(shù)據(jù)支撐。

[[209261]]

今年,Kaggle有史以來***次對人工智能領域進行了深度調(diào)查,旨在全面了解數(shù)據(jù)科學和機器學習的概況。本次調(diào)查收到了16000 多份答卷,龐大的調(diào)查數(shù)據(jù)為我們提供了有關從業(yè)者、業(yè)界***動態(tài)以及如何進入該行業(yè)的數(shù)據(jù)支撐。以下報告包括本次調(diào)查的幾個主要結果,其中包括:

  1. 盡管Python很可能是機器學習最常用的編程語言,但統(tǒng)計學家使用最多的是 R 語言。
  2. 數(shù)據(jù)科學家的平均年齡在 30 歲左右,但是這個數(shù)字在不同的國家有所不同。例如,印度受訪者的平均年齡要比澳大利亞的小 9 歲。
  3. 被調(diào)查者教育程度最多是碩士,但在工資***的(超過15萬美元)人群中,擁有博士學位的人則更多。

Kaggle 已經(jīng)公開了該調(diào)查的匿名數(shù)據(jù)集,以供大家進行研究,可以從此處下載:https://www.kaggle.com/kaggle/kaggle-survey-2017。

誰在工作中與數(shù)據(jù)打交道?

分析數(shù)據(jù)從業(yè)者的方式有很多種,本文將從有關數(shù)據(jù)科學從業(yè)者的工作、背景等人口統(tǒng)計學信息開始。

年齡多大?

從下圖可見,本次調(diào)查對象的平均年齡大約為 30 歲,但各個國家的這個值有所不同。例如印度調(diào)查對象的平均年齡就比澳大利亞的小了 9 歲。 

 

目前的就業(yè)狀況如何?

受調(diào)查者中,有 65.7% 表示自己有全職工作。

 

職位是什么?

盡管我們把數(shù)據(jù)科學家定義為使用代碼分析數(shù)據(jù)的人,但我們發(fā)現(xiàn)數(shù)據(jù)科學領域可涵蓋的工作非常多。比如在伊朗和馬來西亞,數(shù)據(jù)科學從業(yè)者***的工作頭銜是“科學家或者研究員”。

 

全職工作的年薪是多少?

中位數(shù)55441美元,不過由于很多人沒有全職工作(收入為 0),所以這一數(shù)字并不準確。盡管在我們的調(diào)查中“補償和福利”的重要性稍微比“職業(yè)發(fā)展機遇”低一些,不過知道什么是合理的補償依然不錯。在美國,一般機器學習工程師帶回家最多的東西是培根。

 

 

有131個回復由于超出***值而沒有顯示出來,但它們被算進了中位數(shù)。

***學歷是什么?

你需要再去讀一個學位嗎?通常來講,數(shù)據(jù)科學從業(yè)者中最常見的學歷是碩士,但是獲取***薪水(15萬到20萬美元,以及高于20萬美元)的那些人大多有著博士學位。

 

被調(diào)查者的大多是 30 歲左右,碩士學歷,年薪5.5萬美元左右,擁有數(shù)據(jù)科學家的職位。但實際情況并不如此平均。這些最初的幾個人口統(tǒng)計學問題只是展示了復雜的 Kaggle 數(shù)據(jù)科學社區(qū)在年齡、性別、國籍、工作職稱、薪水、經(jīng)驗和學歷方面的表層差異。

數(shù)據(jù)科學家的工作內(nèi)容是什么?

我們把數(shù)據(jù)科學家定義為寫代碼來分析數(shù)據(jù)的人。他們的日常工作內(nèi)容是什么呢?以下是我們的調(diào)查結果。

工作中使用哪些數(shù)據(jù)科學方法?

邏輯回歸是工作之中最為常用的數(shù)據(jù)科學方法,不過在神經(jīng)網(wǎng)絡使用更為頻繁的國家安全領域除外。總的來說,數(shù)據(jù)科學中更常見的還是使用經(jīng)典的機器學習算法,簡單的線性與非線性分類器是數(shù)據(jù)科學中最常見的算法,而功能強大的集成方法也十分受歡迎。

 

 

工作中使用最多的編程語言是什么?

Python是數(shù)據(jù)科學家最常用的語言,也是最常用的數(shù)據(jù)分析工具。不過,也有很多數(shù)據(jù)科學家仍然保持著對 R 語言的忠誠。

 

在工作中常用的數(shù)據(jù)類型是什么?

關系型數(shù)據(jù)是開發(fā)者在工作中最常用的數(shù)據(jù)類型,因為大多數(shù)產(chǎn)業(yè)工程師都十分關注于這種關系型數(shù)據(jù)。而學術研究者和國防安全產(chǎn)業(yè)則更注重于文本與圖像。

 

如何分享工作中的代碼?

盡管很多受訪者(58.4%)在工作使用 Git 來分享代碼,但大公司中的開發(fā)者更傾向于將代碼保留在本地,并通過像 Email 那樣的文件共享軟件來分享代碼。而初創(chuàng)公司可能需要在云中共享以保持更加敏捷的反應。 

 

工作中遇到的障礙主要有哪些?

臟數(shù)據(jù)(dirty data)顯然排在了***位,也就是說,數(shù)據(jù)科學家最常見的困擾就是需要對數(shù)據(jù)進行大量的預處理工作。除了數(shù)據(jù)預處理之外,還有很多問題困擾著數(shù)據(jù)科學家,比如說眾多的機器學習算法各有各的擅長領域,所以了解它們的性能也會有一些困難。

 

數(shù)據(jù)科學家初學者如何進入這個領域?

當開始一個新的職業(yè)生涯的時候,參考別人的成功經(jīng)驗會很有幫助。我們調(diào)查了在數(shù)據(jù)科學行業(yè)工作的人們,詢問他們是如何入門的。以下是我們最喜歡的幾條建議:

你們會推薦數(shù)據(jù)科學家新手***學哪門語言?

每一位數(shù)據(jù)科學家都有自己的對選擇***門語言的想法。事實證明,那些僅使用 Python 或 R 語言的人們做出了正確的選擇。不過如果你問一下使用過 R 和 Python 的人們,他們有兩倍的可能會把 Python 推薦給你。

 

你們使用哪些數(shù)據(jù)科學學習資源?

數(shù)據(jù)科學是一個發(fā)展迅速的領域,有很多有價值的資源可以幫助你學習并保持業(yè)內(nèi)的***位置,從而不斷提升你的競爭力。已經(jīng)在數(shù)據(jù)科學領域中工作的人們會更多地使用 Stack Overflow Q&A,Conferences 和 Podcasts。如果想要發(fā)布內(nèi)容或開源軟件,請時刻記住剛進入這個領域的人們通常更多使用官方的文檔和觀看 Youtube 視頻。

 

 

你們在哪里獲取開源數(shù)據(jù)?

沒有數(shù)據(jù),就沒有數(shù)據(jù)科學。當需要學習數(shù)據(jù)科學技巧的時候,知道如何找到干凈的開源數(shù)據(jù)集用于練習和開發(fā)項目相當重要。很高興我們的數(shù)據(jù)集聚合器正發(fā)展為數(shù)據(jù)科學社區(qū)成員中使用最頻繁的工具。

 

如何找工作,并且又是如何找到的?

在尋找工作地時候,人們可能會去公司網(wǎng)站,或在指定技術方向的招聘信息中尋找機會,但是根據(jù)數(shù)據(jù)科學領域工作的人們的經(jīng)驗,這些方式無疑是最差的選擇。直接聯(lián)系招聘者或建立自己的網(wǎng)絡以進入這個領域才是他們的***。

 

注意:少于 50 名受訪者的組別被合并進了“Other”類中。其中一些柱狀圖為了美觀而做了縮放處理。 

責任編輯:龐桂玉 來源: 36大數(shù)據(jù)
相關推薦

2018-05-03 06:49:51

2018-02-01 13:42:47

編程語言開發(fā)者行業(yè)

2013-11-29 10:04:00

JavaScript遠程辦公

2017-07-25 09:53:37

Python機器學習

2017-07-26 12:31:19

Python核心庫數(shù)據(jù)科學

2018-01-11 17:22:20

PHP大數(shù)據(jù)開發(fā)

2017-09-08 10:00:39

PythonR語言開發(fā)

2017-03-23 15:15:09

開發(fā)人工智能機器學習

2015-04-14 14:23:38

蘋果Swift編程語言

2018-03-06 09:57:17

HackerRankPython編程

2015-12-29 10:06:25

2017-06-13 13:29:32

前端框架

2014-06-06 09:48:08

AdobeChrome瀏覽器

2022-03-25 09:57:18

C++Rust語言

2015-06-17 14:06:50

編程語言計算機編程語言

2013-10-28 16:15:01

ChromeFirefoxIE

2017-10-18 11:07:35

編程競技平臺挑戰(zhàn)

2023-06-06 10:07:21

CIO數(shù)據(jù)技能

2016-07-27 10:28:43

編程Python框架

2022-08-31 10:13:58

IT專業(yè)人士醫(yī)療保健
點贊
收藏

51CTO技術棧公眾號