自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="1znle"><track id="1znle"></track></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

數(shù)據(jù)科學(xué)家最常用的10種算法

作者：hang編輯 2016-09-22 14:28:33

大數(shù)據(jù) 算法

最新的KDnuggets調(diào)查統(tǒng)計(jì)了數(shù)據(jù)科學(xué)家們實(shí)際工作中最常使用的算法，在大多數(shù)學(xué)術(shù)和產(chǎn)業(yè)界，都有驚人發(fā)現(xiàn)哦!

最新的KDnuggets調(diào)查統(tǒng)計(jì)了數(shù)據(jù)科學(xué)家們實(shí)際工作中最常使用的算法，在大多數(shù)學(xué)術(shù)和產(chǎn)業(yè)界，都有驚人發(fā)現(xiàn)哦!

根據(jù)Gregory Piatetsky, KDnuggets，最新的調(diào)查問題是：在最近的12個(gè)月中，你在實(shí)際數(shù)據(jù)科學(xué)相關(guān)應(yīng)用中用到了那些模型/算法?

于是就有了以下基于844份答卷的結(jié)果。

◆ ◆ ◆

排名前十的算法和它們?cè)谕镀闭咧兴急壤?/strong>

圖1：數(shù)據(jù)科學(xué)家最常用的10大算法，所有算法見文末表格

每個(gè)受訪者平均用到了8.1種算法，這相比于 2011 的相似調(diào)查顯示的結(jié)果有了巨大的增長。

相比2011年對(duì)數(shù)據(jù)分析算法的調(diào)查，我們注意到最常用的方法仍然是回歸，聚類，決策樹/規(guī)則以及可視化。比例增幅最大的是(增幅=%2016/%2011 -1)：

Boosting算法，提升了40%。由2011年的23.5%提升倒2016年的40%

文本挖掘(Text Mining)，提升了30%。從27.7%提升到35.9%

可視化(Visualization)，提升了27%。從38.3%提升到48.7%

時(shí)間序列/序列分析(Time series/Sequence analysis)，提升了25%。從29.6%提升到37.0%

異常檢測(Anomaly/Deviation detection)，提升了19%，從16.4%提升到19.5%

組合方法(Ensemble methods)，提升了19%，從28.3%提升到33.6%

支持向量機(jī)(SVM)，提升了18%，從28.6%提升到33.6%

回歸(Regression)，提升了16%，從57.9%提升到67.1%

◆ ◆ ◆

2016年新秀中最為流行的是

K-最近鄰法(K-nearestneighbors), 46%

主成分分析(PCA), 43%

隨機(jī)森林(Random Forests), 38%

優(yōu)化(Optimization), 24%

神經(jīng)網(wǎng)絡(luò)-深度學(xué)習(xí)(Neural networks - Deep Learning), 19%

奇異值分解(Singular ValueDecomposition), 16%

◆ ◆ ◆

降幅最大的是

關(guān)聯(lián)規(guī)則(Associationrules),下降了47%，從28.6%降為15.3%

Uplift modeling,下降了36%，從4.8% 降為3.1%(出人意料的低，因?yàn)橛泻芏嘞嚓P(guān)文獻(xiàn)發(fā)表)

因子分析(Factor Analysis),下降了24%，從18.6%降為14.2%

存活分析(SurvivalAnalysis),下降了15%，從9.3%將為7.9%

下面的表格顯示了不同的算法類型的使用場所：監(jiān)督算法，無監(jiān)督算法，元算法和其它算法。應(yīng)用類型未知(NA，4.5%)或者其它職業(yè)類型(3%)的不包括在內(nèi)。

表1：不同職業(yè)類型的算法使用

我們注意到，幾乎所有的人都在使用監(jiān)督學(xué)習(xí)算法。政府和產(chǎn)業(yè)界的數(shù)據(jù)科學(xué)家們使用的算法類型比學(xué)生和科學(xué)界要多。產(chǎn)業(yè)數(shù)據(jù)科學(xué)家們更傾向于使用元算法。

◆ ◆ ◆

不同職業(yè)類型最常用的10大算法+深度學(xué)習(xí)情況

接下來，我們分析了不同職業(yè)類型最常用的10大算法+深度學(xué)習(xí)情況

表2: 不同職業(yè)類型的10大算法+深度學(xué)習(xí)

為了更清楚地展示這些差異，我們用一個(gè)公式來計(jì)算不同職業(yè)類型的算法使用率偏倚：

偏倚=某種職業(yè)類型的算法使用率/所有職業(yè)類型的算法使用率-1

圖2：不同場所的算法使用率偏倚

我們注意到，產(chǎn)業(yè)數(shù)據(jù)科學(xué)家們更傾向于用回歸，可視化，統(tǒng)計(jì)，隨機(jī)森林和時(shí)間序列。政府/非盈利組織則更傾向于使用可視化，主成分分析和時(shí)間序列。學(xué)術(shù)界的研究人員們更多的用到主成分分析和深度學(xué)習(xí)。學(xué)生們普遍使用的算法較少，但多用到文本挖掘和深度學(xué)習(xí)。

接下來，我們看看某一具體地域的參與度，表示整體的KDnuggets用戶。

參與調(diào)查人員的地區(qū)分布：

美國/加拿大, 40%

歐洲, 32%

亞洲, 18%

拉丁美洲, 5.0%

非洲/中東, 3.4%

澳大利亞/新西蘭, 2.2%

在2011年的調(diào)查中，我們把產(chǎn)業(yè)和政府兩個(gè)行業(yè)的被調(diào)查者合為一組，把學(xué)術(shù)研究者和學(xué)生合為一組，然后計(jì)算行業(yè)政府組的算法使用親切度：

(行業(yè)政府組的算法使用率/學(xué)術(shù)學(xué)生組的算法使用率)/(行業(yè)政府組的人數(shù)/學(xué)術(shù)學(xué)生組的人數(shù))-1

因此，親切度為0的算法表示它在產(chǎn)業(yè)/政府組和學(xué)術(shù)學(xué)生組使用率相同。越高IG親切度說明該算法越偏向于產(chǎn)業(yè)，結(jié)果越小則算法越偏向于學(xué)術(shù)。

最偏向于“產(chǎn)業(yè)算法”是：

uplifting modelling, 2.01

異常檢測, 1.61

存活分析, 1.39

因子分析, 0.83

時(shí)間序列/序列分析, 0.69

關(guān)聯(lián)規(guī)則, 0.5

盡管uplift modeling再次成為最偏向于“行業(yè)算法”，令人吃驚的卻是它使用率極低，只有3.1%，是整個(gè)調(diào)查中比例最低的。

最偏向于“學(xué)術(shù)算法”是：

神經(jīng)網(wǎng)絡(luò), -0.35

樸素貝葉斯, -0.35

支持向量機(jī), -0.24

深度學(xué)習(xí), -0.19

最大期望, -0.17

下圖顯示了所有算法及其產(chǎn)業(yè)/學(xué)術(shù)親切度。

圖3：KDnuggets調(diào)研：數(shù)據(jù)科學(xué)家使用最多的算法：產(chǎn)業(yè)與學(xué)術(shù)領(lǐng)域?qū)Ρ?/strong>

下表是所有算法調(diào)研結(jié)果的細(xì)節(jié)，分別是2016年受訪人群使用比例，2011年使用比例，變化(2016年比例/2011年比例-1)以及上文提及的產(chǎn)業(yè)親切度。

表3：KDnuggets2016調(diào)研：數(shù)據(jù)科學(xué)家使用的算法

下方的表格是所有算法的調(diào)研結(jié)果細(xì)節(jié)，不同列依次代表的是：

排名: 根據(jù)使用比例的排名

算法：算法名稱

類型: S – 有監(jiān)督, U – 無監(jiān)督, M – 元(meta), Z – 其他方法,

在2016年調(diào)查中使用該算法的人數(shù)比例

在2016年調(diào)查中使用該算法的人數(shù)比例

變化：(%2016 / %2011 -1),

產(chǎn)業(yè)親切度見上文的解釋.

表4：KDnuggets 2016 調(diào)研：數(shù)據(jù)科學(xué)家使用的算法

責(zé)任編輯：趙寧寧來源：大數(shù)據(jù)文摘

數(shù)據(jù)科學(xué)家算法

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

KDnuggets調(diào)查|數(shù)據(jù)科學(xué)家最常用的10種算法
最新的KDnuggets調(diào)查統(tǒng)計(jì)了數(shù)據(jù)科學(xué)家們實(shí)際工作中最常使用的算法，在大多數(shù)學(xué)術(shù)和產(chǎn)業(yè)界，都有驚人發(fā)現(xiàn)哦！

2016-12-06 08:47:18

數(shù)據(jù)算法

KDnuggets 官方調(diào)查：數(shù)據(jù)科學(xué)家最常用的十種算法
最新一期的KDnuggets調(diào)查展示了一份數(shù)據(jù)科學(xué)家使用度最高的算法列表，這份列表中包含了很多驚喜，包括最學(xué)術(shù)的算法和面向產(chǎn)業(yè)化的算法。

2016-10-21 19:44:08

數(shù)據(jù)科學(xué)家算法

數(shù)據(jù)科學(xué)家必備的10種機(jī)器學(xué)習(xí)算法
沒有人能否認(rèn)這樣的事實(shí)：作為數(shù)據(jù)科學(xué)家的實(shí)踐者，我們必須了解一些通用機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)算法，這將幫助我們解決所遇到的新領(lǐng)域問題。本文對(duì)通用機(jī)器學(xué)習(xí)算法進(jìn)行了簡要的闡述，并列舉了它們的相關(guān)資源，從而幫助你能夠快速掌握其中的奧妙。

2018-03-27 11:02:55

蹩腳數(shù)據(jù)科學(xué)家的10種現(xiàn)象
對(duì)數(shù)據(jù)科學(xué)的熱情以及掌握一定的技能，這是成功的關(guān)鍵。如果你只是假裝有興趣，或者并不具備重要的技能，總有一天，你會(huì)原形畢露。

2016-05-11 10:36:16

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)大數(shù)據(jù)

蹩腳數(shù)據(jù)科學(xué)家的10種現(xiàn)象
在當(dāng)今這個(gè)時(shí)代，解雇員工同樣代價(jià)不菲，錯(cuò)誤的招聘會(huì)使你的公司倒退幾個(gè)月。所以，在尋找優(yōu)秀的數(shù)據(jù)科學(xué)家時(shí)，你也應(yīng)該警惕蹩腳數(shù)據(jù)科學(xué)家的跡象。如果發(fā)現(xiàn)以下10個(gè)跡象中的任何一個(gè)，你都應(yīng)該迅速遠(yuǎn)離。

2017-01-23 16:00:25

數(shù)據(jù)科學(xué)家大數(shù)據(jù)數(shù)學(xué)家

偽數(shù)據(jù)科學(xué)家 VS 真數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家在商業(yè)分析、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等領(lǐng)域也是通才，比如會(huì)掌握這些專業(yè)知識(shí)：健壯性、實(shí)驗(yàn)設(shè)計(jì)、算法復(fù)雜度、儀表盤和數(shù)據(jù)可視化。一些數(shù)據(jù)科學(xué)家也是數(shù)據(jù)策略師——他們可以開發(fā)數(shù)據(jù)收集策略，并使用數(shù)據(jù)來發(fā)現(xiàn)可操作的、能對(duì)商業(yè)產(chǎn)生影響的見解。這就要求數(shù)據(jù)科學(xué)家具有創(chuàng)造性，能根據(jù)業(yè)務(wù)要求，制定分析、提出解決方案。

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

數(shù)據(jù)科學(xué)家需要知道的5種圖算法
作為數(shù)據(jù)科學(xué)家，我們對(duì)pandas、SQL或任何其他關(guān)系數(shù)據(jù)庫非常熟悉。我們習(xí)慣于將用戶的屬性以列的形式顯示在行中。但現(xiàn)實(shí)世界真的是這樣嗎

2019-12-11 19:19:19

算法數(shù)據(jù)科學(xué)家代碼

數(shù)據(jù)科學(xué)家必備技能Top10
數(shù)據(jù)科學(xué)領(lǐng)域的發(fā)展日新月異。只有掌握了數(shù)據(jù)科學(xué)的基礎(chǔ)知識(shí)，才能夠繼續(xù)學(xué)習(xí)那些更加高深的概念，比如深度學(xué)習(xí)和人工智能。

2019-11-29 18:03:27

數(shù)學(xué)R語言算法

數(shù)據(jù)科學(xué)家用得最多的十種數(shù)據(jù)挖掘算法
產(chǎn)業(yè)數(shù)據(jù)科學(xué)家們更傾向于使用回歸、可視化、統(tǒng)計(jì)、隨機(jī)森林和時(shí)間序列。政府非營利更傾向于使用可視化、主成分分析和時(shí)間序列。學(xué)術(shù)研究人員更傾向于使用主成分分析和深度學(xué)習(xí)。學(xué)生普遍使用更少的算法，但多為文本挖掘和深度學(xué)習(xí)。

2017-06-01 16:25:36

數(shù)據(jù)挖掘算法

數(shù)據(jù)科學(xué)家正在崛起
2012年美國大選成就了一批大數(shù)據(jù)技術(shù)人員，也拉開了數(shù)據(jù)科學(xué)家們崛起的大幕。數(shù)據(jù)科學(xué)家們，都與具體的行業(yè)緊密相聯(lián)，有扎實(shí)的統(tǒng)計(jì)基礎(chǔ)，也有豐富的行業(yè)經(jīng)驗(yàn)。

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家

如何成為數(shù)據(jù)科學(xué)家？ 數(shù)據(jù)科學(xué)家的職責(zé)技能要求和薪水構(gòu)成
數(shù)據(jù)科學(xué)是一個(gè)快速增長和利潤豐厚的行業(yè)，BLS預(yù)測到這個(gè)行業(yè)職位將在2024年前增長11%。數(shù)據(jù)科學(xué)家目前正是一個(gè)熱門的職業(yè)。在Glassdoor的美國50年最佳職位報(bào)告中，數(shù)據(jù)科學(xué)家的職位空缺，薪水和總體滿意度評(píng)級(jí)，在各行業(yè)中均名列前茅。

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

數(shù)據(jù)科學(xué)家“恐怖故事”
本文講的是作者VincentVanhoucke所經(jīng)歷的恐怖故事，完全真實(shí)，這些小事故也決定了這位Google首席科學(xué)家的職業(yè)生涯。

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

數(shù)據(jù)科學(xué)家職位最常問的40道面試題
機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)被看作是下一次工業(yè)革命的驅(qū)動(dòng)器。這也意味著有許許多多令人激動(dòng)的初創(chuàng)公司正在起步成長、尋找專業(yè)人士和數(shù)據(jù)科學(xué)家。它們可能是未來的特斯拉、谷歌。

2016-12-19 10:05:01

數(shù)據(jù)面試題 PCA

數(shù)據(jù)科學(xué)家必知的5種圖算法
在萬物相連的世界里，用戶并不是獨(dú)立的個(gè)體，彼此之間都有某種聯(lián)系。構(gòu)建機(jī)器學(xué)習(xí)模型時(shí)，有時(shí)也會(huì)將這種聯(lián)系放入模型中。

2019-09-26 08:43:34

算法數(shù)據(jù)庫 Python

“科學(xué)家”CIO
——暢享網(wǎng)專訪上海大學(xué)信息化工作辦公室主任徐偉憑借領(lǐng)導(dǎo)上大信息辦在上大信息化建設(shè)中取得的顯著成果，上大信息辦主任徐偉在高校信息化圈子內(nèi)名聲遠(yuǎn)揚(yáng)，圈子內(nèi)對(duì)徐偉也一直有著“預(yù)言家”、“廠商殺手”、“科學(xué)家”等稱號(hào)。日前，暢享網(wǎng)采訪了上大信息辦主任徐偉，深入了解上大信息化建設(shè)6年來走過的點(diǎn)點(diǎn)滴滴，試圖呈現(xiàn)上大信息化建設(shè)中的創(chuàng)新、經(jīng)驗(yàn)、...

2012-12-06 15:36:55

CIO

數(shù)據(jù)科學(xué)家須知的19個(gè)機(jī)器學(xué)習(xí)算法
我們討論了機(jī)器學(xué)習(xí)算法、及其不同的分類，其中包括：回歸算法、基于實(shí)例的算法、正則化算法、決策樹算法、貝葉斯算法、聚類算法、關(guān)聯(lián)規(guī)則學(xué)習(xí)算法、人工神經(jīng)網(wǎng)絡(luò)算法、深度學(xué)習(xí)算法、降維算法、模型融合算法、監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、樸素貝葉斯分類器算法等。

2018-10-18 09:00:00

機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)算法數(shù)據(jù)科學(xué)家

為什么數(shù)據(jù)科學(xué)家都鐘情于最常見的正態(tài)分布？
對(duì)于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)工程師們來說，正態(tài)分布是世界上所有概率模型中最重要的一個(gè)。即使你沒有參與過任何人工智能項(xiàng)目，也一定遇到過高斯模型，今天就讓我們來看看高斯過程為什么這么受歡迎。

2018-06-21 08:04:25

數(shù)據(jù)科學(xué)正態(tài)分布高斯

數(shù)據(jù)科學(xué)家需要掌握的10個(gè)基本統(tǒng)計(jì)技術(shù)
毫無疑問，數(shù)據(jù)科學(xué)家所做的具體工作內(nèi)容將會(huì)進(jìn)一步拓展。隨著機(jī)器學(xué)習(xí)等技術(shù)變得越來越普遍，深度學(xué)習(xí)等新興領(lǐng)域?qū)ρ芯咳藛T和工程師的需求得到了巨大的推動(dòng)，數(shù)據(jù)科學(xué)家們?cè)趧?chuàng)新和技術(shù)進(jìn)步的浪潮中再次嶄露頭角。

2017-11-21 14:42:30

數(shù)據(jù)科學(xué)統(tǒng)計(jì)學(xué)習(xí)機(jī)器學(xué)習(xí)

應(yīng)對(duì)數(shù)據(jù)科學(xué)家短缺的6種方法
在2019年1月發(fā)布的一份報(bào)告中，商業(yè)和就業(yè)社交媒體網(wǎng)站LinkedIn根據(jù)薪資、職位空缺數(shù)量和同比增長數(shù)據(jù)，將數(shù)據(jù)科學(xué)家列為了2019年最有前途的工作。該報(bào)告稱，今年預(yù)計(jì)將會(huì)有4000多個(gè)的數(shù)據(jù)科學(xué)家職位空缺，比2018年增加56%。數(shù)據(jù)科學(xué)領(lǐng)域的頂級(jí)技能包括了數(shù)據(jù)挖掘、數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。

2019-06-05 15:17:45

數(shù)據(jù)科學(xué)家需要了解的5種采樣方法
筆者按，采樣問題是數(shù)據(jù)科學(xué)中的常見問題，對(duì)此，WalmartLabs的數(shù)據(jù)科學(xué)家RahulAgarwal分享了數(shù)據(jù)科學(xué)家需要了解的5種采樣方法，筆者編譯整理如下。

2019-07-30 12:05:20

數(shù)據(jù)科學(xué)采樣算法

相似話題

數(shù)據(jù)分析
 1669內(nèi)容

數(shù)據(jù)可視化
 308內(nèi)容

商業(yè)智能
 138內(nèi)容

Hadoop
839內(nèi)容
全部話題

同話題下的熱門內(nèi)容

終于明白了！數(shù)字化轉(zhuǎn)型的本質(zhì)、價(jià)值與路徑五個(gè)案例快速熟悉 Pandas 常用操作 AI、BI、大數(shù)據(jù)與數(shù)據(jù)科學(xué)的底層邏輯 AI三駕馬車：數(shù)據(jù)、算力和算法，誰更重要？從“人找服務(wù)”到“服務(wù)找人”：政務(wù)數(shù)字化轉(zhuǎn)型的智治新范式你的數(shù)據(jù)有多好，你的模型就有多強(qiáng)字節(jié)面試：StarRocks 中如何優(yōu)化大表 JOIN？AI數(shù)據(jù)自動(dòng)化：是革命還是泡沫？揭開“全流程替代”的真相

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動(dòng)

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學(xué)院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動(dòng)態(tài)

站點(diǎn)地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號(hào)ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號(hào)：110108002980號(hào)
營業(yè)執(zhí)照京ICP備09067568號(hào)

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請(qǐng)勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動(dòng)科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟(jì)新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會(huì)議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號(hào)

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷

^{<blockquote id="i1g8q"></blockquote>}