自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

2018年最熱門的深度學(xué)習(xí)框架?這份科學(xué)的排行榜可以告訴你

開發(fā) 開發(fā)工具 深度學(xué)習(xí)
在本文中,為了評(píng)估 2018 到底哪些框架比較流行,作者從領(lǐng)英職位需求、谷歌搜索熱度、Medium 文章數(shù)、arXiv 論文數(shù)和 GitHub 活躍度等方面審視不同的框架。

深度學(xué)習(xí)仍然是機(jī)器學(xué)習(xí)領(lǐng)域最熱門的技術(shù)。深度學(xué)習(xí)框架變化迅速,僅僅五年前 Theano 還一枝獨(dú)秀,而最近出現(xiàn)了各種各樣的框架,它們都有不同的特性。在本文中,為了評(píng)估 2018 到底哪些框架比較流行,作者從領(lǐng)英職位需求、谷歌搜索熱度、Medium 文章數(shù)、arXiv 論文數(shù)和 GitHub 活躍度等方面審視不同的框架。

我想尋找值得關(guān)注的框架,于是就開發(fā)了這個(gè)排行榜。Python 語言是深度學(xué)習(xí)使用的熱門語言,因此我主要關(guān)注能兼容 Python 的框架。我使用了來自 7 個(gè)不同類別的 11 個(gè)數(shù)據(jù)源,并用來評(píng)估框架使用、用戶興趣和流行度。

數(shù)據(jù)地址:

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

2018.09 by Jeff Hale

顯然,TensorFlow 是絕對(duì)贏家,還有一些令人驚訝的發(fā)現(xiàn)。我們一起來看一下~

角逐者

我們考慮的這些框架都已經(jīng)開源,它們主要都使用 Python,一些可以兼容 R 或其他語言。

TensorFlow

TensorFlow 是絕對(duì)冠軍。在 GitHub 活躍度、谷歌搜索、Medium 文章數(shù)、亞馬遜書籍和 arXiv 論文這些數(shù)據(jù)源上,它所占的比重都是最大的。它還擁有最多的開發(fā)者用戶,以及出現(xiàn)在最多的在線職位描述中。

Keras

Keras 具備「一個(gè)為人類而非機(jī)器設(shè)計(jì)的 API」。它在幾乎所有評(píng)估中都是第二流行的框架。Keras 的后端可以基于 TensorFlow、Theano 或 NLTK。如果你是剛?cè)腴T深度學(xué)習(xí)的新手,使用 Keras 是不錯(cuò)的選擇。

PyTorch

PyTorch 是第三流行的框架,也是第二流行的獨(dú)立框架。它比 TensorFlow 出現(xiàn)時(shí)間晚,但發(fā)展迅速。PyTorch 允許定制化,而 TensorFlow 不能。PyTorch 是由 Facebook 支持開發(fā)的。

Theano

Theano 由蒙特利爾大學(xué)于 2007 年開發(fā),是最老的 Python 深度學(xué)習(xí)框架?,F(xiàn)在它的流行度下降了很多,其開發(fā)者和維護(hù)者宣布將停止更新維護(hù) Theano。不過,Theano 仍然頻繁出現(xiàn)在職位描述中。

MXNet

MXNet 由 Apache 孵化。它和 Theano 的得分很接近,目前處于第四流行的深度學(xué)習(xí)庫。它擁有大量貢獻(xiàn)者、搜索結(jié)果、相關(guān)書籍和學(xué)術(shù)文章。但是它的使用率比去年有所下降,搜索它的用戶也不是很多。

CNTK

CNTK 是微軟推出的認(rèn)知工具包。它的推出旨在與谷歌、Facebook 競(jìng)爭(zhēng),但并沒有獲得特別多的使用。

FastAI 基于 PyTorch 構(gòu)建。其 api 受到 Keras 的啟發(fā),所需代碼甚至還更少。FastAI 正為今年 10 月的 1.0 版本發(fā)布而經(jīng)歷重寫,F(xiàn)astAI 背后的男人 Jeremy Howard 曾經(jīng)是 Kaggle 比賽冠軍以及 Kaggle 主席。

你可能會(huì)問為什么 FastAI 會(huì)在這個(gè)名單上,職業(yè)開發(fā)者對(duì)它沒什么需求,它的使用也不廣泛。但是,它通過免費(fèi)在線課程平臺(tái) fast.ai 獲得了大批用戶。同時(shí),F(xiàn)astAI 也很強(qiáng)大易用,它的使用率可能會(huì)很快增長。

Caffe 不在本名單中,因?yàn)樗案碌?Caffe2,2018 年 3 月 Caffe2 被融合進(jìn) PyTorch。

評(píng)估準(zhǔn)則

為了全面地評(píng)估深度學(xué)習(xí)框架的流行程度,我選擇以下類別和角度為它們進(jìn)行評(píng)分:

  • 在線職位描述
  • KDnuggets 使用調(diào)查
  • 谷歌搜索熱度
  • Medium 文章數(shù)量
  • Amazon 書籍?dāng)?shù)量
  • arXiv 論文數(shù)
  • GitHub 活躍度

支持本次評(píng)分的數(shù)據(jù)都在今年 9 月 16 號(hào)收集完,原數(shù)據(jù)地址為:

https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit?usp=sharing

我使用了 plotly 數(shù)據(jù)可視化庫和 Python 的 Pandas 庫來探索并展示各框架的流行度,對(duì)于交互性的 plotly 圖表,請(qǐng)看 Kaggle Kernel:

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

在線職位描述

深度學(xué)習(xí)框架在目前的職場(chǎng)中有著什么樣的需求?我搜索了領(lǐng)英的職位描述,具體而言為 Simply Hired、Monste 和 Angel List。

TensorFlow 在職位描述中明顯要比其它框架出現(xiàn)得更多,所以如果你希望從事深度學(xué)習(xí),最好還是學(xué)習(xí)這個(gè)框架。

我搜索職位描述的方法是采用「machine learning」+「框架名」,所以 TensorFlow 就是采用「machine learning TensorFlow」來搜索的。我其實(shí)還采用了其它搜索方法,但還是這種搜索方法給出的結(jié)果更好。此外,額外的關(guān)鍵詞對(duì)于區(qū)分不同框架而言是非常有必要的,因?yàn)槲易畛踹€嘗試在這個(gè)分析中加入 Caffe 庫。

使用情況

KDnuggets 是一個(gè)流行的數(shù)據(jù)科學(xué)網(wǎng)站,他們調(diào)查了世界各地?cái)?shù)據(jù)科學(xué)家的軟件庫使用情況,他們會(huì)向用戶問道:

在過去的 12 個(gè)月中,你在實(shí)際項(xiàng)目上會(huì)使用哪些分析、大數(shù)據(jù)、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具?

以下展示了大家對(duì)框架的偏好程度:

大家對(duì)框架的偏好程度

Keras 在使用總量上非常驚人,它幾乎和 TensorFlow 一樣。所以說美國老板對(duì)員工的 TensorFlow 技能有壓倒性的需求,而在國際上 Keras 使用的頻率同樣也非常高。

僅有這一個(gè)類別是包含國際數(shù)據(jù)的,因?yàn)槠渌悇e加入國際數(shù)據(jù)可能會(huì)非常麻煩。KDnuggets 做這一份報(bào)告已經(jīng)好幾年了,我在這個(gè)分析中只用了今年的數(shù)據(jù),但我們需要注意 Theano、MXNET 和 CNTK 相比于去年在使用上有所滑落。

谷歌搜索熱度

在最大的搜索引擎上度量各框架的搜索熱度,這也是一個(gè)非常好的流行度衡量方法。我們?cè)?Google Trends 中搜索過去幾年的搜索熱度歷史,雖然它并不提供具體的搜索數(shù)值,但還是能提供相對(duì)圖表。

谷歌搜索熱度

截至 2018 年 9 月 15 日,TensorFlow 平穩(wěn)占據(jù) 78% 的搜索比重。PyTorch 接近 Keras,而其它框架的搜索量在 3 左右或低于 3。

下面我們來簡(jiǎn)要看一下搜索量隨著時(shí)間的變化,以了解更多歷史背景。下面的表格展示了近兩年的谷歌搜索情況。

TensorFlow 藍(lán)色、Keras 紅色、PyTorch 黃色、Theano 綠色。

TensorFlow、Keras 和 PyTorch 的搜索量在 2016 年末和 2017 年增長迅速。有趣的是,它們?cè)谧罱鼛讉€(gè)月增長緩慢。我們可以從中看到某種季節(jié)性,暑假下降寒假上升。

谷歌搜索趨勢(shì)只允許同時(shí)對(duì)比五項(xiàng),因此其它庫在另外一個(gè)表上進(jìn)行對(duì)比。所有這些結(jié)果都是在美國區(qū)域的搜索結(jié)果。盡管搜索關(guān)鍵詞 Theano 和 Keras 還有其它意思,但那些意思主要是在美國以外使用。

Medium 文章數(shù)

我計(jì)算了多個(gè)出版物類型,出現(xiàn)較早的框架在出版方面比較有優(yōu)勢(shì),未來排行榜將關(guān)注出版物數(shù)量的變化。下面來看 Medium 文章。

這次出現(xiàn)了新的冠軍。從 Medium 文章提及量來看,Keras 超越 TensorFlow,但也算勢(shì)均力敵。FastAI 的表現(xiàn)也超出以往。我猜測(cè)出現(xiàn)上述結(jié)果的原因是 Keras 和 FastAI 對(duì)新手比較友好。深度學(xué)習(xí)新人對(duì)它們有很大興趣,而 Medium 是一個(gè)教程論壇。

下面我們來看哪些框架在亞馬遜上的實(shí)體書比較多。

亞馬遜書籍

我在亞馬遜 Books->Computer Science 分類下搜索了每個(gè)深度學(xué)習(xí)框架,結(jié)果如下:

TensorFlow 又一次奪得冠軍。MXNET 相關(guān)書籍的數(shù)量超出預(yù)期,且多于 Theano。PyTorch 的書相對(duì)較少,但這有可能是因?yàn)樵摽蚣苓€比較年輕。該評(píng)估標(biāo)準(zhǔn)對(duì)年頭久的庫較為有利,因?yàn)槌霭鏁枰獣r(shí)間。

或許 Theano 在學(xué)術(shù)論文方面會(huì)比較好吧。

arXiv 論文

arXiv 是在線數(shù)據(jù)庫,大部分機(jī)器學(xué)習(xí)學(xué)術(shù)論文都會(huì)發(fā)表在 arXiv 上。我在該網(wǎng)站上搜索了每個(gè)框架,結(jié)果如下:

同樣,TensorFlow 的學(xué)術(shù)論文較多。最大的意外是其它框架的學(xué)術(shù)論文總數(shù)不敵 TensorFlow。注意 Keras 在 Medium 和亞馬遜上的流行度比學(xué)術(shù)論文要高得多。PyTorch 在這塊表現(xiàn)也不好,應(yīng)該還是因?yàn)槌霈F(xiàn)時(shí)間較短的緣故。

GitHub 活躍度

GitHub 活躍度是框架流行度的另一個(gè)指標(biāo)。我分別調(diào)查了 star、fork、watcher 和貢獻(xiàn)者數(shù)量,因?yàn)樗鼈儐为?dú)的意義要比整體的組合的意義更大。

很明顯,TensorFlow 是 GitHub 上最流行的框架,擁有大量活躍用戶。FastAI 還不錯(cuò),畢竟才誕生一年。有趣的是各個(gè)框架的貢獻(xiàn)者數(shù)量要比其它三個(gè)指標(biāo)接近得多。

收集和分析這些數(shù)據(jù)之后,是時(shí)候總結(jié)一下了。

計(jì)算排行榜分?jǐn)?shù)步驟

我用以下步驟創(chuàng)建排行榜得分:

  1. 將所有特征縮放到區(qū)間 [0,1] 之間。
  2. 聚合職位描述和 GitHub 活躍度這兩個(gè)子類別。
  3. 根據(jù)下圖中的權(quán)重對(duì)類別進(jìn)行加權(quán)。
  4. 如上圖所示,在線職位描述和 KDnuggets 使用調(diào)查組成了分?jǐn)?shù)的一半,而網(wǎng)頁搜索、出版物和 GitHub 關(guān)注度組成了另一半。這種分割應(yīng)該是對(duì)不同類別最合適的平衡。

  5. 為了方便理解,將加權(quán)后的得分乘 100。
  6. 將每個(gè)框架的各類別得分相加,整合成最終的排行榜得分。

Google Sheet 地址:

https://docs.google.com/spreadsheets/d/1mYfHMZfuXGpZ0ggBVDot3SJMU-VsCsEGceEL8xd1QBo/edit#gid=0

下圖是對(duì)子類別進(jìn)行加權(quán)相加之后的得分。

Jupyter Notebook 地址:

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

下圖再次展示了最終的排行榜得分。

2018.09 by Jeff Hale

100 是最高分,在每一類中代表第一名。TensorFlow 得分接近 100,這也不足為奇,因?yàn)檫@一框架幾乎包攬了所有類別的第一名。點(diǎn)擊以下鏈接獲取圖中未顯示信息:

https://www.kaggle.com/discdiver/deep-learning-framework-power-scores-2018

展望未來

TensorFlow 現(xiàn)在獨(dú)占鰲頭,這種局勢(shì)短期內(nèi)似乎不會(huì)改變。然而,考慮到深度學(xué)習(xí)世界中事物的發(fā)展速度,TensorFlow 被趕超也不是不可能。

時(shí)間會(huì)證明 PyTorch 是否會(huì)超越 TensorFlow,就像 React 超越 Angular 一樣。PyTorch 和 React 都是 Facebook 支持的靈活框架,用戶通常認(rèn)為這兩個(gè)框架比谷歌的同類框架易用。

FastAI 能吸引課程之外的用戶嗎?它有大量的學(xué)生,使用 API 比 Keras 更容易。

給學(xué)習(xí)者的建議

如果你正考慮學(xué)習(xí)其中一種框架且具備 Python、numpy、pandas、sklearn 和 matplotlib 的技能,我建議你從 Keras 入手。該框架用戶基礎(chǔ)很大,在求職時(shí)非常有用,Medium 上有很多相關(guān)文章,API 也很易用。

如果你已經(jīng)學(xué)過 Keras,那么選擇下一個(gè)要學(xué)習(xí)的框架可能有點(diǎn)困難。我建議你去學(xué) TensorFlow 或 PyTorch,而且要好好學(xué),這樣才能做出良好的深度學(xué)習(xí)模型。

TensorFlow 顯然是為迎合需求而學(xué)習(xí)的框架,但 PyTorch 的易用性和靈活性使得它使用起來更加友好。

一旦掌握了這些框架,我建議你留意 FastAI。如果想同時(shí)學(xué)習(xí)基礎(chǔ)和高級(jí)深度學(xué)習(xí)技能,請(qǐng)查看 FastAI 的免費(fèi)在線課程,F(xiàn)astAI 1.0 承諾幫助用戶輕松實(shí)施最新的深度學(xué)習(xí)策略并快速迭代。

無論你選擇了哪個(gè)框架,我希望你現(xiàn)在深入了解一下哪個(gè)框架需求量最大、使用最頻繁、最受關(guān)注。

原文鏈接:

https://towardsdatascience.com/deep-learning-framework-power-scores-2018-23607ddf297a

【本文是51CTO專欄機(jī)構(gòu)“機(jī)器之心”的原創(chuàng)譯文,微信公眾號(hào)“機(jī)器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責(zé)任編輯:趙寧寧 來源: 51CTO專欄
相關(guān)推薦

2016-12-06 18:07:49

編程語言排行榜

2019-08-02 09:26:24

深度學(xué)習(xí)框架排行榜

2020-01-03 07:40:19

開源JavaGitHub

2022-06-17 12:10:07

RPA機(jī)器人流程自動(dòng)化

2013-08-23 09:41:19

2018-01-17 18:06:56

數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)排名

2018-02-08 09:19:34

linux

2018-08-27 15:53:43

編程語言javaPython

2017-02-10 08:55:42

2020-04-12 22:18:40

前端開發(fā)Realworld

2019-02-14 11:46:46

Python 開發(fā)編程語言

2013-04-01 09:50:15

Web框架Web

2023-03-15 08:03:31

2018-07-10 08:40:36

JavaScript機(jī)器學(xué)習(xí)框架

2019-06-28 15:43:50

編程語言程序員Java

2018-03-07 10:41:16

GitHub開源項(xiàng)目谷歌

2020-02-14 09:19:12

編程語言JavaPython

2020-02-19 20:20:43

APP排行榜用戶

2019-07-23 14:14:59

編程語言JavaPython

2021-09-23 10:50:42

編程語言Python排行
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)