自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

值得推薦的5種數(shù)據(jù)科學工具

大數(shù)據(jù) 數(shù)據(jù)分析
最近我們采訪了各個行業(yè)中經(jīng)驗豐富的數(shù)據(jù)科學家,詢問他們最常使用的工具。下面是我們從中精心挑選的5個工具。

數(shù)據(jù)和分析為數(shù)字化轉型提供了燃料,而企業(yè)充分發(fā)揮這些燃料的唯一途徑是,為其統(tǒng)計學家、數(shù)據(jù)專家和企業(yè)分析專家提供正確的數(shù)據(jù)科學工具,從而為企業(yè)提供寶貴的洞察力。

數(shù)據(jù)科學工具

無論是用于直接統(tǒng)計分析、機器學習建模還是可視化,數(shù)據(jù)科學工具對于建設數(shù)據(jù)驅動的企業(yè)文化都至關重要。

最近我們采訪了各個行業(yè)中經(jīng)驗豐富的數(shù)據(jù)科學家,詢問他們最常使用的工具。下面是我們從中精心挑選的5個工具。

1. Python

與用于創(chuàng)建自定義算法的編程方法不同,Python不是一種獨特的軟件,但它是很多數(shù)據(jù)科學家的首選。在最近數(shù)據(jù)科學網(wǎng)站KDnuggets對2052名用戶進行的分析/數(shù)據(jù)科學軟件調(diào)查中,Python被65.6%的受訪者列為首選工具。

Cindicator公司首席數(shù)據(jù)科學家Alexander Osipenko表示:“我們將Python用于數(shù)據(jù)科學和后端,這為我們提供了快速開發(fā)和機器學習模型部署。對于我們來說,同樣重要的是確保部署工具的安全性。”

Katie Malone最初是一名粒子物理學家,現(xiàn)在她是Civis Analystic公司的數(shù)據(jù)科學研究團隊的負責人之一,她指出,Python是她作為物理學家首選的數(shù)據(jù)科學工具,而現(xiàn)在她在商業(yè)世界也在繼續(xù)使用它。對于她而言,最吸引她的是圍繞Python強大的開源生態(tài)系統(tǒng),這使她能夠利用各種數(shù)據(jù)科學庫來幫助她解決特定的分析問題。

她表示:“這個社區(qū)擁有非常充滿活力的開源人群,他們使用Python來解決有趣的數(shù)據(jù)科學問題。”

Wovenware公司創(chuàng)新總監(jiān)兼首席數(shù)據(jù)科學家Leslie De Jesus對此表示贊同,她非常依賴Python庫。

“我們使用 Python庫(包括Scrapy)用于網(wǎng)絡抓取,并能夠從互聯(lián)網(wǎng)上提取數(shù)據(jù)并將其上傳到數(shù)據(jù)框架進行分析,”De Jesus說。 “同時,我們使用Pandas和NumPy Python庫進行數(shù)據(jù)分析和矩陣操作。這些都有助于我們更快創(chuàng)建代碼,而NumPy還允許復雜的廣播功能。”

Tiger Analytics公司數(shù)據(jù)科學和創(chuàng)新主管Niranjan Krishnan解釋說,Python的用例非常多。

Krishnan說:“我們已經(jīng)成功部署Python數(shù)據(jù)科學模型,用于優(yōu)化直接面向客戶的營銷活動和人壽保險承保,以及改善在線廣告的實時定價。”

這里的缺點是,Python是基于代碼,這里需要高水平的編程和分析技能。

他指出:“而Knime和Alteryx是優(yōu)秀的菜單驅動的低代碼替代品,也可供一般數(shù)據(jù)科學家和業(yè)務分析師使用。”

2. R

與Python類似,R是很多數(shù)據(jù)科學專業(yè)人員喜愛的另一種編程語言,它更加簡單且更專注于數(shù)據(jù)科學。在KDnuggets調(diào)查中,R排名第三,48.5%的受訪者將其列為首選數(shù)據(jù)科學工具之一。

Civis Analytics公司的Malone表示,R具有非常復雜的機器學習和統(tǒng)計功能,這是她的團隊成員除Python之外的常用選擇。

她指出:“這取決于具體情況,我們有多種需求,所以這兩個我們都喜歡。從統(tǒng)計和定量社會科學方面來看,R更多一些。”

根據(jù)Untapt公司首席數(shù)據(jù)科學家Jon Krohn的說法,R是他的首選數(shù)據(jù)探索工具。

他指出:“我可以快速查看平均值、中位數(shù)和四分位數(shù)等摘要統(tǒng)計數(shù)據(jù);快速創(chuàng)建不同的圖表;以及創(chuàng)建測試數(shù)據(jù)集,這些可輕松地共享并導出位CSV格式。”

3. Jupyter Notebook

從數(shù)據(jù)可視化和數(shù)據(jù)通信來看,很多數(shù)據(jù)科學團隊的數(shù)據(jù)科學工具列表中還會有Jupyter Notebook。

HackerRank公司數(shù)據(jù)科學副總裁SofusMacskássy表示:“Jupyter Notebook支持R和Python,對數(shù)據(jù)訪問和可視化提供強大庫支持。該工具還使團隊能夠輕松導出工作簿用于演示,它正成為數(shù)據(jù)科學領域的標準。”

對于Anexinet公司數(shù)字和分析服務高級副總裁Michael Golub而言,Jupyter的另一個好處是,可靈活使用最受歡迎的數(shù)據(jù)科學庫。Golub解釋說Jupyter是他團隊最喜歡的協(xié)作開發(fā)環(huán)境。

Golub稱:“Jupyter Notebook是我們協(xié)作數(shù)據(jù)科學項目工作的首選工具,在涉及需要教育的時候,它也非常有用。”

此外,Untapt公司的Krohn稱,Jupyter Notebook是交互式構建原型模型的絕佳工具。

他表示:“在Untapt,我們利用Jupyter Notebook來編寫原型代碼,也用于打印數(shù)據(jù)表、摘要指標和圖表。”

[[248255]]

4. Tableau

在硬數(shù)據(jù)科學團隊和更多以業(yè)務為中心的分析人員之間,Tableau可提供良好的橋梁。

Entersoft Security公司的SEO高級主管Pooja Pandey表示:“對于數(shù)據(jù)科學家和數(shù)據(jù)科學新手來說,這是很棒的工具。這是一個快速儀表板工具,可提供可視化洞察力和分析數(shù)據(jù),它有著非常短的學習曲線。”

Tableau的可視化和報告功能的速度可為各種用戶提供洞察力。

QuotesAdvisor.com首席執(zhí)行官Sophie Miles表示:“它可以很快部署、易于學習且非常直觀。通過Tableau,該公司的不同部門可根據(jù)需要制定詳盡的報告。

Miles解釋稱,由于該儀表板非常靈活,因此對數(shù)據(jù)組合的臨時請求數(shù)量有所減少。因此,QuotesAdvisor.com的效率提高了95%。她說道:“現(xiàn)在人們花更多的時間來思考問題,而不是生成報告。”

5. Keras

根據(jù)日立Vantara公司首席技術官辦公室首席數(shù)據(jù)科學家Wei Lin表示,他最常用的數(shù)據(jù)科學工具是Python、R和Keras。他使用Python和R用于上述所有原因,而利用Keras的深度學習功能。

Lin稱:“Keras是使用Python編寫的開源神經(jīng)網(wǎng)絡庫,以快速通過深度神經(jīng)網(wǎng)絡進行實驗。并且,它能夠運行在TensorFlow、微軟Cognitive Toolkit或Thea。”

Kera的優(yōu)勢在于高維模式匹配。

他表示:“例如,圖像和自然語言處理以及支持完善的深度學習分析模型,包括卷積神經(jīng)網(wǎng)絡和短期記憶。”

根據(jù)Cindicator公司的Osipenko表示,Keras的最大吸引點在于它可幫助節(jié)省大量時間。

他指出:“我們添加新工具的主要標準是,它是否能讓你作為數(shù)據(jù)科學家的工作變得更輕松。這里的例子就是Keras,這個開源高級包裝器,可大大加快開發(fā)神經(jīng)網(wǎng)絡的過程。任何在TensorFlow編寫神經(jīng)網(wǎng)絡的人都會明白我在說什么。即使Keras不完美,但它可以改變這個開發(fā)流程,讓你的代碼對其他開發(fā)人員更具可讀性。”成都加米谷大數(shù)據(jù)培訓機構,小班教學,免費試聽。

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2021-04-26 08:28:55

數(shù)據(jù)科學機器學習數(shù)據(jù)科學工具

2018-10-08 12:08:32

數(shù)據(jù)科學數(shù)據(jù)清洗數(shù)據(jù)分析

2021-01-07 17:11:16

數(shù)據(jù)科學數(shù)據(jù)分析IT

2023-06-19 10:30:04

Python工具數(shù)據(jù)科學工具

2018-12-17 09:00:00

大數(shù)據(jù)數(shù)據(jù)科學工具

2022-06-01 13:52:11

開源大數(shù)據(jù)

2021-04-20 09:00:00

數(shù)據(jù)分析數(shù)據(jù)挖掘工具

2021-02-07 09:00:00

PostgreSQL數(shù)據(jù)庫工具

2023-12-01 15:10:56

2021-08-10 08:00:00

微服務開發(fā)工具

2018-03-06 11:02:43

數(shù)據(jù)可視化標配

2021-04-07 09:00:00

Web工具漏洞

2021-07-09 05:24:24

云監(jiān)控工具開源云平臺

2022-07-14 13:27:40

數(shù)據(jù)安全網(wǎng)絡安全

2021-03-23 08:00:00

工具開發(fā)審查

2019-06-26 10:34:05

數(shù)據(jù)科學工具數(shù)據(jù)集

2021-04-16 09:55:20

數(shù)據(jù)科學數(shù)據(jù)編程語言

2018-06-29 16:00:56

數(shù)據(jù)科學家數(shù)據(jù)清理數(shù)據(jù)分析

2020-06-10 07:54:11

PythonSQL數(shù)據(jù)科學

2017-06-01 16:25:36

數(shù)據(jù)挖掘算法
點贊
收藏

51CTO技術棧公眾號