自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

為什么每個人都應(yīng)該使用Kaggle?

大數(shù)據(jù)
下面,我將Kaggle的好處以及為什么每個數(shù)據(jù)科學(xué)家都應(yīng)該使用Kaggle的理由一一列出。還不知道這個神奇的網(wǎng)站的同學(xué)記得行動起來啦~

本文主要包含以下四大部分:

  • 介紹
  • Kaggle
  • 好處
  • 總結(jié)
為什么每個人都應(yīng)該使用Kaggle?

介紹

很多人在剛開始學(xué)習(xí)數(shù)據(jù)科學(xué)的時候都會不知所措,因為不知道在哪可以了解更多的代碼、數(shù)據(jù),甚至是最新的想法。但是在一個叫Kaggle的社區(qū),能夠滿足你的所有需求。

參加機器學(xué)習(xí)模型的精度競賽幾乎是所有數(shù)據(jù)科學(xué)了解Kaggle的開始,數(shù)以萬計的數(shù)據(jù)科學(xué)家通過Kaggle提交模型精度的分?jǐn)?shù),在此基礎(chǔ)上了解與他人模型的不同之處,并加以學(xué)習(xí)和改進(jìn)自己的數(shù)據(jù)模型。 

為什么每個人都應(yīng)該使用Kaggle?

通過與來自世界各地的數(shù)據(jù)科學(xué)家們的探討,不斷改變我們的思維方式和想法,提高模型的精度,進(jìn)而提高我們的排名,讓更多人看到我們的成果。

我們可以通過與他們的代碼進(jìn)行比較,來從那些聰明人的頭腦中學(xué)習(xí)新思想。

下面,我將Kaggle的好處以及為什么每個數(shù)據(jù)科學(xué)家都應(yīng)該使用Kaggle的理由一一列出。還不知道這個神奇的網(wǎng)站的同學(xué)記得行動起來啦~

Kaggle 

為什么每個人都應(yīng)該使用Kaggle?

什么是Kaggle?Kaggle是一個分享想法、獲得靈感、與其他數(shù)據(jù)科學(xué)家競爭、學(xué)習(xí)新信息和編碼技巧以及查看各種真實世界數(shù)據(jù)科學(xué)應(yīng)用實例的網(wǎng)站。在這里有很多數(shù)據(jù)集可以用于諸如視頻游戲銷售之類的簡單數(shù)據(jù),也有可用于諸如空氣污染數(shù)據(jù)之類的更為復(fù)雜和重要的數(shù)據(jù)。這些數(shù)據(jù)是真實的,且被引用過的,所以你可以在項目上訓(xùn)練和測試你的模型,最終幫助到其他有需要的人。

Kaggle還有很多其他有用的特性,比如數(shù)據(jù)、代碼、社區(qū)、靈感、競爭和課程。我將在下面詳細(xì)介紹這些好處,希望你能從Kaggle中找到自己需要的用途。

好處

Kaggle有幾個好處,我將在下面列出。這就是每個人都使用這個網(wǎng)站的原因,以及為什么你也應(yīng)該使用這個網(wǎng)站。

1、數(shù)據(jù)

在Kaggle上有許多公開的數(shù)據(jù)集可以使用,你可以看到一個數(shù)據(jù)集列表,可以搜索任何你要在自己的數(shù)據(jù)模型中用到的特定數(shù)據(jù)集,而且大多數(shù)數(shù)據(jù)集都是可以直接引用的CSV文件格式。有一些數(shù)據(jù)格式已經(jīng)不太流行但仍然有用,例如JSON格式的數(shù)據(jù)集、SQLite、archives和BigQuery。下面是三個目前最熱門的數(shù)據(jù)集的例子。

  • COVID-19開放研究數(shù)據(jù)集挑戰(zhàn)(https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge)
  • 揭開COVID-19的挑戰(zhàn)(https://www.kaggle.com/roche-data-science-coalition/uncover)
  • ProZorro.烏克蘭公共采購數(shù)據(jù)集(https://www.kaggle.com/oleksastepaniuk/prozorro-public-procurement-dataset)

2、代碼

Kaggle上有很多代碼。如果你想看到其他Kaggle用戶的示例代碼,你可以搜索包含代碼的Notebooks,很輕松即可找到,這些代碼都是經(jīng)過注釋的文本代碼,很容易就能看懂。我們可以學(xué)習(xí)、實踐,并看到別人如何執(zhí)行類似的問題。在該網(wǎng)站中,大多數(shù)人都是用Python編寫代碼,也有其他編程語言,比如R、SQLite和Julia。

代碼通常以 Notebook 形式(也稱為Jupyter Notebook)的.ipynb 文件中找到。你可以看到展示端到端機器學(xué)習(xí)模型的示例,其中包括數(shù)據(jù)攝取和清理、探索性數(shù)據(jù)分析、特征工程、基本模型創(chuàng)建、最終機器學(xué)習(xí)模型實現(xiàn)、結(jié)果輸出和解釋。這是大多數(shù)數(shù)據(jù)科學(xué)家的標(biāo)準(zhǔn)探索過程,也是一種簡單且易于遵循的格式。

  1. code languages supported on Kaggle: Python, R, SQLite, and Julia 

3、社區(qū)

與Medium、GitHub、Stack Overflow和LinkedIn一樣,Kaggle是一個數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師可以學(xué)習(xí)、成長和建立網(wǎng)絡(luò)的社區(qū)。你可以發(fā)布你的工作(數(shù)據(jù)、代碼和Notebooks),并且可以共享這些內(nèi)容來發(fā)展自己的社區(qū)。成為社區(qū)的一分子對我們自身也有好處,所以我強烈建議大家先從Kaggle開始發(fā)展自己的社區(qū),并擴展到其他社區(qū)。

4、靈感

因為有數(shù)據(jù)、代碼、社區(qū)、課程和競賽,你可能會受到很棒的啟發(fā)??吹狡渌嗽谝粋€有助于人或公司的競賽中表現(xiàn)出色是非常鼓舞人心的。如果你被困在下一步要學(xué)什么,或者如何執(zhí)行某個功能,也許可以看看某人如何以特定的方式實現(xiàn)某個模型,比如隨機森林,你可以在Kaggle上看到所有這些內(nèi)容,最終激勵你創(chuàng)造更好的工作。

5、競爭 

為什么每個人都應(yīng)該使用Kaggle?

如果你想測試一下自己的水平,看看你在同齡人中的排名,讓自己的簡歷更加漂亮,也能賺點外快,或者最重要的是可以幫助到別人,競爭是最好的方法。Kaggle提供了無數(shù)的競賽,贏得競賽,你就能得到上面所說的所有好處。上面的截圖顯示了前三名的比賽和他們各自的獎金。如你所見,這些不僅僅是有趣的比賽,它們也能給你帶來更好的收益。

通過參加Kaggle競賽,你可以看到自己在缺乏數(shù)據(jù)科學(xué)知識的情況下,與擁有近兩年數(shù)據(jù)科學(xué)經(jīng)驗的人相比,自己的表現(xiàn)如何。

當(dāng)成千上萬甚至數(shù)十萬的數(shù)據(jù)科學(xué)家為了達(dá)到同一目標(biāo)而競爭時,這對一個有理想、有追求的數(shù)據(jù)科學(xué)從業(yè)者有多大的推動作用?

6、課程

對我來說,最大的好處是發(fā)現(xiàn)Kaggle有數(shù)據(jù)科學(xué)課程。你可以選修14門課程,我個人喜歡一些SQL課程,作為數(shù)據(jù)科學(xué)家更需要SQL,而不僅僅是Python。與其他課程網(wǎng)站不同的還有機器學(xué)習(xí)的可解釋性和游戲人工智能和強化學(xué)習(xí)的介紹。以下是他們網(wǎng)站上的所有課程:https://www.kaggle.com/learn/overview

  1. Python
  2. 機器學(xué)習(xí)入門
  3. 中級機器學(xué)習(xí)
  4. 數(shù)據(jù)可視化
  5. Pandas
  6. 特征工程
  7. 深度學(xué)習(xí)
  8. SQL入門
  9. 高級SQL
  10. 地理空間分析
  11. 微調(diào)整
  12. 機器學(xué)習(xí)的可解釋性
  13. 自然語言處理
  14. 游戲AI及強化學(xué)習(xí)入門 
[[333204]]

總結(jié)

Kaggle為有志于成為數(shù)據(jù)科學(xué)家提供大量的資源。Kaggle的好處包括但不限于:數(shù)據(jù)、代碼、社區(qū)、靈感、競賽和課程。

如果你想在數(shù)據(jù)分析、數(shù)據(jù)科學(xué)領(lǐng)域有更大的發(fā)展,建議你現(xiàn)在就開始了解和使用這個網(wǎng)站吧,這會是一個非常棒的體驗,和Github一樣!

 

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2021-05-20 13:38:36

Linux 系統(tǒng) 數(shù)據(jù)

2015-09-01 09:55:47

函數(shù)式編程

2023-03-21 18:46:53

2018-03-27 23:15:11

2018-01-23 08:42:34

2017-10-18 11:32:44

機器學(xué)習(xí)無監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)

2017-07-20 01:59:19

大數(shù)據(jù)算法數(shù)據(jù)

2017-10-24 14:21:30

機器學(xué)習(xí)人工智能算法

2021-12-23 11:16:06

物聯(lián)網(wǎng)IOT物聯(lián)網(wǎng)技術(shù)

2022-09-09 08:48:13

ITCIO流程

2023-01-16 19:07:56

大數(shù)據(jù)大數(shù)據(jù)分析

2023-08-08 07:00:24

大數(shù)據(jù)業(yè)務(wù)流程

2017-04-07 10:40:48

程序員學(xué)習(xí)命令行

2025-01-07 10:01:10

2012-05-25 09:48:01

編程程序員

2023-11-27 09:06:34

2014-12-26 10:19:14

程序員

2015-04-16 10:26:51

程序員 Python Ruby

2011-07-25 10:09:57

Python

2022-03-07 10:27:03

Linux開源社區(qū)
點贊
收藏

51CTO技術(shù)棧公眾號