自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何自學(xué)成為數(shù)據(jù)科學(xué)家或AI工程師?你需要攻克這九點(diǎn)

新聞 人工智能
并非每個(gè)人都有時(shí)間在教室里學(xué)習(xí)數(shù)據(jù)科學(xué)、人工智能或機(jī)器學(xué)習(xí),也并非每個(gè)人都能負(fù)擔(dān)得起正式學(xué)習(xí)這些領(lǐng)域知識所需要的費(fèi)用。

 并非每個(gè)人都有時(shí)間在教室里學(xué)習(xí)數(shù)據(jù)科學(xué)、人工智能或機(jī)器學(xué)習(xí),也并非每個(gè)人都能負(fù)擔(dān)得起正式學(xué)習(xí)這些領(lǐng)域知識所需要的費(fèi)用。那我們應(yīng)該怎么辦呢?軟件開發(fā)者、機(jī)器學(xué)習(xí)工程師 Jerry Buaba 提供了一條自學(xué)路徑。

[[334625]]

人們在嘗試學(xué)習(xí)數(shù)據(jù)科學(xué)、人工智能或機(jī)器學(xué)習(xí)時(shí)所面臨的最大攔路虎就是時(shí)間和金錢。自學(xué)是一門藝術(shù),需要足夠的自律、勤奮和專注。利用得當(dāng)?shù)脑?,它能讓你靈活地將學(xué)習(xí)與工作結(jié)合起來。

然而,自學(xué)數(shù)據(jù)科學(xué)、人工智能或機(jī)器學(xué)習(xí)的開始階段會非常艱難,但請相信這一切都是值得的。自學(xué)時(shí)取得良好進(jìn)展的關(guān)鍵是按照自己的節(jié)奏學(xué)習(xí)。

本文將分享一條自學(xué)數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)時(shí)可以遵循的道路,同時(shí)也能幫助大家在學(xué)習(xí)新事物上取得良好進(jìn)展。

學(xué)習(xí)數(shù)學(xué)

學(xué)習(xí)數(shù)學(xué)聽起來很煩人,但對這個(gè)領(lǐng)域來說是十分必要的。閱讀這篇文章的讀者應(yīng)該都從高中學(xué)到了一些初高級數(shù)學(xué)知識。這是很好的開端,但僅有這些知識在數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)領(lǐng)域還遠(yuǎn)遠(yuǎn)不夠。你需要更深入地學(xué)習(xí)一些統(tǒng)計(jì)學(xué)、代數(shù)和其他的數(shù)學(xué)概念。

必備數(shù)學(xué)知識資源列表,參見:https://towardsdatascience.com/mathematics-for-data-science-e53939ee8306。

學(xué)習(xí)編程

作為初學(xué)者而言,不要直接開始學(xué)習(xí)編寫機(jī)器學(xué)習(xí)代碼,而是首先學(xué)習(xí)一般編程的核心概念。先了解什么是編程、現(xiàn)有的編程語言種類、如何正確地寫代碼等。這些東西非常重要,因?yàn)槟銓W(xué)到許多重要的概念,而這些概念將一直伴隨著你。

所以這一步要慢慢來,不要急于學(xué)習(xí)高級的東西,在這個(gè)過程中對事物的理解深淺將決定你在這個(gè)行業(yè)中的表現(xiàn)。

這個(gè)視頻介紹了編程和計(jì)算機(jī)科學(xué),可以幫你過一遍計(jì)算機(jī)科學(xué)和編程中的重要概念:https://www.youtube.com/watch?v=zOjov-2OZ0E。

熟練掌握一種編程語言

數(shù)據(jù)科學(xué)家、人工智能和機(jī)器學(xué)習(xí)工程師使用的語言多種多樣,其中最常用的語言是 Python、R、Java、Julia 和 SQL。當(dāng)然還有很多其他的可用編程語言,這里列出的是最常用的語言,原因如下:

只要投入足夠的時(shí)間進(jìn)行學(xué)習(xí)并堅(jiān)持下來,你可以比較容易地學(xué)會這些語言,并且它們的開發(fā)速度很快。

可以利用更少的代碼完成更多的功能。

社區(qū)和生態(tài)十分完善,任何時(shí)候遇到任何問題社區(qū)都能提供幫助和支持。

擁有數(shù)據(jù)科學(xué)家、人工智能或機(jī)器學(xué)習(xí)工程師所需要的幾乎所有庫和軟件包。

開源且免費(fèi)使用。

學(xué)習(xí)多種語言絕對沒錯,事實(shí)上這是一件很好的事。然而,在學(xué)習(xí)每一門編程語言時(shí),你需要慢慢來,盡量不要同時(shí)學(xué)習(xí)多種語言,因?yàn)檫@可能會讓你感到困惑,并讓你在一段時(shí)間內(nèi)迷失方向。

慢慢來,一次學(xué)一門語言,確保只學(xué)習(xí)你職業(yè)生涯所需要的那部分語言。我建議先學(xué) Python,因?yàn)樗鄬Ρ容^容易理解。此外,我還建議大家按先后順序?qū)W習(xí)以下資源:

https://www.youtube.com/watch?v=rfscVS0vtbw&t=5s

https://www.youtube.com/watch?v=r-uOLxNrNk8

學(xué)會如何獲取數(shù)據(jù)

數(shù)據(jù)通常不會直接送到你手里,有時(shí)根本就沒有現(xiàn)成的數(shù)據(jù),但無論如何,你必須找到一種方法來獲得能使用的數(shù)據(jù)。

你工作的地方可能有一不錯的數(shù)據(jù)收集系統(tǒng),如果這樣那你就可以省心了。如果沒有的話,你必須找到一種方法來獲取數(shù)據(jù),不是任何數(shù)據(jù)都可以,而是可用來實(shí)現(xiàn)目標(biāo)的有效數(shù)據(jù)。

獲取數(shù)據(jù)并不完全等同于數(shù)據(jù)挖掘,它是數(shù)據(jù)挖掘的一個(gè)過程。你可以在互聯(lián)網(wǎng)上許多地方獲得免費(fèi)和開源的數(shù)據(jù),有時(shí)你可能需要從網(wǎng)站上抓取數(shù)據(jù)。網(wǎng)絡(luò)爬蟲非常重要,我希望每個(gè)人都能學(xué)習(xí)網(wǎng)絡(luò)爬蟲,因?yàn)槟愕穆殬I(yè)生涯中可能會經(jīng)常用到它。

網(wǎng)絡(luò)爬蟲教程:https://www.youtube.com/watch?v=0_VZ7NpVw1Y

數(shù)據(jù)有時(shí)會保存在數(shù)據(jù)庫中,那么作為數(shù)據(jù)科學(xué)家、人工智能或機(jī)器學(xué)習(xí)工程師,你還需要了解一點(diǎn)數(shù)據(jù)庫管理知識,以便在工作中直接連接和使用數(shù)據(jù)庫。在這個(gè)階段,SQL 知識是非常重要的。

SQL 學(xué)習(xí)資源:https://www.youtube.com/watch?v=sTiWTx0ifaM&t=15s

學(xué)習(xí)如何處理數(shù)據(jù)

這通常被稱為「數(shù)據(jù)整理」(Data Wrangling)。該過程包括數(shù)據(jù)清理, 這可以通過對數(shù)據(jù)執(zhí)行一些探索性數(shù)據(jù)分析并刪除數(shù)據(jù)中不需要的部分來完成。

數(shù)據(jù)整理過程還包括將數(shù)據(jù)結(jié)構(gòu)化為可以使用的格式。在數(shù)據(jù)科學(xué)、人工智能或機(jī)器學(xué)習(xí)項(xiàng)目中,這個(gè)階段是最累人的部分。在學(xué)習(xí)過程中,你將要使用的大多數(shù)樣本數(shù)據(jù)都已經(jīng)過預(yù)處理,但是現(xiàn)實(shí)世界中的數(shù)據(jù)可能還沒有經(jīng)過任何處理。作為一個(gè)有志于在這個(gè)領(lǐng)域做好的人,你應(yīng)該尋找一些真實(shí)世界數(shù)據(jù)并進(jìn)行處理。真實(shí)世界的數(shù)據(jù)幾乎可以在任何地方找到,但是 Kaggle 仍是一個(gè)從全球公司獲取真實(shí)數(shù)據(jù)的神奇地方。

數(shù)據(jù)整理或處理是一項(xiàng)非常累人的任務(wù),但是如果有持續(xù)的奉獻(xiàn)精神和專注,它也可能是件有趣的事。

數(shù)據(jù)整理相關(guān)課程:https://www.youtube.com/watch?v=sz_dsktIjt4

學(xué)習(xí)如何可視化數(shù)據(jù)

成為數(shù)據(jù)科學(xué)家、人工智能或機(jī)器學(xué)習(xí)工程師,并不意味著你的工作場所或團(tuán)隊(duì)中的每個(gè)人都能夠理解你所在領(lǐng)域的技術(shù)細(xì)節(jié),或者能夠從原始形式的數(shù)據(jù)中做出推斷,因此我們需要對數(shù)據(jù)進(jìn)行可視化。

數(shù)據(jù)可視化通常是指使用圖表來展示數(shù)據(jù),以便任何不具備數(shù)據(jù)科學(xué)、人工智能或機(jī)器學(xué)習(xí)知識的人也能理解這些數(shù)據(jù)。

數(shù)據(jù)可視化的方法有很多。作為程序員,編寫代碼來可視化數(shù)據(jù)應(yīng)該是首選方法,因?yàn)檫@種方法速度快,而且無需成本。編寫代碼來可視化數(shù)據(jù)可以通過我們使用的編程語言提供的許多免費(fèi)和開源庫來完成。Matplotlib、Seaborn 和 Bokeh 都是可用來可視化數(shù)據(jù)的 Python 庫。

Matplotlib 數(shù)據(jù)可視化教程:https://www.youtube.com/watch?v=yZTBMMdPOww

可視化數(shù)據(jù)的另一種方式是使用 Tableau 之類的閉源工具。很多閉源工具可用來制作更優(yōu)雅和復(fù)雜的可視化結(jié)果,但是需要付費(fèi)。Tableau 是最常用的工具,也是我個(gè)人經(jīng)常使用的工具。我推薦大家學(xué)習(xí)使用 Tableau。

Tableau 使用教程:https://www.youtube.com/watch?v=aHaOIvR00So

人工智能與機(jī)器學(xué)習(xí)

人工智能和機(jī)器學(xué)習(xí)更像是數(shù)據(jù)科學(xué)的子集,因?yàn)樗鼈兌际怯蓴?shù)據(jù)驅(qū)動的。它們指通過向機(jī)器或其他無生命物體提供經(jīng)過良好處理的數(shù)據(jù),使它們的行為與人類相似的過程。機(jī)器可以通過逐漸的教導(dǎo)和引導(dǎo)來做很多人類能做的事情。在這種情況下,我們可以把機(jī)器想象成一個(gè)完全沒有知識的嬰兒,他們逐漸學(xué)會識別物體、說話、從錯誤中學(xué)習(xí)并變得更好。我們也可以用同樣的方式教機(jī)器做這些事。

人工智能和機(jī)器學(xué)習(xí)大體上是通過多種數(shù)學(xué)算法來給機(jī)器賦能。人工智能和機(jī)器學(xué)習(xí)的全部潛力仍然不為人知,因?yàn)樗且粋€(gè)不斷發(fā)展的領(lǐng)域。但目前人工智能和機(jī)器學(xué)習(xí)被廣泛應(yīng)用于認(rèn)知功能,如目標(biāo)檢測和識別、面部識別、語音識別和自然語言處理、欺詐和垃圾郵件檢測等。

AI 和 ML 通用應(yīng)用:https://www.youtube.com/watch?v=5hNK7-N23eU

深入了解機(jī)器學(xué)習(xí):https://www.youtube.com/watch?v=GwIo3gDZCVQ&t=5s

觀看完以上視頻后,你應(yīng)該能夠大致了解機(jī)器學(xué)習(xí)初學(xué)者和中級知識,了解許多可用的機(jī)器學(xué)習(xí)算法及其作用和使用過程?,F(xiàn)在, 你應(yīng)該準(zhǔn)備好構(gòu)建第一個(gè)簡單的機(jī)器學(xué)習(xí)模型了,你可以參考 Victor Roman 的這篇文章:https://towardsdatascience.com/machine-learning-general-process-8f1b510bd8af。

學(xué)習(xí)如何使自己的機(jī)器學(xué)習(xí)模型可在互聯(lián)網(wǎng)上使用

通過機(jī)器學(xué)習(xí)訓(xùn)練得到的模型可以通過部署,讓互聯(lián)網(wǎng)上的每個(gè)人都可以使用。要做到這一點(diǎn),你需要對 web 開發(fā)有很好的理解,因?yàn)槟惚仨殑?chuàng)建一個(gè)或一組網(wǎng)頁來發(fā)布模型。

網(wǎng)站前端也需要與容納模型的后端進(jìn)行通信。為此,你還需要知道如何構(gòu)建和集成 API,以處理網(wǎng)站前后端之間的通信問題。

如果你打算通過 pipeline 或 docker 容器在云服務(wù)器上部署機(jī)器學(xué)習(xí)模型,那么你可能需要對云計(jì)算和運(yùn)維有充分地了解。部署機(jī)器學(xué)習(xí)模型的方法有很多,但首先,我建議你學(xué)習(xí)如何使用 python web 框架 Flask 來部署機(jī)器學(xué)習(xí)模型。

教程:https://www.youtube.com/watch?v=UbCWoMf80PY

師傅領(lǐng)進(jìn)門

能夠自學(xué)成才當(dāng)然很棒,但沒有什么比直接從行業(yè)專家那里學(xué)習(xí)效果更好。有些知識通過學(xué)習(xí)現(xiàn)實(shí)生活中的概念就可以掌握,而有些知識只有親身體驗(yàn)才能學(xué)會。

有導(dǎo)師在方方面面都非常有幫助,但不是每個(gè)導(dǎo)師都能對你的職業(yè)生涯或生活產(chǎn)生影響,所以擁有優(yōu)秀的導(dǎo)師就顯得非常重要了。Notitia AI 是一個(gè)不錯的平臺,可以培訓(xùn)從初學(xué)者到專家水平的數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)。該平臺會為你分配一個(gè)專屬導(dǎo)師,在你選擇的專業(yè)領(lǐng)域里給予個(gè)性化和專業(yè)的指導(dǎo)。

請注意,只參加課程和從在線資源中學(xué)習(xí)并不能使你成為一名真正的數(shù)據(jù)科學(xué)家、人工智能或機(jī)器學(xué)習(xí)工程師。你還必須獲得相關(guān)認(rèn)證,有些工作崗位還要求學(xué)位。抓緊時(shí)間學(xué)習(xí)來獲得證書或?qū)W位,你終將為從事該行業(yè)做好準(zhǔn)備。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2018-11-29 13:30:15

數(shù)據(jù)科學(xué)家項(xiàng)目數(shù)據(jù)

2019-02-25 22:57:22

數(shù)據(jù)工程師數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2020-09-19 17:40:29

編寫代碼工具技術(shù)

2019-04-26 14:27:07

大數(shù)據(jù)數(shù)據(jù)科學(xué)數(shù)據(jù)工程師

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2020-04-10 11:58:56

AI咨詢數(shù)據(jù)科學(xué)

2020-12-08 05:47:26

數(shù)據(jù)科學(xué)家機(jī)器學(xué)習(xí)工程師油管博主

2016-10-21 19:59:43

數(shù)據(jù)科學(xué)家數(shù)據(jù)科學(xué)

2018-03-20 13:04:55

GDPR數(shù)據(jù)科學(xué)數(shù)據(jù)保護(hù)

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2023-05-23 09:34:16

科學(xué)家AI

2019-05-13 16:31:37

數(shù)據(jù)科學(xué)家專業(yè)人才職業(yè)

2020-07-19 15:17:41

機(jī)器學(xué)習(xí)技術(shù)工程師

2020-03-13 14:13:48

機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)編程

2019-01-29 10:53:07

數(shù)據(jù)開發(fā)Python

2019-01-28 18:43:02

數(shù)據(jù)科學(xué)家Python技巧

2013-04-11 10:03:55

2023-03-17 08:00:00

人工智能工具數(shù)據(jù)科學(xué)家

2016-04-11 14:15:06

數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號