數(shù)據(jù)科學(xué)家含金量最高的5個(gè)數(shù)據(jù)科學(xué)認(rèn)證,先馬后看!
大數(shù)據(jù)文摘出品
來(lái)源:medium
編譯:李雷
盡管關(guān)于這個(gè)話題的文章不計(jì)其數(shù),但文本作者想要找尋那種為大部分?jǐn)?shù)據(jù)科學(xué)家所用而又有特色的工具及其認(rèn)證。這些認(rèn)證有的是免費(fèi)的,有的比較便宜,但都值得嘗試。
不過(guò),這還是要取決于你在數(shù)據(jù)科學(xué)領(lǐng)域的關(guān)注重點(diǎn)和發(fā)展方向。在數(shù)據(jù)科學(xué)從業(yè)的道路上,每個(gè)人想要獲得證書的原因有很多;有的證書可能很直白,例如數(shù)據(jù)科學(xué)證書,有的可能沒(méi)那么直白,例如Python編程證書。隨著課堂教學(xué)的減少,在線學(xué)習(xí)的地位與日俱增,逐漸成為數(shù)據(jù)科學(xué)從業(yè)者的必備良品。過(guò)去,在線課程和認(rèn)證總讓人覺(jué)得不靠譜,而如今,不光老板們?cè)絹?lái)越期待它們給企業(yè)帶來(lái)提升,你也可以向利用它們老板證明,無(wú)論處在什么職位,你都可以提高自己的技能。
作者擁有南方衛(wèi)理公會(huì)大學(xué)數(shù)據(jù)科學(xué)教育理學(xué)碩士學(xué)位,盡管這是通過(guò)線上獲得的,但沒(méi)有哪個(gè)雇主認(rèn)為它會(huì)比普通的碩士要低級(jí)。同樣,當(dāng)他在面試時(shí)拿出數(shù)據(jù)科學(xué)證書和其他通過(guò)非傳統(tǒng)教育形式(如網(wǎng)課)獲得的證書時(shí),幾位招聘經(jīng)理也十分喜歡,并且給他們留下了深刻的印象。除了具有不同形式的學(xué)習(xí)經(jīng)驗(yàn),他還具備數(shù)據(jù)科學(xué)家的專業(yè)經(jīng)驗(yàn),而這正是雇主們所期待的。此外,作者對(duì)一些工具和平臺(tái)非常了解,這也給他的日常工作帶來(lái)很大的幫助。
在下文中,作者將介紹五個(gè)可以提升數(shù)據(jù)科學(xué)職業(yè)生涯的認(rèn)證。
- TensorFlow
- SAS
- IBM Data Science — Python
- Tableau
- Google Machine Learning
- Summary
- References
TensorFlow
TensorFlow 是一個(gè)被數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師廣泛使用的開(kāi)源機(jī)器學(xué)習(xí)框架,其中包含各種功能強(qiáng)大的代碼庫(kù),可以協(xié)助機(jī)器學(xué)習(xí)模型的構(gòu)建過(guò)程。TensorFlow的典型使用場(chǎng)景包括:
- 神經(jīng)網(wǎng)絡(luò)
- 生成對(duì)抗網(wǎng)絡(luò)(GAN)
- 圖像分類
- 文本分類
- 回歸
- 提升樹
- 時(shí)間序列預(yù)測(cè)
- 等等
TensorFlow認(rèn)證的名稱是:TensorFlow開(kāi)發(fā)人員證書。
該框架包含計(jì)算機(jī)視覺(jué)(CV),卷積神經(jīng)網(wǎng)絡(luò)(CNN)和自然語(yǔ)言處理(NLP)等各種模型。因?yàn)檎J(rèn)證考試費(fèi)用為100美元(較貴),因此建議你去找老板報(bào)銷(說(shuō)不定能成功呢)。如果你關(guān)注的是機(jī)器學(xué)習(xí)或深度學(xué)習(xí),那么這個(gè)證書會(huì)很有用。證書本身不是一個(gè)教程,只是對(duì)你使用TensorFlow能力的認(rèn)可。但是,作者建議通過(guò)Coursera平臺(tái)提供的TensorFlow in Practice系列課程來(lái)學(xué)習(xí),因?yàn)樗w了TensorFlow的所有內(nèi)容,并且還是免費(fèi)的。只要你覺(jué)得100美元的考試費(fèi)不貴,或者可以通過(guò)助學(xué)金計(jì)劃免除學(xué)費(fèi)時(shí),那么就去考吧。據(jù)說(shuō)學(xué)習(xí)了該系列課程的人:
- 完成課程的人中有40%開(kāi)啟了新的職業(yè)生涯
- 12%的人獲得升職加薪
如此看來(lái),這個(gè)認(rèn)證及相應(yīng)的證書可以很好地展示你的技能,同時(shí)在TensorFlow這個(gè)廣闊的平臺(tái)上證明了你的競(jìng)爭(zhēng)力。
SAS
SAS可能是數(shù)據(jù)科學(xué)家最不常用的平臺(tái)。但是,這也可能變成你的優(yōu)勢(shì),因?yàn)榭梢源_定的說(shuō),你的SAS技能是真正獨(dú)一無(wú)二,與眾不同的。你能做的事,大多數(shù)數(shù)據(jù)科學(xué)家無(wú)法做到。與Python和R這些數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師都使用的編程語(yǔ)言不同,SAS是一種類似于統(tǒng)計(jì)信息專用的SQL語(yǔ)言。作者在讀數(shù)據(jù)科學(xué)碩士學(xué)位時(shí),這個(gè)平臺(tái)是他接觸到的第一個(gè)數(shù)據(jù)科學(xué)學(xué)習(xí)平臺(tái)。
SAS的全稱是Statistical Analysis System。作為一個(gè)數(shù)據(jù)科學(xué)家,你在進(jìn)行機(jī)器學(xué)習(xí)的時(shí)候可能會(huì)進(jìn)入一種黑盒狀態(tài),無(wú)法得知機(jī)器到底是怎么學(xué)的。但是,如果你使用SAS,則會(huì)得到非常詳盡的統(tǒng)計(jì)信息。這在面試數(shù)據(jù)科學(xué)職位的時(shí)候特別有用,當(dāng)招聘經(jīng)理向你詢問(wèn)復(fù)雜的統(tǒng)計(jì)問(wèn)題,只掌握Python數(shù)據(jù)科學(xué)庫(kù)是無(wú)法回答這些問(wèn)題的。使用SAS的優(yōu)勢(shì)是可以使用Q-Q圖,直方圖和殘差圖等方法測(cè)試正態(tài)性,還可以執(zhí)行ANOVA和MANOVA(方差分析或方差多重分析)之類的測(cè)試。
這個(gè)證書的名稱是:SAS程序員專業(yè)證書。
這個(gè)認(rèn)證在Coursera平臺(tái)上也有相應(yīng)的課程,可以免費(fèi)注冊(cè)并且在完成課程后獲得收費(fèi)證書。
請(qǐng)記住,即使這些是認(rèn)證和課程可以免費(fèi),但考試或?qū)嵨镒C書通常還是要花錢的。不過(guò)你仍然可以免費(fèi)地學(xué)習(xí)部分甚至全部課程,而且如果你的老板或者面試公司認(rèn)可你對(duì)相關(guān)課程學(xué)習(xí),那你也就無(wú)需付費(fèi)考試或者購(gòu)買證書了。
在該課程中你將學(xué)習(xí)SAS編程語(yǔ)言以及不同數(shù)據(jù)類型處理。這個(gè)證書及相關(guān)課程對(duì)職業(yè)發(fā)展有著極大的作用:
- 學(xué)習(xí)了這個(gè)系列課程的人中有21%開(kāi)啟了新的職業(yè)生涯
- 50%的人獲得升職加薪
IBM數(shù)據(jù)科學(xué)證書-Python
前面的證書及課程側(cè)重于數(shù)據(jù)科學(xué)的特定方向,而這個(gè)證書涵蓋了整個(gè)通用數(shù)據(jù)科學(xué)體系。證書的名稱是:IBM數(shù)據(jù)科學(xué)專業(yè)證書。
與前面的證書類似,Coursera平臺(tái)上也有這個(gè)證書的相關(guān)課程。該證書的涵蓋面很廣,作者列出了所有的九門課程:
- 什么是數(shù)據(jù)科學(xué)?
- 數(shù)據(jù)科學(xué)工具(Jupyter Notebook,RStudio IDE等)
- 數(shù)據(jù)科學(xué)方法論(算力,部署等)
- Python與數(shù)據(jù)科學(xué)和AI(類型,變量,類模塊等)
- 數(shù)據(jù)科學(xué)中的的數(shù)據(jù)庫(kù)和SQL(結(jié)構(gòu)化查詢語(yǔ)言等)
- 使用Python進(jìn)行數(shù)據(jù)分析(Pandas,Numpy和Scipy庫(kù)等)
- 使用Python進(jìn)行數(shù)據(jù)可視化(Matplotlib,Seaborn等)
- 使用Python進(jìn)行機(jī)器學(xué)習(xí)(分類,聚類等)
- 終極數(shù)據(jù)科學(xué)應(yīng)用(RESTful API調(diào)用,F(xiàn)olium等)
如上所述,該認(rèn)證幾乎涵蓋了數(shù)據(jù)科學(xué)乃至機(jī)器學(xué)習(xí)的每個(gè)部分。根據(jù)你的目標(biāo)和申請(qǐng)地點(diǎn),本課程甚至可以完全替代學(xué)位,證據(jù)如下:
- 完成課程的人中46%開(kāi)啟了新的職業(yè)生涯
- 19%的人升職加薪
多么令人驚嘆的數(shù)字,它將是你獲益最多的課程和認(rèn)證之一。如果你想全面了解數(shù)據(jù)科學(xué),作者推薦本課程。大約有100萬(wàn)人瀏覽了課程主頁(yè),足見(jiàn)該課程的受歡迎程度之高。
Tableau
這個(gè)證書可能有些人會(huì)不同意,不過(guò)你還是應(yīng)該認(rèn)真考慮一下。Tableau是描述指標(biāo)和統(tǒng)計(jì)數(shù)據(jù)的可視化工具,因此可能更像是數(shù)據(jù)分析或商業(yè)智能方面的技能。但是,數(shù)據(jù)科學(xué)家掌握Tableau也有一些好處,包括:
- 模型攝取數(shù)據(jù)的可視化表示
- 探索性數(shù)據(jù)分析
- 變動(dòng)和趨勢(shì)分析
- 令人印象深刻的可視化數(shù)據(jù)科學(xué)模型指標(biāo)
通常,如果你是個(gè)數(shù)據(jù)科學(xué)家,你需要陳述你的發(fā)現(xiàn),那么Tableau是一個(gè)簡(jiǎn)單易用的工具,可以幫助你描述模型狀態(tài)和指標(biāo),以便你的同僚可以每天查看數(shù)據(jù)業(yè)務(wù)問(wèn)題的進(jìn)展情況。
Tableau包含幾種認(rèn)證,但重點(diǎn)介紹一個(gè):Tableau Desktop專家。
該證書重點(diǎn)放在Tableau的基礎(chǔ)知識(shí),這對(duì)于入門級(jí)別的你可能很重要。作為數(shù)據(jù)科學(xué)家,我們假設(shè)你已經(jīng)具備出色的問(wèn)題解決能力,因此,一旦你掌握了Tableau基礎(chǔ)知識(shí),就可以學(xué)習(xí)更復(fù)雜的功能。此項(xiàng)認(rèn)證的費(fèi)用為100美元,考試一共包含30道題目,時(shí)間60分鐘,包括多項(xiàng)選擇題,簡(jiǎn)答題和實(shí)踐題,系統(tǒng)自動(dòng)評(píng)分。Tableau還提供了幾門課程,可以幫助你更快地學(xué)習(xí)。
與其他的課程和證書更加專注于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)相比,獲得這個(gè)證書可以讓你與眾不同,即如何使用Tableau來(lái)展示你的數(shù)據(jù)科學(xué)發(fā)現(xiàn)。
谷歌機(jī)器學(xué)習(xí)認(rèn)證
最后一個(gè)認(rèn)證(也許是最困難的)是來(lái)自谷歌。如果你是一名機(jī)器學(xué)習(xí)工程師,那么那你最好有這個(gè)證書。如果你是僅專注于模型的數(shù)據(jù)科學(xué)家,那么該證書也可以使你進(jìn)一步進(jìn)行部署和工程設(shè)計(jì)。這個(gè)認(rèn)證將檢驗(yàn)?zāi)銓?duì)以下主要復(fù)雜概念的理解:
- 界定ML問(wèn)題
- 開(kāi)發(fā)ML模型
- 構(gòu)建ML解決方案
- 自動(dòng)化和編排ML管道
- 準(zhǔn)備和處理數(shù)據(jù)
- 監(jiān)控,優(yōu)化和維護(hù)ML解決方案
你可以選擇beta版認(rèn)證,通過(guò)了即獲得Google Cloud認(rèn)證,可以節(jié)省40%的費(fèi)用,同時(shí)還可以獲得Google獨(dú)家定制服裝。這個(gè)證書的名稱是:專業(yè)機(jī)器學(xué)習(xí)工程師BETA。
考試的主要目標(biāo)都是些非常有用的概念,每個(gè)考過(guò)的數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)工程師最終都將受益匪淺。其中一些關(guān)鍵目標(biāo)是:
- 通過(guò)將新業(yè)務(wù)挑戰(zhàn)轉(zhuǎn)化為ML用例來(lái)界定機(jī)器學(xué)習(xí)問(wèn)題;
- 使用SDLC(軟件開(kāi)發(fā)生命周期)最佳實(shí)踐來(lái)構(gòu)建ML解決方案架構(gòu);
- 通過(guò)設(shè)計(jì)數(shù)據(jù)管道進(jìn)行數(shù)據(jù)準(zhǔn)備和處理;
- ML模型開(kāi)發(fā)與量產(chǎn)化;
- 帶有CI(持續(xù)集成)/ CD(持續(xù)交付)測(cè)試和部署的ML管道自動(dòng)化和編排;
- 具有性能調(diào)優(yōu)和模型再訓(xùn)練標(biāo)識(shí)的ML解決方案的監(jiān)控,優(yōu)化和維護(hù)。
由此可見(jiàn),這個(gè)認(rèn)證非常復(fù)雜,涵蓋了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的高難度核心領(lǐng)域。
總結(jié)
要成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家,你并不需要讀完所有這些課程或考取全部證書,但這些認(rèn)證都能以不同的方式給你帶來(lái)巨大的提升。以下是所有五個(gè)頂級(jí)認(rèn)證的內(nèi)容及其各自的鏈接:
- TensorFlow開(kāi)發(fā)人員認(rèn)證:https://www.tensorflow.org/certificate
- SAS程序員專業(yè)證書:https://www.coursera.org/professional-certificates/sas-programming
- IBM數(shù)據(jù)科學(xué)專業(yè)證書:https://www.coursera.org/professional-certificates/ibm-data-science#courses
- Tableau Desktop專家:https://www.tableau.com/learn/certification/desktop-specialist
- 專業(yè)機(jī)器學(xué)習(xí)工程師BETA:https://cloud.google.com/certification/machine-learning-engineer
當(dāng)然,數(shù)據(jù)科學(xué)還有更多其他的課程和證書。但是,對(duì)于你而言,最重要的事情是選擇這些證書(或其他類似證書)中的任何一個(gè),并努力提高自己作為數(shù)據(jù)科學(xué)家的水平。想象一下,如果你獲得了這幾個(gè)認(rèn)證中的任何一個(gè),一定會(huì)讓你的老板眼前一亮(無(wú)論是現(xiàn)在和未來(lái)的)。這些證書不僅會(huì)讓你在面試時(shí)脫穎而出,而且最終還將幫助你在數(shù)據(jù)科學(xué)職業(yè)上走得更好。學(xué)習(xí)不止,考證不斷。
相關(guān)報(bào)道:https://towardsdatascience.com/the-top-5-data-science-certifications-71b3be907d8
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】