掌握核心競(jìng)爭(zhēng)力:五大數(shù)據(jù)科學(xué)類(lèi)資格證書(shū)
本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。
在數(shù)據(jù)科學(xué)職業(yè)生涯中,可能會(huì)有多種原因會(huì)讓你想要考取資格證書(shū)。一些證書(shū)較為直接,例如數(shù)據(jù)科學(xué)資格證書(shū),另一些則具有更為間接的影響,例如Python編程能力資格證書(shū)。討論這一話(huà)題的文章已經(jīng)很多了,但筆者仍想就一些獨(dú)特且常用的程序、平臺(tái)及其相應(yīng)資格證書(shū)來(lái)聊一聊。
早在疫情席卷世界之前,面授教學(xué)模式的流行程度就已經(jīng)開(kāi)始逐漸降低了,線(xiàn)上學(xué)習(xí)不再可有可無(wú),而是成為數(shù)據(jù)科學(xué)家或者數(shù)據(jù)科學(xué)求職者成功的必要條件。線(xiàn)上項(xiàng)目和資格證書(shū)在過(guò)去曾飽受質(zhì)疑,如今則受到雇主的青睞,成為了衡量求職者技術(shù)上進(jìn)心的一大指標(biāo)。
其中一些證書(shū)可免費(fèi)考取,另一些則需要少量費(fèi)用,但不失為物有所值的投資,這取決于個(gè)人在數(shù)據(jù)科學(xué)領(lǐng)域的術(shù)業(yè)專(zhuān)攻和發(fā)展方向。
筆者已在南衛(wèi)理公會(huì)大學(xué)(SouthernMethodist University)取得了數(shù)據(jù)科學(xué)教育的理學(xué)碩士學(xué)位。即使它是遠(yuǎn)程在線(xiàn)碩士學(xué)位,雇主們也充分認(rèn)可其有效性。一些招聘經(jīng)理在筆者出示數(shù)據(jù)科學(xué)資格證書(shū)及非傳統(tǒng)教育形式的證書(shū)時(shí)驚嘆不已,贊賞有加。
筆者涉獵過(guò)多種學(xué)習(xí)形式,并且具有專(zhuān)業(yè)數(shù)據(jù)科學(xué)家的經(jīng)驗(yàn),因此大體了解雇主期望的工作技能,也十分熟悉真正有助于日常工作的一些工具與平臺(tái)。
下文是對(duì)數(shù)據(jù)科學(xué)工作者職業(yè)生涯有所助益的五大資格證書(shū)的介紹。
TensorFlow
TensorFlow是一個(gè)開(kāi)源平臺(tái),為數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師所廣泛使用,內(nèi)含功能強(qiáng)大的庫(kù)來(lái)推動(dòng)機(jī)器學(xué)習(xí)的建模過(guò)程。使用TensorFlow的典型項(xiàng)目包括:
- 神經(jīng)網(wǎng)絡(luò)(neural networks)
- 生成對(duì)抗網(wǎng)絡(luò)(generativeadversarial networks)
- 圖像分類(lèi)(image classification)
- 文本分類(lèi)(text classification)
- 回歸(regression)
- 提升樹(shù)(boosted trees)
- 時(shí)間序列預(yù)測(cè)(time seriesforecasting)
TensorFlow資格認(rèn)證的正式名稱(chēng)為“TensorFlow 開(kāi)發(fā)者認(rèn)證計(jì)劃(TensorFlowDeveloper Certificate program)”。該認(rèn)證計(jì)劃要求掌握使用計(jì)算機(jī)視覺(jué)、卷積神經(jīng)網(wǎng)絡(luò)和自然語(yǔ)言處理(NLP)。該測(cè)試收費(fèi)100美元,并鼓勵(lì)學(xué)員向現(xiàn)雇主爭(zhēng)取教育津貼。
該證書(shū)對(duì)于專(zhuān)攻機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩者或其一的人來(lái)說(shuō)尤為有益。這一認(rèn)證本身并非課程培訓(xùn),而僅僅是認(rèn)證受試者的TensorFlow學(xué)習(xí)成果的手段。不過(guò),主辦方的確推薦了Coursera上的“TensorFlow 實(shí)戰(zhàn)專(zhuān)項(xiàng)課程(TensorFlowin Practice Specialization )”,其專(zhuān)項(xiàng)課程最大的優(yōu)點(diǎn)是涵蓋了TensorFlow的全部?jī)?nèi)容,且不收取任何費(fèi)用。
那些相信報(bào)名費(fèi)物有所值,或是可以通過(guò)津貼方案得到報(bào)銷(xiāo)的人,更適合參加此測(cè)試。以下是一些關(guān)于該專(zhuān)項(xiàng)課程的數(shù)據(jù):
- 40%的人在課程結(jié)束后開(kāi)啟了新的職業(yè)生涯
- 12%的人獲得了加薪或升職
如上所述,該認(rèn)證及其相應(yīng)資格證書(shū)依托一個(gè)常用且受眾廣泛的平臺(tái),可有效展示個(gè)人技能,證明自身競(jìng)爭(zhēng)力。
SAS
SAS可能是最數(shù)據(jù)科學(xué)家不常用的平臺(tái)之一了,但從另一方面看,這也意味著SAS的使用者擁有獨(dú)一無(wú)二的技能,能做到一些大多數(shù)數(shù)據(jù)科學(xué)家力所不能及的事情。
Python和R是數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師都使用的典型編程語(yǔ)言,而SAS則是另一種語(yǔ)言。它與SQL類(lèi)似,都關(guān)注數(shù)據(jù)本身。筆者在攻讀理學(xué)碩士學(xué)位的初期,便首先使用了SAS來(lái)學(xué)習(xí)數(shù)據(jù)科學(xué)。
SAS的全稱(chēng)是數(shù)據(jù)分析系統(tǒng)(Statistical Analysis System)。數(shù)據(jù)科學(xué)家有時(shí)會(huì)感覺(jué)身陷于機(jī)器學(xué)習(xí)的黑箱之中,學(xué)習(xí)SAS則能細(xì)化對(duì)數(shù)據(jù)的理解。在數(shù)據(jù)科學(xué)的面試中,如果招聘經(jīng)理問(wèn)到無(wú)法用常見(jiàn)Python數(shù)據(jù)科學(xué)庫(kù)來(lái)解答的問(wèn)題,此時(shí)對(duì)數(shù)據(jù)的細(xì)化理解就大有幫助。
SAS的顯著優(yōu)勢(shì)在于用Q-Q圖、直方圖和殘差圖來(lái)進(jìn)行正態(tài)分布檢驗(yàn),并進(jìn)行ANOVA和MANOVA(方差分析和多元方差分析)等測(cè)試。
該資格證書(shū)的正式名稱(chēng)為“SAS程序員專(zhuān)業(yè)證書(shū)(SAS Programmer ProfessionalCertificate)”。該證書(shū)也可由Coursera發(fā)放,你可以免費(fèi)報(bào)名并付費(fèi)收取證書(shū)。不過(guò)盡管這些資格認(rèn)證和課程通常免費(fèi),考試或?qū)嶓w證書(shū)一般會(huì)收取費(fèi)用,但你仍可免費(fèi)學(xué)習(xí)大多或全部的課程。
你可從中學(xué)到SAS編程語(yǔ)言的技巧,探索不同的數(shù)據(jù)類(lèi)型。這一證書(shū)及其課程對(duì)職業(yè)生涯有著深刻影響:
- 21%的人在課程結(jié)束后開(kāi)啟了新的職業(yè)生涯
- 50%的人獲得加薪或升職
IBM Data Science — Python
上述的證書(shū)及其相應(yīng)課程主要涉及數(shù)據(jù)科學(xué)的某些特定方面,這一證書(shū)則涵蓋了數(shù)據(jù)科學(xué)的大部分整體流程。該資格證書(shū)的正式名稱(chēng)為“IBM 數(shù)據(jù)科學(xué)專(zhuān)業(yè)證書(shū)(IBM Data Science ProfessionalCertificate )”。與 SAS證書(shū)類(lèi)似,這一證書(shū)也可由Coursera發(fā)放。
該證書(shū)涵蓋內(nèi)容更為廣泛,下列是這一專(zhuān)業(yè)資格認(rèn)證所對(duì)應(yīng)的九個(gè)課程:
- 什么是數(shù)據(jù)科學(xué)?
- 數(shù)據(jù)科學(xué)工具(Jupyter Notebook、RStudio IDE等)
- 數(shù)據(jù)科學(xué)方法論(計(jì)算能力、部署等)
- 數(shù)據(jù)科學(xué)和AI中的Python(類(lèi)型、變量、類(lèi)、模塊等)
- 數(shù)據(jù)科學(xué)中的數(shù)據(jù)庫(kù)和SQL(結(jié)構(gòu)化查詢(xún)語(yǔ)言等)
- 使用Python進(jìn)行數(shù)據(jù)分析(Pandas、Numpy、Scipy等)
- 使用Python進(jìn)行數(shù)據(jù)可視化(Matplotlib、Seaborn等)
- 使用Python進(jìn)行機(jī)器學(xué)習(xí)(分類(lèi)、聚類(lèi)等)
- 應(yīng)用數(shù)據(jù)科學(xué)頂點(diǎn)課程(RESTfulAPI調(diào)用、Folium等)
如上所示,該資格認(rèn)證將近涵蓋了數(shù)據(jù)科學(xué)甚至是機(jī)器學(xué)習(xí)的方方面面。結(jié)合個(gè)人目標(biāo)和申請(qǐng)意愿,這一課程幾乎可以替代學(xué)位,有下列數(shù)據(jù)為證:
- 46%的人在課程結(jié)束后開(kāi)啟了新的職業(yè)生涯
- 19%的人獲得加薪或升職
這些驚人數(shù)據(jù)使之成為了最有幫助的課程與資格證書(shū)之一。近100萬(wàn)人瀏覽了該證書(shū)主頁(yè),足以說(shuō)明這一課程深受歡迎。筆者推薦那些想要建立數(shù)據(jù)科學(xué)整體觀的人參與這一課程。
Tableau
這一證書(shū)或許有些爭(zhēng)議,但仍值得認(rèn)真考慮。Tableau是一個(gè)用來(lái)描述指標(biāo)和數(shù)據(jù)的可視化工具,或許更接近數(shù)據(jù)分析或商業(yè)技術(shù)的范疇,但它仍能以多種方式為數(shù)據(jù)科學(xué)家所用。其中一些用途包括:
- 可視化呈現(xiàn)模型提取數(shù)據(jù)
- 探索性數(shù)據(jù)分析
- 變化與趨勢(shì)分析
- 為數(shù)據(jù)科學(xué)模型指標(biāo)創(chuàng)建出色的可視化
數(shù)據(jù)科學(xué)家通常需要展示自己的發(fā)現(xiàn),Tableau就是幫助數(shù)據(jù)科學(xué)家描述模型數(shù)據(jù)和指標(biāo)的簡(jiǎn)便工具,這樣利益相關(guān)者們便可以隨時(shí)看到商業(yè)問(wèn)題的處理情況,這就是一個(gè)應(yīng)用實(shí)例。
這一資格認(rèn)證有若干種,筆者個(gè)人重點(diǎn)推薦其中的“Tableau Desktop Specialist”。該認(rèn)證注重Tableau基礎(chǔ)知識(shí),數(shù)據(jù)科學(xué)家需要擅長(zhǎng)解決問(wèn)題,在了解基礎(chǔ)之后,才能逐步學(xué)習(xí)更為復(fù)雜的功能。
該認(rèn)證收費(fèi)300美元??荚噧?nèi)容包括選擇題、多選題和實(shí)踐題??荚嚍樽詣?dòng)評(píng)分,共有30道題目,時(shí)長(zhǎng)為60分鐘。Tableau也提供了多個(gè)課程以幫助你通過(guò)考試。
因?yàn)橐恍┱n程和資格認(rèn)證更注重直接的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí),該認(rèn)證意味著你掌握了用Tableau來(lái)呈現(xiàn)數(shù)據(jù)科學(xué)研究成果的能力,這將會(huì)幫助你在眾多數(shù)據(jù)科學(xué)家中脫穎而出。
Google Machine Learning
圖源:whizlabs
最后一個(gè)資格認(rèn)證來(lái)自谷歌,它也許是難度最大的一個(gè),更適合機(jī)器學(xué)習(xí)工程師。對(duì)于主攻模型的數(shù)據(jù)科學(xué)家來(lái)說(shuō),該認(rèn)證有助于你在部署和工程方面進(jìn)階。這一考試將主要考察以下復(fù)雜概念:
- 擬定機(jī)器學(xué)習(xí)問(wèn)題(Frame ML problems)
- 開(kāi)發(fā)機(jī)器學(xué)習(xí)模型(Develop ML models)
- 構(gòu)建機(jī)器學(xué)習(xí)解決方案(Architect MLsolutions)
- 自動(dòng)化與協(xié)調(diào)機(jī)器學(xué)習(xí)工作流(Automate &orchestrate ML pipelines)
- 數(shù)據(jù)準(zhǔn)備與處理(Prepare and processdata)
- 監(jiān)控、優(yōu)化與維護(hù)機(jī)器學(xué)習(xí)解決方案(Monitor, optimize,and maintain ML solutions)
該認(rèn)證的全稱(chēng)為“專(zhuān)業(yè)機(jī)器學(xué)習(xí)工程師BETA(Professional Machine Learning EngineerBETA)”。通過(guò)Beta版考試后,可獲取谷歌云認(rèn)證(Google Cloud Certified),能節(jié)約40%的開(kāi)銷(xiāo),并且還可獲得專(zhuān)屬谷歌定制服裝。
該認(rèn)證較為復(fù)雜,涵蓋了困難且極為重要的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)特性??荚嚨闹攸c(diǎn)在于一些極為重要的概念的理解,這些概念對(duì)所有數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)工程師都有益處。下列是其中一些重點(diǎn):
- 將商業(yè)問(wèn)題轉(zhuǎn)化為機(jī)器學(xué)習(xí)應(yīng)用案例,從而擬定機(jī)器學(xué)習(xí)問(wèn)題
- 構(gòu)建具有最佳軟件開(kāi)發(fā)生命周期(SDLC)機(jī)器學(xué)習(xí)解決方案
- 運(yùn)用設(shè)計(jì)的機(jī)器學(xué)習(xí)工作流進(jìn)行數(shù)據(jù)準(zhǔn)備與處理
- 機(jī)器學(xué)習(xí)模型開(kāi)發(fā)的產(chǎn)品化
- 采用持續(xù)集成/持續(xù)部署(CI/CD)測(cè)試與部署以進(jìn)行機(jī)器學(xué)習(xí)工作流的自動(dòng)化與協(xié)調(diào)化
- 通過(guò)性能調(diào)整和再訓(xùn)練識(shí)別來(lái)進(jìn)行機(jī)器學(xué)習(xí)解決方案的監(jiān)控、優(yōu)化和維護(hù)
圖源:unsplash
成為最頂尖的數(shù)據(jù)科學(xué)家并不一定需要參與上述全部課程和認(rèn)證,但它們皆能以不同方式幫助你走向成功。世界上有不可計(jì)數(shù)的課程與資格認(rèn)證,最重要的不是知道它們而是通過(guò)它,努力成為更優(yōu)秀的數(shù)據(jù)科學(xué)家。
如果能夠取得TensorFlow、SAS、IBM Data Science、Tableau和Google Machine Learning的認(rèn)證,你一定會(huì)給現(xiàn)在和將來(lái)的雇主留下深刻印象。這些證書(shū)不僅能令你在面試當(dāng)中脫穎而出,也會(huì)幫助你在數(shù)據(jù)科學(xué)職業(yè)生涯中更上一層樓。學(xué)習(xí)是永無(wú)止境的,參與課程和取得認(rèn)證也不例外。