如何脫穎而出?優(yōu)秀數(shù)據(jù)科學家的五大品質(zhì)
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)。
數(shù)據(jù)科學是一個絕佳的研究領(lǐng)域,想要在這一領(lǐng)域獲得成功,你有一些必需的特質(zhì)。我們都曾無數(shù)次聽說,數(shù)據(jù)科學是現(xiàn)在和未來的就業(yè)市場,在很大程度上,這確實是正確的。對于受過良好教育的數(shù)據(jù)科學和機器學習的從業(yè)者們而言,有無數(shù)的機遇和無限的空間。
專業(yè)技術(shù)顯然是所有領(lǐng)域的基本要求,也是所有學科的實踐中最重要的要求。但是,成為一個成功的數(shù)據(jù)科學家所需的獨特品質(zhì)是什么呢?在交流并了解了數(shù)據(jù)科學家如何工作之后,筆者確定了成為成功的數(shù)據(jù)科學家的五大重要特質(zhì)。
適應力與創(chuàng)造力
卓越的數(shù)據(jù)科學家所擁有的一個極其有用的特質(zhì)是通過適應現(xiàn)代技術(shù)或獨特技術(shù)來解決復雜的任務,以達到最好的效果,以及創(chuàng)造性地解決工作,并以較低的空間和時間復雜度完成工作,即消耗最少的可用資源,盡可能快地高效完成工作。
數(shù)據(jù)科學家要解決的每一個任務都有其獨特之處,這些復雜的任務有各種不同的解決方法,因此,即使是最佳的解決方法也會有相應的差異。所以,適應力是產(chǎn)生最佳結(jié)果的一個重要方面。
創(chuàng)造性、批判性和分析性思維是數(shù)據(jù)科學家最吸引人的特點。跳出思維定式,實施創(chuàng)新想法的能力是一個成功的數(shù)據(jù)科學家所必需的。這些特質(zhì)是在行業(yè)層面表現(xiàn)突出的關(guān)鍵。
溝通技巧
有效交流是生活中大多數(shù)事情的核心概念,在大多數(shù)工作中也是如此。尤其在數(shù)據(jù)科學領(lǐng)域,溝通技巧起到關(guān)鍵作用。高效地執(zhí)行一個復雜的項目,同時進行有效的協(xié)調(diào)和溝通,是每個數(shù)據(jù)科學家的必備要求。
一個數(shù)據(jù)科學家必須要有認真傾聽主管、員工和其他任何人的指示的能力。一旦聽完,通過激烈的、有意義的、深思熟慮的交流來傳達觀點和想法,從而處理信息并且有效溝通,至關(guān)重要。數(shù)據(jù)科學家也需要指揮其隊友,有效地協(xié)調(diào),和組員一起完成手頭的特定任務。
團隊協(xié)作
更多的時候,大數(shù)據(jù)科學項目需要一批職能明確、積極高效的數(shù)據(jù)科學家,以最高的效率執(zhí)行特定的商業(yè)風險或任務。因此,他們必須為特定項目制作高質(zhì)量的模型,為自己的員工提供最好的服務。
團隊工作意義重大,因為它需要對正在進行的項目進行一致的信息交流。因此,這項工作需要數(shù)據(jù)科學家們集體努力,找出最佳的解決方案,提高模型的準確性,并在部署過程中產(chǎn)生最優(yōu)質(zhì)的結(jié)果。
圖源:unsplash
毅力
對筆者來說,數(shù)據(jù)科學項目中最有趣的部分是建立機器學習或深度學習模型,并確保它們順利工作,從而感覺良好。一旦它們符合相應要求,就可以部署這些已建立的模型。
然而,數(shù)據(jù)科學的很大一部分其實在于處理手頭的數(shù)據(jù)。網(wǎng)絡上自然存在的大部分數(shù)據(jù)都不干凈。為了提取有用的數(shù)據(jù),必須進行大量的清洗和預處理。大多數(shù)復雜的任務都需要進行關(guān)鍵性的分析和計算處理,以獲得理想的結(jié)果。毅力在每種情況中都極為重要,在數(shù)據(jù)科學領(lǐng)域,尤為如此。
即使是這個領(lǐng)域的專家,他們也會犯錯,并且為了解決某些問題而不得不查資料。這個領(lǐng)域可能是僅有的一個你不需要死記硬背很多東西的領(lǐng)域,因為你可以用谷歌來查找你忘記的東西。
然而,這完全沒問題,因為它僅僅是一個學習過程,堅持到底,你才能夠成長為一個更好的數(shù)據(jù)科學家。
較強的決策能力
處理計算任務的復雜情況并評估各種模型結(jié)果的質(zhì)量,這在行業(yè)層面極其重要。因此,必須做出強有力的決定,決定什么是解決當前復雜任務的最佳選擇和最佳可用資源。
舉幾個簡單的例子,假設一個機器學習任務,你能夠發(fā)現(xiàn)支持向量機(SVMs)在執(zhí)行某項任務時的準確率為97%,而像邏輯回歸這樣的機器學習算法能夠以98%的準確率執(zhí)行同樣的任務。數(shù)據(jù)科學家必須能夠確定每個特定任務的最佳選擇。
將這個例子進一步擴展到深度學習和神經(jīng)元網(wǎng)絡,數(shù)據(jù)科學家能夠相應地在TensorFlow或Pytorch這樣的深度學習框架之間切換,以選擇最適合當前任務的框架。
這些顯然只是一些簡單的例子。然而,對于數(shù)據(jù)科學家成倍地拓展思路,獲取更佳結(jié)果來說,決策能力極為關(guān)鍵。
這五種獨特的品質(zhì)是數(shù)據(jù)科學家必備的的最基本特征。技術(shù)技能同樣是必不可少的,基礎(chǔ)知識和對該學科的深刻理解保證了真正的方法。然而,在筆者看來,想要持久長期的成功,這些獨特品質(zhì)才是絕對必須的。