從人工智能到團隊合作:數(shù)據(jù)科學家的七項關鍵技能
如今的數(shù)據(jù)科學家具有的技能不僅需要精通人工智能和Python,還需要擅長與企業(yè)高管進行溝通。
美國勞工統(tǒng)計局將數(shù)據(jù)科學家列為未來增長最快的15個職業(yè)之一,預計在未來10年的工作崗位增長率將達到31%。隨著數(shù)據(jù)日益成為所有企業(yè)的命脈,數(shù)據(jù)科學家不僅需要具備過硬的知識和技能,還需要具備強大的商業(yè)頭腦。
1.機器學習/神經網絡技能
2021年,機器學習方法(如遷移學習和Transformer)將引起很多關注,因為它們正在迅速推動許多不同領域的創(chuàng)新。對于構建和訓練神經網絡,PyTorch背后有很大的推動力,Keras和TensorFlow也是常用的。還有豐富的軟件庫生態(tài)系統(tǒng),其中許多是開源的,可以幫助加速機器學習和數(shù)據(jù)科學應用程序。
人工智能威脅檢測和響應服務提供商Vectra公司數(shù)據(jù)科學高級主管Matthew Silver說:“數(shù)據(jù)科學家可以通過對機器學習算法的工作原理和工作方式來展示自己的魅力,這對于克服培訓和測試過程中不可避免的挑戰(zhàn)非常重要。ONNX是一種神經網絡標準,促進了平臺、庫和語言獨立的模型部署,幫助我們簡化了生產中人工智能的使用,并加快了建模工作。”
2.編程技能
對于數(shù)據(jù)科學家來說,為探索性分析、數(shù)據(jù)預處理和算法訓練以及在某些情況下在生產中部署模型編寫高質量且可維護的代碼非常重要。Python、JavaScript、R和Scala是最適合開發(fā)的語言。另一個有用的技能是了解如何從其他人可以部署的模型構建WebAPI。
Silver說,“能夠在工作中開始使用通用軟件庫來構建模型的數(shù)據(jù)科學家是最具競爭力的,并且在幾乎所有情況下,具有強大的軟件開發(fā)技能都是加分項。”
3.了解云計算
了解云計算工程原理和云計算基礎設施的數(shù)據(jù)科學家對于雇主來說更具吸引力。這意味著需要三大公有云提供商(微軟、AWS、谷歌)提供的云計算服務。每個云計算供應商都為數(shù)據(jù)科學家提供了一套全面的工具,用于數(shù)據(jù)提取、數(shù)據(jù)清理、可視化和機器學習目的。
網絡資產管理和治理解決方案提供商Jupiter One公司首席架構師Phillip Gates-Idem說,“我們正在尋求熟悉云計算基礎設施、持續(xù)集成(CI)/持續(xù)交付(CD)管道和自動化的數(shù)據(jù)科學家。數(shù)據(jù)科學家需要對如何使用云計算基礎設施構建和使用工具有著深刻的了解。”
4.統(tǒng)計數(shù)據(jù)
統(tǒng)計學是一個數(shù)學領域,旨在使用給定數(shù)據(jù)集的模型和表示來收集和解釋定量數(shù)據(jù),是數(shù)據(jù)科學的核心,其中包括概率、可變性、回歸和集中趨勢等概念。
IT咨詢機構Netrix公司的首席架構師Lars Kemmann說,“如果沒有深入了解統(tǒng)計學(數(shù)據(jù)科學的核心)以及如何將合理的數(shù)學推理應用于正在處理的問題,那么我們不在乎采用多少平臺或語言。我認為招聘這樣的人才是目前行業(yè)面臨的一個挑戰(zhàn)。”
5.項目管理
由于數(shù)據(jù)科學項目可能涉及漫長的探索階段,甚至在后期也存在多個未知因素,因此項目管理是數(shù)據(jù)科學家需要具備的另一項關鍵技能。例如采用敏捷方法,可以讓數(shù)據(jù)科學家根據(jù)需求和目標確定優(yōu)先級并創(chuàng)建路線圖。
Silver解釋說,““通常很難預測開發(fā)和訓練機器學習模型需要多長時間,,等待更新模型或結果的企業(yè)往往會有時間表和計劃,因為這種不可預測性而受到影響。數(shù)據(jù)科學家能夠通過從一開始就了解局限性、隨著工作的進展傳達項目狀態(tài),并預測他們何時能夠提供下一個有意義的讀數(shù),從而掌控主要建模工作,他們將在我們的團隊中發(fā)揮著重要作用。”
6.數(shù)據(jù)講故事/可視化
盡管企業(yè)的數(shù)據(jù)可能具有巨大的潛在價值,但除非能夠發(fā)現(xiàn)這些見解并將其轉化為行動或業(yè)務成果,否則無法創(chuàng)造任何價值。Plotly、Tableau和D3是當今需求量最大的數(shù)據(jù)科學可視化和講故事的工具。
Kemmann說,“當客戶不了解企業(yè)在做什么時,他們很容易低估企業(yè)所做的工作,尤其是在數(shù)據(jù)準備階段。數(shù)據(jù)科學家以企業(yè)的客戶可以理解的語言清楚地解釋每個步驟的過程和好處,并在可能的情況下通過適當?shù)臄?shù)據(jù)可視化提供支持,這是其工作角色的關鍵部分。”
7.溝通能力
數(shù)據(jù)科學家現(xiàn)在比以往任何時候都有更多的機會“親自動手”處理數(shù)據(jù),但這需要對業(yè)務目標有很強的理解,并有能力清楚地傳達和解釋技術術語。能夠將數(shù)據(jù)轉化為有用術語的數(shù)據(jù)科學家能夠增加額外價值。
IT人力資源提供商RobertHalf Technology公司區(qū)域經理Joshua Drew說,“能夠將這些數(shù)據(jù)轉化為清晰、易于理解的業(yè)務信息將是一項巨大的技能,而數(shù)據(jù)科學家并不總是具備這些軟技能,或者具備能夠向企業(yè)高管澄清其決策過程的經驗。”