SAS:大數(shù)據(jù)時(shí)代 數(shù)據(jù)科學(xué)家將成稀缺人才
商業(yè)分析軟件與服務(wù)供應(yīng)商SAS在其***發(fā)布的一份公司刊物中稱(chēng),大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)科學(xué)家的需求將激增,而人才匱乏將成為各企業(yè)面臨的新挑戰(zhàn)。
SAS指出,大數(shù)據(jù)時(shí)代的來(lái)臨向人們展示了大數(shù)據(jù)分析對(duì)企業(yè)業(yè)務(wù)發(fā)展的神奇價(jià)值,與此同時(shí),大數(shù)據(jù)的數(shù)據(jù)量巨大、非結(jié)構(gòu)性強(qiáng)、數(shù)據(jù)來(lái)源龐雜,使得大數(shù)據(jù)的處理與分析需要有別于傳統(tǒng)數(shù)據(jù)分析的新技術(shù)(如高性能分析HPA)和新人才。
數(shù)據(jù)科學(xué)家定位
數(shù)據(jù)科學(xué)家集技術(shù)專(zhuān)家與數(shù)量分析師的角色于一身。他們和傳統(tǒng)數(shù)量分析師的區(qū)別在于:后者通常利用企業(yè)的內(nèi)部數(shù)據(jù)進(jìn)行分析,以支持領(lǐng)導(dǎo)層的決策;而前者更多的是通過(guò)關(guān)注面向用戶(hù)的數(shù)據(jù)來(lái)創(chuàng)造不同特性的產(chǎn)品和流程,為客戶(hù)提供有意義的增值服務(wù)。面向客戶(hù)的性質(zhì)決定了大部分?jǐn)?shù)據(jù)科學(xué)家擔(dān)任公司產(chǎn)品開(kāi)發(fā)或營(yíng)銷(xiāo)部門(mén)的職位,或是效力于***技術(shù)官。
專(zhuān)注高性能分析的數(shù)據(jù)科學(xué)家未必是非結(jié)構(gòu)化數(shù)據(jù)處理的專(zhuān)家,但他們需要探索不同途徑,利用高性能分析(HPA)節(jié)省下來(lái)的時(shí)間不斷改良分析模型、提高決策速度,以配合數(shù)據(jù)分析更快的生命周期。
數(shù)據(jù)科學(xué)家必備技能
數(shù)據(jù)科學(xué)家需要具備技術(shù)、商業(yè)、分析與關(guān)系學(xué)等各方面的綜合技能。很多數(shù)據(jù)科學(xué)家都擁有高級(jí)計(jì)算機(jī)科學(xué)學(xué)位,或物理學(xué)、生物科學(xué)或社會(huì)科學(xué)等一系列對(duì)計(jì)算機(jī)技能有相當(dāng)要求的高級(jí)學(xué)位。數(shù)據(jù)科學(xué)家面對(duì)、處理的數(shù)據(jù)量可高達(dá)TB級(jí)規(guī)模,這就要求了他們必須掌握相當(dāng)多的專(zhuān)業(yè)技能,SAS歸納了以下六點(diǎn):
•處理分布式文件系統(tǒng)工具的能力,如Hadoop、MapReduce等
•Python、Java、 Pig與Hive等編程語(yǔ)言
•機(jī)器學(xué)習(xí)能力
•非傳統(tǒng)型數(shù)據(jù)庫(kù)工具,如Vertica及MongoDB等
•自然語(yǔ)言的處理
•統(tǒng)計(jì)工具的使用
事實(shí)上,擁有上述這些高級(jí)學(xué)位和專(zhuān)業(yè)技能還不夠,數(shù)據(jù)科學(xué)家同樣需要具備一個(gè)分析師的素質(zhì),比如數(shù)學(xué)和統(tǒng)計(jì)技能,對(duì)商業(yè)的敏銳嗅覺(jué),以及與客戶(hù)、產(chǎn)品經(jīng)理和決策層有效溝通的能力。當(dāng)然,要一個(gè)員工具備上述所有能力并不容易做到,所以不少企業(yè)組建了專(zhuān)門(mén)的數(shù)據(jù)科學(xué)團(tuán)隊(duì),希望通過(guò)人才的多元組合,全面應(yīng)對(duì)各種需求。
招募與培養(yǎng)數(shù)據(jù)科學(xué)家
獨(dú)立調(diào)查研究機(jī)構(gòu)Gartner在2012年于佛羅里達(dá)奧蘭多市召開(kāi)的Symposium/ITxpo大會(huì)上指出:“大數(shù)據(jù)將在未來(lái)十年內(nèi)成為新的常規(guī)標(biāo)準(zhǔn),十年后對(duì)超大規(guī)模的系統(tǒng)及數(shù)據(jù)進(jìn)行研究將成為非常普遍的現(xiàn)象。但目前業(yè)界非常缺乏對(duì)所有數(shù)據(jù)以及數(shù)據(jù)的使用方法都很了解的數(shù)據(jù)科學(xué)家人才,我們的公共和私有教育系統(tǒng)尚不能滿(mǎn)足我們?cè)谶@方面的需求。數(shù)據(jù)專(zhuān)家將是一種稀有和寶貴的財(cái)富。”
目前在高等院校幾乎沒(méi)有設(shè)置針對(duì)數(shù)據(jù)科學(xué)的專(zhuān)業(yè)課程,但已經(jīng)有一些院校開(kāi)始嘗試與像SAS這樣的企業(yè)合作,開(kāi)辟出一門(mén)或幾門(mén)有針對(duì)性的專(zhuān)業(yè)課程并對(duì)外開(kāi)放。一些有志于發(fā)展大數(shù)據(jù)業(yè)務(wù)或服務(wù)的企業(yè)則開(kāi)始有的放矢地開(kāi)設(shè)企業(yè)內(nèi)訓(xùn)課程,從企業(yè)內(nèi)部培養(yǎng)未來(lái)的數(shù)據(jù)科學(xué)家, 如EMC開(kāi)設(shè)了面向內(nèi)部員工及客戶(hù)的“數(shù)據(jù)科學(xué)及數(shù)據(jù)分析”培訓(xùn)課程。一些咨詢(xún)公司也開(kāi)始向客戶(hù)提供他們所需要的數(shù)據(jù)科學(xué)家人才。
SAS鼓勵(lì)企業(yè)在大數(shù)據(jù)時(shí)代形勢(shì)下盡早開(kāi)始數(shù)據(jù)科學(xué)家的人才儲(chǔ)備,將有利于提升企業(yè)的核心競(jìng)爭(zhēng)力。
SAS在高級(jí)商業(yè)分析領(lǐng)域擁有近40年的經(jīng)驗(yàn),自SAS在美國(guó)北卡羅來(lái)納州創(chuàng)建以來(lái),一直不斷尋找方法來(lái)播撒新技術(shù)和先進(jìn)知識(shí)的種子。在美國(guó),SAS針對(duì)教育者和學(xué)生所設(shè)計(jì)的軟件被6,000所學(xué)校的35,000多名教師所使用,高校使用SAS軟件超過(guò)36年之久。
在中國(guó),SAS去年舉辦的“構(gòu)建知識(shí)的力量、抓住未來(lái)機(jī)遇”全國(guó)高校巡講非常成功,今年仍會(huì)繼續(xù)通過(guò)技術(shù)講座、現(xiàn)場(chǎng)交流等方式,向師生介紹當(dāng)今大數(shù)據(jù)趨勢(shì)下智能分析解決方案等技術(shù)動(dòng)態(tài),通過(guò)分享典型應(yīng)用,讓更多在校學(xué)生掌握商業(yè)智能技術(shù),幫助他們提高在未來(lái)就業(yè)市場(chǎng)上的競(jìng)爭(zhēng)力。