知乎熱議:未來3到5年內(nèi),哪個(gè)方向機(jī)器學(xué)習(xí)人才最稀缺?
未來3到5年內(nèi),哪個(gè)方向的機(jī)器學(xué)習(xí)人才最緊缺?今天我們就來梳理一下。全棧式工程師在初創(chuàng)公司受歡迎,領(lǐng)域?qū)>乃惴ㄈ瞬旁诖蠊竞艹韵悖瑧?yīng)用型人才能夠快速提升業(yè)務(wù),而工程化是落地的重要一環(huán)。
AI專業(yè)畢業(yè)后好找工作嗎?
此前,知乎上一位CV專業(yè)的985高校研究生曾坦言,當(dāng)初選擇該方向時(shí),深度學(xué)習(xí)正處于大熱階段,無人駕駛,人臉識(shí)別聽起來就很高大上,似乎人人都想往這方向轉(zhuǎn)。
然而,到了找工作的時(shí)候,這哥們發(fā)現(xiàn)就業(yè)形式和他想的相差太大:
最近陸陸續(xù)續(xù)有公司開始秋招的提前批了,計(jì)算機(jī)視覺崗位招的清一色算法工程師,沒有論文,或者大賽獲獎(jiǎng)的找到算法崗的簡直不要太難,周圍的同學(xué)都開始紛紛轉(zhuǎn)Java開發(fā),自己也開始慌了。
想到學(xué)了兩年的CV,最后工作找不到,一時(shí)間十分失落,感覺如果去做Java開發(fā),還不如本科一畢業(yè)就出去工作,完全沒有讀研的必要。
那么,機(jī)器學(xué)習(xí)大規(guī)模發(fā)展是不是只是個(gè)幻覺?未來3到5年內(nèi),哪個(gè)方向的機(jī)器學(xué)習(xí)人才最緊缺?
這可能是每個(gè)正在學(xué)習(xí)這個(gè)專業(yè)的人,最為關(guān)心的。
華為云開發(fā)者社區(qū)表示,目前機(jī)器學(xué)習(xí)人才還是稀缺。
每人每天至少產(chǎn)生1G以上的數(shù)據(jù),還有大量的數(shù)據(jù)尚未加以利用。每一個(gè)垂直細(xì)分的應(yīng)用場景,都可以通過機(jī)器學(xué)習(xí)產(chǎn)生應(yīng)用價(jià)值。這也就意味著相關(guān)領(lǐng)域的人才大量的稀缺。
總結(jié)起來,主要有以下幾個(gè)方面的人才最為稀缺。
靈活解決問題的全棧工程師
全棧工程師是指掌握多種技能,勝任前端與后端,能利用多種技能獨(dú)立完成產(chǎn)品的人。
中科院大學(xué),計(jì)算機(jī)應(yīng)用技術(shù)博士王晉東表示,全棧式的人才最為稀缺,現(xiàn)在很多搞模型的,或者偏重某一方面的,距離解決實(shí)際問題是遠(yuǎn)遠(yuǎn)不夠的。
而人工智能全棧工程師比通常意義的全棧工程師更復(fù)雜一些,難度也更大,主要是算法實(shí)現(xiàn)跟傳統(tǒng)的全棧區(qū)別很大,從應(yīng)用層級(jí)來講,分計(jì)算機(jī)視覺、自然語言處理、語音識(shí)別三個(gè)大方向。
細(xì)分的話就更多了,計(jì)算機(jī)視覺方向來說又可細(xì)分為目標(biāo)檢測、姿態(tài)估計(jì)、人臉識(shí)別等,所以要做人工智能全棧需要投入更多的精力,也需要對各個(gè)方向的算法有深刻理解。
人工智能全棧通常是基于大廠的云平臺(tái)進(jìn)行開發(fā),人工智能領(lǐng)域很多基礎(chǔ)的組件已經(jīng)封裝好,對業(yè)務(wù)和整個(gè)項(xiàng)目的架構(gòu)有了全面了解,就可以上手開發(fā)了,需要結(jié)合業(yè)務(wù)快速變現(xiàn)的場景,對「全?!沟男枨髸?huì)多一些,在普遍繁榮時(shí)期是可以大有作為的。
但人工智能全棧工程師發(fā)展如何,還要看整個(gè)行業(yè)大形勢,如果各個(gè)方向都開始優(yōu)勝略汰,「全?!故侨狈诵母偁幜Φ?,因?yàn)樗惴ㄊ莿e人的。
專精一個(gè)領(lǐng)域的算法人才
有知友提到,專精一個(gè)領(lǐng)域的算法人才會(huì)比較吃香。
這里算法人才包括算法研究員和算法工程師。
算法研究員致力于解決更通用,更抽象的問題,如何解決GAN訓(xùn)練時(shí)的穩(wěn)定性等,而算法工程師更多關(guān)注如何解決問題,比如某個(gè)場景下出現(xiàn)了badcase,我就想辦法解決問題,是數(shù)據(jù)預(yù)處理,還是參數(shù)需要調(diào)整。
此外能快速復(fù)現(xiàn)論文結(jié)果的算法研究員也是各大公司爭搶的香餑餑。因?yàn)閷W(xué)術(shù)界很多新成果只有一個(gè)描述,并沒有給出源代碼,想應(yīng)用它的研究成果,需要自己實(shí)現(xiàn),所以能快速復(fù)現(xiàn)論文的算法研究員對公司來說也是很有價(jià)值。
我們?nèi)フ衅妇W(wǎng)站搜算法崗,可以大體看出資深算法專家薪資上限很高,但是崗位需求并沒有算法工程師多,畢竟企業(yè)還是要賺錢的,所以算法工程師(尤其是推薦方向)也很有市場。
研究員覺得工程師的活沒技術(shù)含量,工程師可能會(huì)覺得你天天整些虛的又解決不了問題,紙上談兵。算法作為一個(gè)公司的核心資源,兩者其實(shí)都有發(fā)揮的空間,跟公司的業(yè)務(wù)需求關(guān)系很大。
做算法研究也好,工程也好,選對方向很重要,單從行業(yè)飽和度來說,圖像也就是視覺方向確實(shí)人滿為患了,語音又特別難,而且缺乏大量的可用數(shù)據(jù),自然語言處理方向倒是可以考慮一下。
一來各種SOTA模型大多針對英語的,到中文有個(gè)遷移問題,二來中文跟英文在文法、語義方面存在差異,有很多空白研究領(lǐng)域。
知乎答主紫杉舉了一個(gè)例子,什么是精通一個(gè)領(lǐng)域。
他的一個(gè)名叫伊森的同學(xué),從伊利諾伊香檳畢業(yè)(計(jì)算機(jī)專業(yè)名校),讀了兩年計(jì)算機(jī)研究生,是一位非常優(yōu)秀,有自學(xué)能力的學(xué)生。
結(jié)果面試時(shí)伊森沒能應(yīng)聘成功。伊森的背景和很多進(jìn)入人工智能領(lǐng)域的人很相似。答主分享了下面一段對話:
最后伊森還問他,如何在一周內(nèi)精通自然語言處理,然后答主只能告訴他不知道。
這個(gè)例子表明,有些同學(xué)擅長快速學(xué)習(xí),卻很容易陷入每一個(gè)領(lǐng)域都想學(xué)的陷阱,到頭來覺得學(xué)了很多,實(shí)際遇到問題就無從著手,或者浪費(fèi)很長時(shí)間尋找問題根源。
如何才算精通一個(gè)領(lǐng)域?說自己精通某一領(lǐng)域,在人工智能領(lǐng)域往往是不太恰當(dāng)?shù)摹,F(xiàn)在無論是硬件還是算法都在快速的迭代,今天的SOTA明天可能就成兜底了,只有不斷迭代自己的知識(shí),才能跟上業(yè)務(wù)和場景的發(fā)展,讓自己不落下風(fēng)。
熟悉業(yè)務(wù)又懂算法的應(yīng)用型選手
另外,既懂算法,又有某一行業(yè)的豐富經(jīng)驗(yàn)也很重要。機(jī)器學(xué)習(xí)雖然是通用技術(shù),工程師也基本是計(jì)算機(jī)出身,但落地需要具體到行業(yè)應(yīng)用,如何結(jié)合行業(yè)實(shí)操,解決實(shí)際問題。
中國科學(xué)院大學(xué)研究員表示,短期內(nèi)最缺的肯定是應(yīng)用型人才。
很多行業(yè)想轉(zhuǎn)型為數(shù)據(jù)驅(qū)動(dòng)或者AI賦能的,借助于外包或者咨詢公司通常很難成功,因?yàn)槿狈π袠I(yè)經(jīng)驗(yàn),這時(shí)從傳統(tǒng)行業(yè)轉(zhuǎn)型到人工智能的應(yīng)用型人才就至關(guān)重要了,他們對機(jī)器學(xué)習(xí)的研究本身就植根于業(yè)務(wù)需求,所以更接地氣,落地也更快。
中科大研究員舉了一個(gè)很生動(dòng)的例子。
很多高校的財(cái)務(wù)人員,每天大量重復(fù)性勞動(dòng),處理發(fā)票、報(bào)銷單,將紙質(zhì)單號(hào)手動(dòng)輸入電子系統(tǒng)里,過程非常的麻煩。但其實(shí)高校及科研單位研究計(jì)算機(jī)視覺、文字識(shí)別、目標(biāo)檢測的團(tuán)隊(duì)枚不勝數(shù),為什么不能用機(jī)器學(xué)習(xí)的方法來節(jié)省時(shí)間呢?
這個(gè)例子就暴露了一個(gè)問題,大多數(shù)機(jī)器學(xué)習(xí)研究關(guān)注的是模型本身,是否是業(yè)界最先進(jìn)的(SOTA),卻忽視了算法的適用對象以及實(shí)際的應(yīng)用場景。因此,最稀缺的是既懂算法又能將算法進(jìn)行落地轉(zhuǎn)化的人。
答主微調(diào)拋出金句「對于絕大部分人而言,努力成為交叉領(lǐng)域的熟手,比成為計(jì)算機(jī)科學(xué)家要現(xiàn)實(shí)且有意義?!?/p>
學(xué)術(shù)模型工程化人才
算法要落地為產(chǎn)品,還需要模型的工程化,如果這塊能夠深入,那么必然是不可多得的人才。
像抖音的推薦系統(tǒng),如何解決海量數(shù)據(jù)擁堵,移動(dòng)端優(yōu)化等工程上有非常多的挑戰(zhàn)。
結(jié)合上文答主紫杉舉的例子。
Nihil (尼希爾)是另一個(gè)他認(rèn)識(shí)的研究生,也是從伊利諾伊香檳大學(xué)畢業(yè)。他之前在LinkedIn(領(lǐng)英)做大規(guī)模搜索(Scaled Search),專門負(fù)責(zé)把理論算法擴(kuò)大到工業(yè)場景中,擅長搭建后臺(tái),有很強(qiáng)的工程背景。兩年的斯坦福計(jì)算機(jī)碩士后,現(xiàn)在被Snapchat找去做大規(guī)模視頻搜索算法。
相比于上文的伊森,他是公司更想要的人才。為什么呢?
因?yàn)樗陬I(lǐng)英和Snapchat這樣的大公司做大規(guī)模搜索的算法,這其中的工程難度和實(shí)驗(yàn)室是不可同日而語的。
任何人都可以跑一個(gè)LSTM,但是當(dāng)訓(xùn)練數(shù)據(jù)極具擴(kuò)張時(shí),LSTM需要跑3天才能見完所有的數(shù)據(jù),在這個(gè)情況下,就需要更工程化的實(shí)現(xiàn),做分布式計(jì)算或者優(yōu)化算法本身的效率,使用更快的數(shù)據(jù)結(jié)構(gòu)等。
這樣的場景就需要有研究背景的人才,能夠結(jié)合學(xué)術(shù)前沿切實(shí)的解決工業(yè)上的難題,深度學(xué)習(xí)50%是學(xué)術(shù),50%是工程?,F(xiàn)特斯拉AI主管Andrej Karpathy主要就是干這活的。
此外,很多人提到調(diào)參工程師。
一位中國科學(xué)院大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)博士表示,AutoML越來越受重視,技術(shù)含量不高的調(diào)參工程師未來很可能被取代。
最后值得一提的是像Bengio、 Hinton這些深度學(xué)習(xí)領(lǐng)域的神級(jí)人物,當(dāng)然是很需要,但是這類人才真的是可望而不可及。