自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

未來 3~5 年內(nèi),哪個方向的機器學(xué)習(xí)人才緊缺?

人工智能 機器學(xué)習(xí)
撇開學(xué)術(shù)界需求因為大部分人最終不會從事算法研究,而會奮斗在一線應(yīng)用領(lǐng)域。相較而言,工業(yè)界對人才的需求更加保守。這受限于很多客觀因素,如硬件運算能力、數(shù)據(jù)安全、算法穩(wěn)定性、人力成本開支等。

 基本簡介

撇開學(xué)術(shù)界需求因為大部分人最終不會從事算法研究,而會奮斗在一線應(yīng)用領(lǐng)域。相較而言,工業(yè)界對人才的需求更加保守。這受限于很多客觀因素,如硬件運算能力、數(shù)據(jù)安全、算法穩(wěn)定性、人力成本開支等。

[[269732]]

這個答案可能更適合兩類人: 1. 在讀學(xué)生 2. 工作不久想要轉(zhuǎn)行機器學(xué)習(xí)的朋友。特別厲害的技術(shù)大牛建議探索適合自己的路線,而我只能泛泛談?wù)勥m合大部分人的路線。但在回答前,我還是忍不住吐槽一下那種簡單回答“深度學(xué)習(xí)”,“大數(shù)據(jù)”,“NLP”,“機器視覺”的人。這每一個領(lǐng)域的小方向都多如牛毛,以自然語言處理(NLP)為例,細分有自然語言生成、自然語言理解,還有不同語言的語言模型。任何一個方向花幾十年研究也不為過,只給出幾個字的答案和買彩票有什么區(qū)別...因此大部分機器學(xué)習(xí)實踐者還是該腳踏實地。盲目追逐熱點很容易跌進陷阱,而鞏固基礎(chǔ)、尋找自己擅長的領(lǐng)域和機器學(xué)習(xí)交叉點可以幫助你在未來的就業(yè)市場變得炙手可熱,成為工業(yè)界緊缺的人才。

0. 背景

工業(yè)界未來需要什么樣的機器學(xué)習(xí)人才?老生常談,能將模型應(yīng)用于專業(yè)領(lǐng)域的人,也就是跨領(lǐng)域讓機器學(xué)習(xí)落地的人。有人會問現(xiàn)在我們不就需要這樣的人嗎?答案是肯定的,我們需要并將長期需要這樣的人才,現(xiàn)階段的機器學(xué)習(xí)落地還存在各種各樣的困難。這樣的需求不會是曇花一現(xiàn),這就跟web開發(fā)是一個道理,從火熱到降溫也經(jīng)過了十年的周期。一個領(lǐng)域的發(fā)展有特定的周期,機器學(xué)習(xí)的門檻比web開發(fā)高而且正屬于朝陽期,所以大家致力于成為“專精特定領(lǐng)域”的機器學(xué)習(xí)專家并不過時。

什么是特定領(lǐng)域的機器學(xué)習(xí)專家?舉個例子,我以前曾回答“人工智能是否會替代財務(wù)工作者”時提到我曾在某個公司研究如何用機器學(xué)習(xí)自動化一部分審計工作,但遇到的最大困難是我自己對審計的了解有限,而其他審計師對我的工作不是非常支持導(dǎo)致進展緩慢。所以如果你有足夠的機器學(xué)習(xí)知識,并對特定領(lǐng)域有良好的理解,在職場供求中你肯定可以站在優(yōu)勢的那一邊。以我的另一個回答為例「反欺詐(Fraud Detection)中所用到的機器學(xué)習(xí)模型有哪些?」,特定領(lǐng)域的知識幫助我們更好的解釋機器學(xué)習(xí)模型的結(jié)果,得到老板和客戶的認可,這才是算法落了地。能寫代碼、構(gòu)建模型的人千千萬,但理解自己在做什么,并從中結(jié)合自己的領(lǐng)域知識提供商業(yè)價值的人少之又少。所以調(diào)侃一句,哪個方向的機器學(xué)習(xí)人才最緊缺?答:每個領(lǐng)域都需要專精的機器學(xué)習(xí)人才,你對特定領(lǐng)域的理解就是你的武器。

當(dāng)然,給喂雞湯不給勺很不厚道,所以我也會給出一些具體建議。再次申明,我的建議僅給以就業(yè)為目的的朋友,走研究路線我有不同的建議,本文不再贅述。[[269733]]

1. 基本功

說到底機器學(xué)習(xí)還是需要一定的專業(yè)知識,這可以通過學(xué)校學(xué)習(xí)或者自學(xué)完成。但有沒有必要通曉數(shù)學(xué),擅長優(yōu)化呢?我的看法是不需要的,大前提是需要了解基本的數(shù)學(xué)統(tǒng)計知識即可,更多的討論可以看我這個答案「阿薩姆:如何看待「機器學(xué)習(xí)不需要數(shù)學(xué),很多算法封裝好了,調(diào)個包就行」這種說法?」。最低程度下我建議掌握五個小方向,對于現(xiàn)在和未來幾年內(nèi)的工業(yè)界夠用了。再一次重申,我對于算法的看法是大部分人不要造輪子,不要造輪子,不要造輪子!只要理解自己在做什么,知道選擇什么模型,直接調(diào)用API和現(xiàn)成的工具包就好了。

  • 回歸模型(Regression)。學(xué)校的課程中其實講得更多的都是分類,但事實上回歸才是工業(yè)屆最常見的模型。比如產(chǎn)品定價或者預(yù)測產(chǎn)品的銷量都需要回歸模型。現(xiàn)階段比較流行的回歸方法是以數(shù)為模型的xgboost,預(yù)測效果很好還可以對變量重要性進行自動排序。而傳統(tǒng)的線性回歸(一元和多元)也還會繼續(xù)流行下去,因為其良好的可解釋性和低運算成本。如何掌握回歸模型?建議閱讀Introduction to Statistical Learning的2-7章,并看一下R里面的xgboost的package介紹。
  • 分類模型(Classification)。這個屬于老生常談了,但應(yīng)該對現(xiàn)在流行并將繼續(xù)流行下去的模型有深刻的了解。舉例,隨機森林(Random Forests)和支持向量機(SVM)都還屬于現(xiàn)在常用于工業(yè)界的算法。可能很多人想不到的是,邏輯回歸(Logistic Regression)這個常見于大街小巷每一本教科書的經(jīng)典老算法依然占據(jù)了工業(yè)界大半壁江山。這個部分推薦看李航《統(tǒng)計學(xué)習(xí)方法》,挑著看相對應(yīng)的那幾章即可。
  • 神經(jīng)網(wǎng)絡(luò)(Neural Networks)。我沒有把神經(jīng)網(wǎng)絡(luò)歸結(jié)到分類算法還是因為現(xiàn)在太火了,有必要學(xué)習(xí)了解一下。隨著硬件能力的持續(xù)增長和數(shù)據(jù)集愈發(fā)豐富,神經(jīng)網(wǎng)絡(luò)的在中小企業(yè)的發(fā)揮之處肯定會有。三五年內(nèi),這個可能會發(fā)生。但有人會問了,神經(jīng)網(wǎng)絡(luò)包含內(nèi)容那么豐富,比如結(jié)構(gòu),比如正則化,比如權(quán)重初始化技巧和激活函數(shù)選擇,我們該學(xué)到什么程度呢?我的建議還是抓住經(jīng)典,掌握基本的三套網(wǎng)絡(luò): a. 普通的ANN b. 處理圖像的CNN c. 處理文字和語音的RNN(LSTM)。對于每個基本的網(wǎng)絡(luò)只要了解經(jīng)典的處理方式即可,具體可以參考《深度學(xué)習(xí)》的6-10章和吳恩達的Deep Learning網(wǎng)課(已經(jīng)在網(wǎng)易云課堂上線)。
  • 數(shù)據(jù)壓縮/可視化(Data Compression & Visualization)。在工業(yè)界常見的就是先對數(shù)據(jù)進行可視化,比如這兩年很火的流形學(xué)習(xí)(manifold learning)就和可視化有很大的關(guān)系。工業(yè)界認為做可視化是磨刀不誤砍柴工,把高維數(shù)據(jù)壓縮到2維或者3維可以很快看到一些有意思的事情,可能能節(jié)省大量的時間。學(xué)習(xí)可視化可以使用現(xiàn)成的工具,如Qlik Sense和Tableau,也可以使用Python的Sklearn和Matplotlib。
  • 無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)(Unsupervised & Semi-supervised Learning)。工業(yè)界的另一個特點就是大量的數(shù)據(jù)缺失,大部分情況都沒有標(biāo)簽。以最常見的反詐騙為例,有標(biāo)簽的數(shù)據(jù)非常少。所以我們一般都需要使用大量的無監(jiān)督,或者半監(jiān)督學(xué)習(xí)來利用有限的標(biāo)簽進行學(xué)習(xí)。多說一句,強化學(xué)習(xí)在大部分企業(yè)的使用基本等于0,估計在未來的很長一陣子可能都不會有特別廣泛的應(yīng)用。[[269733]]

2. 秘密武器

有了基本功只能說明你可以輸出了,怎么才能使得你的基本功不是屠龍之術(shù)?必須要結(jié)合領(lǐng)域知識,這也是為什么我一直勸很多朋友不要盲目轉(zhuǎn)機器學(xué)習(xí)從零做起。而學(xué)生朋友們可以更多的關(guān)注自己感興趣的領(lǐng)域,思考如何可以把機器學(xué)習(xí)運用于這個領(lǐng)域。比如我自己對歷史和哲學(xué)很感興趣,常常在思考機器學(xué)習(xí)和其他文科領(lǐng)域之間的聯(lián)系,也寫過一些開腦洞的文章「 帶你了解機器學(xué)習(xí)(一): 機器學(xué)習(xí)中的“哲學(xué)”」。

而已經(jīng)有了工作/研究經(jīng)驗的朋友,要試著將自己的工作經(jīng)歷利用起來。舉例,不要做機器學(xué)習(xí)里面最擅長投資的人,而要做金融領(lǐng)域中最擅長機器學(xué)習(xí)的專家,這才是你的價值主張(value proposition)。最重要的是,機器學(xué)習(xí)的基本功沒有大家想的那么高不可攀,沒有必要放棄自己的本專業(yè)全職轉(zhuǎn)行,沉沒成本太高。通過跨領(lǐng)域完全可以做到曲線救國,化劣勢為優(yōu)勢,你們可能比只懂機器學(xué)習(xí)的人有更大的行業(yè)價值。

舉幾個我身邊的例子,我的一個朋友是做傳統(tǒng)軟件工程研究的,前年他和我商量如何使用機器學(xué)習(xí)以GitHub上的commit歷史來識別bug,這就是一個很好的結(jié)合領(lǐng)域的知識。如果你本身是做金融出身,在你補足上面基本功的同時,就可以把機器學(xué)習(xí)交叉運用于你自己擅長的領(lǐng)域,做策略研究,我已經(jīng)聽說了無數(shù)個“宣稱”使用機器學(xué)習(xí)實現(xiàn)了交易策略案例。雖不可盡信,但對特定領(lǐng)域的深刻理解往往就是捅破窗戶的那最后一層紙,只理解模型但不了解數(shù)據(jù)和數(shù)據(jù)背后的意義,導(dǎo)致很多機器學(xué)習(xí)模型只停留在好看而不實用的階段。

換個角度思考,不同領(lǐng)域的人都有了對機器學(xué)習(xí)的理解能更好的促進這個技術(shù)落地,打破泡沫的傳言。而對于大家而言,不用再擔(dān)心自己會失業(yè),還能找到自己的角度在這個全民深度學(xué)習(xí)的時代找到“金飯碗”。所以我建議各行各業(yè)的從業(yè)者不必盲目的轉(zhuǎn)計算機或者機器學(xué)習(xí),而應(yīng)該加深對本專業(yè)的了解并自學(xué)補充上面提到的基本功,自己成為這個領(lǐng)域的機器學(xué)習(xí)專家。

3. 彈藥補給

沒有什么不會改變,這個時代的科技迭代速度很快。從深度學(xué)習(xí)開始發(fā)力到現(xiàn)在也不過短短十年,所以沒有人知道下一個會火的是什么?以深度學(xué)習(xí)為例,這兩年非常火的對抗生成網(wǎng)絡(luò)(GAN),多目標(biāo)學(xué)習(xí)(multi-lable learning),遷移學(xué)習(xí)(transfer learning)都還在飛速的發(fā)展。有關(guān)于深度學(xué)習(xí)為什么有良好泛化能力的理論猜想文章在最新的NIPS聽說也錄了好幾篇。這都說明了沒有什么行業(yè)可以靠吃老本一直瀟灑下去,我們還需要追新的熱點。但機器學(xué)習(xí)的范圍和領(lǐng)域真的很廣,上面所說的都還是有監(jiān)督的深度學(xué)習(xí),無監(jiān)督的神經(jīng)網(wǎng)絡(luò)和深度強化學(xué)習(xí)也是現(xiàn)在火熱的研究領(lǐng)域。所以我的建議是盡量關(guān)注、學(xué)習(xí)了解已經(jīng)成熟和已經(jīng)有實例的新熱點,不要凡熱點必追。

如果你有這些基本功和良好的領(lǐng)域結(jié)合能力,三年五年絕不是職業(yè)的瓶頸期,甚至十年都還太早。科技時代雖然給了我們很大的變革壓力,但也帶給了我們無限的可能。技術(shù)總會過時,熱點總會過去,但不會過去的是我們不斷追求新科技的熱情和對自己的挑戰(zhàn)。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2017-10-09 13:20:13

機器學(xué)習(xí)未來方向人才緊缺

2020-06-03 14:47:18

機器人人工智能人才

2011-06-21 18:05:15

SEO

2015-11-06 09:33:33

機器學(xué)習(xí)職業(yè)就業(yè)

2010-08-09 17:08:13

IT技術(shù)人

2021-08-26 05:23:59

開源人才開源軟件開源

2021-02-02 13:35:03

深度學(xué)習(xí)人工智能機器學(xué)習(xí)

2021-05-24 16:01:35

人工智能AI機器學(xué)習(xí)

2013-06-27 15:20:53

IPv6

2020-10-09 15:35:45

機器學(xué)習(xí)深度學(xué)習(xí)算法

2023-08-04 11:06:49

數(shù)據(jù)科學(xué)機器學(xué)習(xí)

2024-02-19 14:23:05

機器學(xué)習(xí)聯(lián)絡(luò)中心

2022-08-11 08:00:00

機器學(xué)習(xí)合成數(shù)據(jù)深度學(xué)習(xí)

2010-05-04 15:39:44

IT人才

2021-03-10 23:09:35

機器人5G科技

2021-07-21 08:54:49

云計算IT人才緊缺人才需求

2013-01-19 09:45:31

App移動開發(fā)趨勢

2018-06-08 09:01:17

芯片半導(dǎo)體技術(shù)

2020-11-24 10:21:14

人工智能機器學(xué)習(xí)技術(shù)

2019-07-23 14:25:11

人工智能技術(shù)軟件
點贊
收藏

51CTO技術(shù)棧公眾號