三要三不要:成功數(shù)據(jù)科學(xué)家都知道的黃金法則
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)。
數(shù)據(jù)科學(xué)和人工智能可謂當(dāng)下最為熱門的領(lǐng)域,也是人們最常提及的實(shí)體類數(shù)據(jù)管理。數(shù)據(jù)科學(xué)與人工智能持續(xù)發(fā)展成果不斷,給人們提供了各種機(jī)會。但在成為優(yōu)秀的數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)操作者之前,你必須遵循幾條黃金法則來提高生產(chǎn)力。 筆者學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型有一陣子了,也一直在做各種項目。根據(jù)筆者的經(jīng)驗,“三要三不要”法則你最好能從一開始就了解。話不多說,來看看關(guān)乎你數(shù)據(jù)前途的要點(diǎn)。
一要:廣泛搜查,持續(xù)學(xué)習(xí)
這些領(lǐng)域每天都在進(jìn)步。技術(shù)發(fā)展迅猛,所以緊跟發(fā)展、了解數(shù)據(jù)科學(xué)中的最新成果顯得越發(fā)重要。查找項目、任務(wù)甚至是一個簡單的數(shù)據(jù)科學(xué)術(shù)語,都必不可少。向他人學(xué)習(xí),特別是一些專家的觀點(diǎn),這些人都有著自己的見解,你可以學(xué)習(xí)運(yùn)用。 查找和批判性思考就是提升水平的一種途徑。極力推薦大家到Y(jié)outube上看一些高質(zhì)量的視頻,比如數(shù)據(jù)科學(xué)、人工智能、數(shù)學(xué)或編程頻道。多讀書,論文更重要,后者是獲取正確知識的關(guān)鍵,對你理解數(shù)據(jù)科學(xué)的某個話題也有幫助。
一不要:放棄!
數(shù)據(jù)科學(xué)有時會很棘手,初學(xué)者剛上手會很難。不少人看一眼這個領(lǐng)域里的話題都害怕。其實(shí),它同編程一樣,出現(xiàn)錯誤意味著你會學(xué)到新的東西。不論到網(wǎng)上尋求解決方案,亦或自己攻克,從中你都會獲得滿足感。 初出茅廬不會解決問題也不要緊,只要持之以恒尋找出路加深理解,你就會進(jìn)步。哪怕是專家也會犯錯然后找資料解決特定問題。這大概是唯一一個不用惡補(bǔ)知識的領(lǐng)域了,忘記的知識谷歌上都可以查。 筆者鼓勵大家轉(zhuǎn)變對挑戰(zhàn)性任務(wù)的看法,多幾分享受。失敗乃成功的奠基石,在數(shù)據(jù)科學(xué)中,犯錯越多學(xué)的就越多。振作起來學(xué)習(xí)吧!
二要:實(shí)踐操作
想要欣賞數(shù)據(jù)科學(xué)的“真善美”,最好要有很多項目的實(shí)踐經(jīng)歷。可操作性高的任務(wù)和能力范圍內(nèi)的難題絕對給你很妙的體驗。從理論的角度了解數(shù)據(jù)科學(xué)背后的機(jī)器學(xué)習(xí)、數(shù)學(xué)概念很關(guān)鍵。當(dāng)然也要知道如何實(shí)操,不要怕麻煩,你要獨(dú)立完成這些。 設(shè)想一個多層次感知器或神經(jīng)網(wǎng)絡(luò)的反向傳播,你可能知道這些概念在數(shù)學(xué)和理論方面意味著什么。但實(shí)際操作和摸索方案也同等重要,后者對于提升和面試大有益處。 哪怕是一個簡單的機(jī)器學(xué)習(xí)算法,都建議不要用算法庫或類似的輔助工具。試著發(fā)現(xiàn)最好的辦法,上手操作。如此可以提升技巧,對概念有更全面的理解。
二不要:猶豫不決,我要不要尋求幫助
過程中碰壁再正常不過,而數(shù)據(jù)科學(xué)的迷人之處就在于背后有非常優(yōu)秀的群體,里面有很多人才和資源可以幫到你。Stack Overflow、discord channels、YouTube、免費(fèi)的在線編碼訓(xùn)練營、GitHub等有關(guān)數(shù)據(jù)科學(xué)的平臺。 跟他人或者專家溝通交流也是明智之舉。有效的溝通可以糾正你對某個話題的誤解。同樣,溝通能讓他人聽到你的觀點(diǎn),自己也能學(xué)到點(diǎn)。交流得越多,觀點(diǎn)越完善,最大的作用是自己的社交能力會有所提升,這也是團(tuán)隊工作需要的。 過去筆者對于尋求幫助猶豫不決,認(rèn)為憑自己解決所有問題才是正確的。但有時候也許是理解錯或者有瑕疵,自己試過仍不行,就可以去問朋友或?qū)<遥埶麄儙湍?
三要:保持探索,建立新項目,積極實(shí)踐!
人工智能與數(shù)據(jù)科學(xué)浩瀚無邊,有很多東西等著我們?nèi)ヌ剿鳌V蒙碛邶嫶蟮念I(lǐng)域中,實(shí)踐對于更新自己的能力和實(shí)操技巧愈發(fā)重要。發(fā)展從未停止,其中各個方面也包含很多知識,所以請堅持編碼和實(shí)操! 積極參加網(wǎng)絡(luò)上的競賽。Kaggle就挺不錯,上面會舉辦一些高權(quán)威的數(shù)據(jù)科學(xué)比賽。別怕成績不好,只要學(xué)到東西就好。還有很多網(wǎng)站可以提升編碼技能或參加比賽,比如HackerRank。加入群體后你可以向更多愛好者取經(jīng)。 可操作的項目和想法數(shù)不勝數(shù)。選一個就可以著手開始了。不斷學(xué)習(xí)的最佳辦法就是多做!找更多的項目,更新技能!
圖源:unsplash
三不要:問題解決后不要停止對更好方案的追求
恭喜各位完成了項目!但是還有更多等待你去挖掘。這個領(lǐng)域的魅力之處在于它提供了多樣的選擇。你所建的每一個模型和項目都有很大的提升空間。考慮別的可能性、其他方法和提升是好習(xí)慣,你會得到更好的結(jié)果。 最初,筆者每完成一個項目都會非常激動,著急做下一個任務(wù)。這沒毛病,但往往你的項目是可以進(jìn)一步提升的。在進(jìn)行下一項之前,列出項目中可以完善的幾個方面。
總而言之,不斷學(xué)習(xí)、不斷實(shí)踐、不怕失敗、完善技能,這些就是你通向數(shù)據(jù)科學(xué)大師的不二法門。