自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

新聞 人工智能
在Reddit上的一通“吐槽”,引來了網(wǎng)友們的高度關注。一個本科生,觸及了大主流的機器學習,具體發(fā)生了怎樣頭禿的事情?

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯(lián)系出處。

 “機器學習,太難了!”

“3個月才跑通GitHub模型代碼,要崩潰了!”

“還要跟博士生開會,怕了!”

發(fā)出如此絕望聲音的,正是一名在讀本科生,起初興致勃勃參與了機器學習興趣小組。

但誰曾想到,卻演變成了一入ML深似海,從此半點不由人的這般境遇。

在Reddit上的一通“吐槽”,引來了網(wǎng)友們的高度關注。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

很好奇。

一個本科生,觸及了大主流的機器學習,具體發(fā)生了怎樣頭禿的事情?

為什么ML會讓這位本科生如此痛苦?

這段“痛苦”的故事,是這樣的。

一開始,這位本科生同學自告奮勇地參加了一個“機器學習小組”,而后被分配去協(xié)助一位博士生的工作。

從去年9月份開始,這位博士生就給他布置了一些與“知識圖譜”相關的任務,并讓他去實現(xiàn)。

[[379356]]

問題從這里就開始出現(xiàn)了。

這位本科生,花了整整3個月的時間,才讓GitHub上一些模型的代碼跑通。

不僅如此,自己還苦訴道:

在此之前,我還花了無數(shù)個小時去搞懂預處理和評估相關的代碼。

結果如何呢?

我現(xiàn)在還是搞不懂如何讓這些ML代碼跑起來!

[[379357]]

本就很是苦惱,沒想到讓他更加崩潰的事情,來得如此猝不及防。

博士生給他提了個“更上一層樓”的要求——讓他從一篇論文中,找到了另一個實現(xiàn)類似功能的GitHub repo。

于是,這位本科生便把現(xiàn)有的代碼插了進去……結果可想而知,一團糟。

原地爆炸!

我把每一個步驟都做了一遍,但就是想不明白問題出在了哪里。

[[379358]]

Hold不住了,“再也做不下去了”……

他現(xiàn)在每周與博士見面都會感到恐懼,“因為我知道再也沒有進展可以匯報了”。

但是痛定思痛,作為本科生的他,便在Reddit上發(fā)出了一個“靈魂拷問”:

機器學習代碼本來就這么難嗎?

是我腦袋有什么問題嗎?

你們又是怎么做到的呀?

問題出在了哪里?

“用了一周時間,卻連一個問題都沒解決,根本沒有進展可以匯報?”

網(wǎng)友@santiagobmx1993 提出了一種解決方法。根據(jù)實驗期限,這位本科生可以迅速定下遇到問題的解決時間,如果完不成,就去尋求同級、上一級的幫助,快速提升效率。

例如,如果自己花了1天時間未能完成,就再花5小時找同級本科生一起解決,如果依舊不行,再試著花上2小時找博士生、導師梳理。

[[379359]]

“我一直在重復操作步驟,卻想不明白問題出在哪里?”

網(wǎng)友@help-me-grow 認為,在科研實驗中,一定要尋求幫助。有時候自己看不出來的問題,有經(jīng)驗的人一看就能發(fā)現(xiàn)。

網(wǎng)友@linverlan作為博士生,也認為溝通非常重要。于他而言,幫助本科生助理完成代碼調試、解決困難,或是換份更有興趣的工作,都是可以通過溝通實現(xiàn)的。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

“被分配到了完全不在研究范圍內的任務,比其他人落后了一大截?”

網(wǎng)友@starfries 表示,這位本科生或許也需要找準自己擅長的任務,做起來才有成就感。否則如果給本科生分配博士才能完成的任務,那自然會很困難。

“我的代碼能通過編譯,但一運行起來就出錯?”

網(wǎng)友@todeedee則提出了基礎技能:學習做模塊測試(unit test)。

將機器學習模型分解成數(shù)據(jù)收集代碼、網(wǎng)絡代碼和訓練代碼幾部分,并進一步將代碼拆分成5~25行的小模塊,分別進行調試,有助于盡快找出問題所在。

[[379360]]

“給我的一些代碼,我真的沒辦法看懂,這是我的問題嗎?”

網(wǎng)友@milkteaoppa 認為,代碼運行不起來,也可能是因為隨便搞來的代碼質量非常差,理解起來也同樣困難。

如果只是希望運行機器學習代碼的話,學會識別低質量代碼、并與博士生溝通改進代碼質量,都是有必要的。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

“身為本科生,調試代碼沒問題,但卻完全沒辦法調試機器學習的代碼?”

網(wǎng)友@TachyonGun 認為,對本科生來說,機器學習代碼確實困難,因為得掌握許多必要知識,例如數(shù)學。而在代碼調試時,會出現(xiàn)許多數(shù)值問題,例如奇異矩陣、數(shù)值穩(wěn)定性……

因此,想運行機器學習代碼,必須先學會數(shù)學知識(數(shù)值分析、應用線性代數(shù)、數(shù)學建模、概率論/高級統(tǒng)計學)、以及熟練掌握方法(數(shù)值和可視化方法)。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

事實上,對于這位本科生遇到的困難,對于搞科研的網(wǎng)友們來說,同樣感同身受:

辛辛苦苦做實驗一個月卻匯報不出任何進展,被導師無情吐槽;

想要復現(xiàn)一篇論文的代碼,結果光是解決“代碼出錯、編譯出錯、環(huán)境代碼不兼容”等問題,就耗費了大量時間……

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

但也正是如此,他們積攢了對應的經(jīng)驗,幫助這位本科生找到合適的解決辦法。

“感謝大家的幫助”

在網(wǎng)友們的幫助下,這位本科生也冷靜了下來,并仔細歸納了網(wǎng)友們給出的建議。

他找出了自己崩潰的原因:缺乏與那位博士生和其他研究者的溝通,不了解項目應該如何進行;此外,也的確缺乏對機器學習模型和參數(shù)設置的理論基礎知識。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

當然,他也意識到,交到自己手里的那些代碼,的確質量不高:不僅難以閱讀,而且各個模塊非常破碎,很難整合到一起。

他現(xiàn)在決定,去找那位博士生溝通一下,坦白自己遇到的問題。

……

不過話說回來,作為一名本科生,無論是做畢設還是進實驗室,或多或少的都會有這位“發(fā)帖者”遇到的困惑。

是否存在快速上手、入道的方法呢?

清華特獎本科生的秘訣

其實,同是本科生,也有同學已經(jīng)手握四篇論文。

這是清華特獎得主高天宇的真實經(jīng)歷,而發(fā)表的4篇論文,均在AI頂會上:兩篇AAAI,兩篇EMNLP。

[[379361]]

對于這些科研成果,他同樣有話說,不過都是實打實的干貨分享。

例如,讓這位本科生崩潰的、很多人同樣難以啟齒的“拖延壓力”,高天宇就給出了緩解辦法:

經(jīng)常高負荷做實驗的同學,在忙碌的時候可以切換一下任務,平時也可以記錄日常工作,緩解自己拖延工作造成的心理壓力。

另外,還有一條看似違反常理的建議,那就是把事情推到明天,這不是鼓勵拖延,而是讓你從一天的忙碌中跳出思維定式,也許明天會有更好的解決方案。

[[379362]]

以及,高天宇也同樣建議,要多與導師、學長學姐進行溝通:

他們對過往研究更了解,也在實驗中擁有更豐富的經(jīng)驗,能防止你走很多彎路。

當然,如果想要加強自己機器學習的基礎理論,高天宇也給出了快速讀論文的方法:

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

大部分論文只需要看摘要,然后快速分類。如果確實覺得有幫助,再按下面的結構進行分析。

  • 摘要:研究意義(包括前人研究、研究的缺陷),研究方法,研究結果
  • 簡介:很多大道理(解決了什么問題)
  • 相關工作:文獻綜述
  • 方法:細節(jié)
  • 實驗:打臉專用(論文試金石)
  • 結論:基本沒用(重復摘要)

文獻管理工具也是有必要的:

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

Nature:成為“本科研究員”的三個步驟

除了高天宇的個人“秘訣”之外,Nature也曾發(fā)表過與“本科生做科研”相關的文章。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

Nature在文中指出,本科生參與科研項目,在頂尖大學是一個普遍的現(xiàn)象。

更具體一些,例如在MIT,這一比例就超過了90%。

從在課堂上課,到實驗室的生活,確實是一個巨大的轉變。

對此,Nature認為在這種轉變過程中個,通常會經(jīng)歷三個階段 (并不適用于每個人)。

第一個階段是“在不理解的情況下做科研”。

對于初來乍到的本科生而言,要做什么事情肯定是頭等的問題。

以及正在做著某項實驗,對于其背后的原因、本質,或許還不是特別清楚。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

第二個階段是“在理解的基礎上做科研”。

Nature表示,以此狀態(tài)搞科研的學生,是實驗室往往想要留住的人才。

他們在實驗室之外,會投入更多時間和經(jīng)歷,去觀察實驗所存在的局限性。這將有助于培養(yǎng)參與團隊的意識。

第三個階段是“學生研究員(student research)”。

這個階段的學生,就會像研究員一樣進行思考:制定新的問題和假設、計劃新的實驗來測試等等。

Nature認為,這一階段的學生對于實驗室的貢獻是最大的。

本科生搞AI在線崩潰:3個月才跑通GitHub模型,太難了吧

除此之外,Nature進一步還提出了一些細節(jié)的建議,例如時間管理方面,做研究和休息時間要得當、要做到批判性閱讀、要有保存記錄的習慣等等。

……

最后,作為正在經(jīng)歷或者過來者,你是否也遇到過什么類似的問題?

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-09-09 14:15:00

AI訓練

2023-05-18 15:05:12

2018-06-20 09:23:07

AI專業(yè)科技

2020-07-25 09:20:18

芯片半導體技術

2021-12-04 23:01:33

程序員開發(fā)互聯(lián)網(wǎng)

2025-02-26 14:24:43

AIChatGPT生成式人工智能

2022-04-27 10:14:43

進程調度LinuxCPU

2019-02-27 14:06:53

AIAdamSGD

2024-12-17 11:30:00

2022-04-15 19:48:49

上海疫情居家辦公

2022-03-16 07:58:02

OOMdubbo內存

2023-02-27 09:29:05

GPT模型

2022-01-03 07:19:47

Google漏洞Chrome

2024-08-26 13:30:00

2020-03-26 15:10:34

蘋果iPhone手機

2021-09-14 13:49:32

開發(fā)技能工具

2023-03-04 22:03:59

AI論文

2019-12-18 15:28:05

編程語言PythonJava

2022-09-19 16:31:14

游戲益智游戲機

2023-07-24 12:30:36

谷歌AI
點贊
收藏

51CTO技術棧公眾號