自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

在知乎,看見ChatGPT變革的第一束光

人工智能 新聞
在知乎,每一個(gè)科技「知乎er 」猶如渺小又神奇的珊瑚蟲和蟲黃藻,借由提問(wèn)、回答和關(guān)注,彼此交換能量信息,周而復(fù)始,一種更加高級(jí)的系統(tǒng)出現(xiàn)了,引來(lái)更多前沿科技「物種」棲息,包括一些頂級(jí)科學(xué)家。

有變革,知乎必有回響。

搜索「ChatGPT」,仿佛瞬息挪移到能聽見號(hào)角的最前線:

創(chuàng)新工場(chǎng)董事長(zhǎng)李開復(fù)總結(jié)后 ChatGPT 時(shí)代拯救自己職業(yè)的通用法則; 

DeepLearning.AI 創(chuàng)始人吳恩達(dá)警醒人們,將倫理與法律追問(wèn)置于狂熱之前;

一流科技創(chuàng)始人袁進(jìn)輝覺(jué)得一個(gè)迫在眉睫的需要研究的問(wèn)題是,怎么區(qū)分由人類生成的文本和 ChatGPT 生成的文本? 

《數(shù)字化生存》作者、北大新聞傳播學(xué)院胡泳則在「知聊八點(diǎn)半」圓桌直播中提出,人工智能的發(fā)展方向并不一定要「類人」,而應(yīng)該是提升人的能力; 

…... 

透過(guò)問(wèn)答、話題、圓桌、想法、熱點(diǎn)直播,行業(yè)大佬接連現(xiàn)身中文互聯(lián)網(wǎng)的高質(zhì)量問(wèn)答社區(qū);投資人、科研人員、創(chuàng)業(yè)者和從業(yè)者彼此聯(lián)結(jié),一同探索 ChatGPT 前沿的一切面向,并思考他們的發(fā)現(xiàn)對(duì)未來(lái)的影響。 

短短四個(gè)月,知乎「ChatGPT」話題熱度已經(jīng)打破 2015 年以來(lái)「AlphaGo」話題創(chuàng)下的紀(jì)錄,當(dāng)前討論累計(jì) 22 萬(wàn),總瀏覽量高達(dá) 3.8 億。

圖片

話題熱度爆表,呈現(xiàn)方式也是全方位、多維度。

一、首發(fā)的力量

2023年1月2日,一位普林斯頓大學(xué)計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生發(fā)布了GPTZero,這個(gè)程序可以「快速有效地」破譯一篇文章的作者是人類還是 ChatGPT。 

看到消息后,知乎答主「蟈蟈」有種被偷襲的感覺(jué)。ChatGPT 推出后的第 10 天,「蟈蟈」郭必?fù)P,一位上海財(cái)經(jīng)大學(xué)信息管理與工程學(xué)院 AI Lab 三年級(jí)博士生已經(jīng)和朋友們著手這項(xiàng)工作,「我們其實(shí)是最早開始做 ChatGPT 檢測(cè)器的團(tuán)隊(duì)?!顾f(shuō)。 

GPTZero 發(fā)布一周內(nèi)就有超過(guò)三萬(wàn)人試用,應(yīng)用程序一度崩潰。郭必?fù)P緊張起來(lái)。原計(jì)劃除了檢測(cè)器,這支八人團(tuán)隊(duì)還要做人工測(cè)評(píng)和語(yǔ)言學(xué)的統(tǒng)計(jì)分析。顯然,眼下不能再等了。 

用現(xiàn)有數(shù)據(jù)集訓(xùn)練了幾個(gè)檢測(cè)器后,1月11日,他們?cè)谥醴懦?demo ,這是國(guó)內(nèi)第一個(gè) ChatGPT 檢測(cè)器。當(dāng)時(shí)臨近春節(jié),本應(yīng)陪家人聊天敘舊的郭必?fù)P一直盯著屏幕,誰(shuí)都不理?!讣胰擞X(jué)得,我們可能是在做什么大事情?!?nbsp;

圖片

處在一個(gè)技術(shù)迭代越來(lái)越快的行業(yè),最可怕的不是技術(shù)被外泄,而是沒(méi)有足夠多的人了解你的技術(shù)和你,更何況與 ChatGPT 革命性突破有關(guān)?

「AI 圈的人想要宣傳自己的工作,很多人都會(huì)選擇上知乎,工作被大家轉(zhuǎn)來(lái)轉(zhuǎn)去,也更容易被更多人看到?!?nbsp;深度學(xué)習(xí)(Deep Learning)話題優(yōu)秀答主、已有十年「知齡」的謝凌曦說(shuō)。 

郭必?fù)P和伙伴分秒必爭(zhēng)推出 demo 的時(shí)候,一連串與 ChatGPT 相關(guān)的工作也陸續(xù)出現(xiàn)在知乎。

人工智能話題優(yōu)秀答主 PENG Bo,一個(gè)公開對(duì)標(biāo) ChatGPT 的開源項(xiàng)目 ChatRWKV 作者在知乎呼吁更多人參與共建生態(tài)。

圖片

2 月底,第一款用自然語(yǔ)言指揮 Excel 工作的作品 ChatExcel 在知乎獨(dú)家首發(fā)。 

圖片

不過(guò),接踵而來(lái)的社區(qū)反饋?zhàn)尮負(fù)P有些意外。

發(fā)布之前,他們比較過(guò)兩個(gè)檢測(cè)器,因?yàn)榻邮苓^(guò)數(shù)據(jù)集訓(xùn)練,他們檢測(cè)器的實(shí)際效果比 GPTZero 好很多。一流科技創(chuàng)始人袁進(jìn)輝也在知乎上談到怎么區(qū)分由人類生成的文本和 ChatGPT 生成的文本,「是一個(gè)迫在眉睫的問(wèn)題?!?nbsp;

最初,認(rèn)為這項(xiàng)工作沒(méi)有意義的觀點(diǎn)接連不斷。

「我們關(guān)注的是檢測(cè)假消息,而不是ChatGPT 生成的假消息。如果說(shuō)一個(gè)分類器只能處理由 ChatGPT 生成的假消息,那我換一個(gè)生成器不就完了?」

也有人認(rèn)為「我們可以通過(guò)潤(rùn)色避免被檢測(cè)為 ChatGPT?!?nbsp;

郭必?fù)P決定親自回應(yīng)?!缚梢哉f(shuō)我們檢測(cè)器效果不好,但說(shuō)檢測(cè)器沒(méi)意義,那我可有意見了。法律有漏網(wǎng)之魚,不法之徒可以鉆法律的空子,這說(shuō)明法律沒(méi)有意義嗎?」 

當(dāng)人們?yōu)榱吮苊獗粰z測(cè)出來(lái)而對(duì) ChatGPT 內(nèi)容潤(rùn)色、修改時(shí),檢測(cè)器的作用已經(jīng)達(dá)到。有一萬(wàn)種方法繞過(guò)各種監(jiān)管,我們能做的只能是增加「不負(fù)責(zé)任的成本」。 

隨著時(shí)間的推移,支持和鼓勵(lì)的聲音多了起來(lái)。

「檢測(cè)器的價(jià)值見仁見智,但個(gè)人覺(jué)得這個(gè)數(shù)據(jù)集是比較有價(jià)值的,可以來(lái)做一些有意思的事情?!?nbsp;有人說(shuō)。

中國(guó)信通院云大所內(nèi)容科技部研究員呼娜英在知乎「知聊八點(diǎn)半」圓桌直播中表示,反作弊技術(shù)目前確實(shí)沒(méi)有 ChatGPT 技術(shù)強(qiáng)大,必然會(huì)出現(xiàn)「貓鼠游戲」的現(xiàn)象,「但終究魔高一尺道高一丈?!?nbsp;

其實(shí),決定上知乎發(fā)表作品等于選擇進(jìn)入一個(gè)復(fù)雜性系統(tǒng)。所謂復(fù)雜性,是指它不是線性的,不會(huì)按照你的預(yù)期運(yùn)作,有很多維度和變量,難以預(yù)測(cè),也因此會(huì)有一些「猝不及防」,但也有收益甚至意外驚喜。 

現(xiàn)在,郭必?fù)P團(tuán)隊(duì)的檢測(cè)器在 Github 上已有6、700顆星。數(shù)據(jù)集和模型可能被下載上萬(wàn)次,不到兩個(gè)月文章就有了 20 個(gè)引用?!高@些是我們之前想不到的。」他有些感慨,「(文章被引增速)比我之前任何一篇文章都要快?!?nbsp;

知乎獨(dú)家首發(fā)后沒(méi)多久,WPS 就聯(lián)系上 ChatExcel 背后的團(tuán)隊(duì)。開源項(xiàng)目 ChatRWKV 也得到了頭部科技媒體的報(bào)導(dǎo)。 

除了難以預(yù)測(cè),知乎系統(tǒng)的復(fù)雜性還包括一種自適應(yīng)性,發(fā)布一個(gè)作品會(huì)改變這個(gè)系統(tǒng),系統(tǒng)也會(huì)反過(guò)來(lái)校準(zhǔn)你的產(chǎn)品或者研究。 

2022 年 11 月,謝凌曦所在團(tuán)隊(duì)將一份重要論文放到 arXiv 預(yù)印本網(wǎng)站后,也立刻發(fā)布在了知乎,標(biāo)題顯示某氣象大模型,「中長(zhǎng)期氣象預(yù)報(bào)精度首次超過(guò)傳統(tǒng)數(shù)值方法?!?nbsp;

圖片

「標(biāo)題讓我火速去拜讀了原文。」一位網(wǎng)友讀完后,即對(duì)文章取得的成績(jī)表示贊賞。在評(píng)論區(qū)與團(tuán)隊(duì)成員一番切磋討論后,她分享了自己看法: 

「AI 模式的輸入是來(lái)自 ERA5(觀測(cè)和模式同化出來(lái)的分析場(chǎng)),所以也是利用了模式預(yù)報(bào),模式不預(yù)報(bào)就沒(méi)有這個(gè) ERA5(也就是 AI 的輸入),所以模式還是得跑,并沒(méi)有獨(dú)立替代模式預(yù)報(bào)。目前是(傳統(tǒng)模式同化+AI 預(yù)報(bào))>(傳統(tǒng)模式同化+傳統(tǒng)模式預(yù)報(bào))」。 

AI 大模型是在 ERA5 數(shù)據(jù)上做的訓(xùn)練。ERA5 數(shù)據(jù)是再分析數(shù)據(jù),主要是通過(guò)對(duì)各種來(lái)源(地面、船舶、無(wú)線電探空、測(cè)風(fēng)氣球、飛機(jī)、衛(wèi)星等)的觀測(cè)資料進(jìn)行質(zhì)量控制和同化處理,而獲得的一套完整的再分析資料集。

這里的同化處理,就是把一些觀測(cè)數(shù)據(jù)變成標(biāo)準(zhǔn)的網(wǎng)格化氣象數(shù)據(jù)。在沒(méi)有覆蓋這些技術(shù)的情況下,不應(yīng)該聲稱超越了傳統(tǒng)的數(shù)值天氣預(yù)報(bào)方法(NWP)。 

「是的,這個(gè)應(yīng)該還要不少時(shí)間,第一個(gè)問(wèn)題就是數(shù)據(jù)似乎很難獲得(所以國(guó)內(nèi)外相關(guān)工作很少)?!箞F(tuán)隊(duì)成員也認(rèn)可。 

其實(shí),「AI 還沒(méi)法做,或者說(shuō),AI 還沒(méi)有正式能做這一步,主要原因是沒(méi)有數(shù)據(jù)?!怪x凌曦后來(lái)對(duì)我們解釋道。要做的話,AI 的輸入端就要拿到諸如衛(wèi)星、氣象站這些數(shù)據(jù),無(wú)論在哪個(gè)國(guó)家,這些數(shù)據(jù)都是高度保密的。

「受益于歐洲氣象中心公布了數(shù)十年間的同化數(shù)據(jù),我們完成了這個(gè)工作?!?nbsp;

不久,謝凌曦更新了回答,「我們接受這個(gè)意見?!?/span>

「在盤古氣象大模型文章中,我們將 NWP 限定為『基于同化數(shù)據(jù)進(jìn)行預(yù)測(cè)的方法』,而不是指代整個(gè)『數(shù)值氣象預(yù)報(bào)領(lǐng)域』。盤古確實(shí)首次在同化數(shù)據(jù)上超越了傳統(tǒng)方法:我們使用了與英偉達(dá) FourCastNet 完全相同的測(cè)試環(huán)境,確保對(duì)比的公平性和結(jié)論的可信度?!?nbsp;

研究發(fā)布后,謝凌曦團(tuán)隊(duì)接到不少交流邀請(qǐng),包括中國(guó)氣象局做報(bào)告。歐洲氣象中心也聯(lián)系到他們。據(jù)說(shuō),歐洲氣象中心內(nèi)部有很多討論,很多現(xiàn)有的技術(shù)會(huì)被 AI 取代。 

也有一些公司聯(lián)系到郭必?fù)P,探討文本平臺(tái)推出相關(guān)功能的可能性。我們的算法還在不斷改進(jìn),主要從增加模型魯棒性、收集更多樣化數(shù)據(jù)著手,希望下一代模型更有效。」 接受知乎網(wǎng)友反饋后,這是郭必?fù)P接下來(lái)的目標(biāo)。 

二、與「52赫茲鯨」相遇 

研究人員爭(zhēng)先恐后首發(fā)作品,資本也在密集「點(diǎn)殺」AI 大模型人才。 

3 月 27 日晚上 11 點(diǎn),一條消息悄悄在微信里傳來(lái):王慧文與袁進(jìn)輝創(chuàng)立的一流科技達(dá)成并購(gòu)意向,要做中國(guó)版 OpenAI。 

在大語(yǔ)言模型(LLM)這個(gè)領(lǐng)域,曾被很多人認(rèn)為最不重要的框架,價(jià)值已上升到兵家必爭(zhēng)?!脯F(xiàn)在看來(lái),這才是真正潛心搞底層技術(shù)的國(guó)產(chǎn)典范?!挂晃魂P(guān)注了相關(guān)知乎話題的騰訊 AI 算法專家感嘆道。 

六年前,袁進(jìn)輝離開微軟亞洲研究院,創(chuàng)業(yè)做深度學(xué)習(xí)框架。當(dāng)時(shí)處境與那只著名的「52 赫茲鯨」無(wú)異。

上承算法應(yīng)用,下接底層硬件,深度學(xué)習(xí)框架被稱為「人工智能操作系統(tǒng)」,是創(chuàng)業(yè)公司想都不敢想的蛋糕。彼時(shí),憑借自己巨大影響力和強(qiáng)大推廣能力,谷歌的深度學(xué)習(xí)框架 TensorFlow 已是當(dāng)時(shí)用戶最多的深度學(xué)習(xí)框架(Pytorch 尚在襁褓)。 

谷歌這么大公司,好幾百人做的事情,你拿什么和別人拼?做底層軟件、競(jìng)爭(zhēng)對(duì)手這么很強(qiáng)、還開源……袁進(jìn)輝當(dāng)時(shí)聽得最多的就是「以卵擊石」、「螳臂當(dāng)車」。 

圖片

因?yàn)?2赫茲頻率比任何已知鯨魚物種都要高很多,科學(xué)家因此認(rèn)為一頭被美軍儀器探測(cè)到的鯨魚叫聲無(wú)法被其他鯨魚接收得到。 

系統(tǒng)軟件開發(fā)周期很長(zhǎng)。從 2016年啟動(dòng),歷經(jīng)四年到 2020 年 7 月,深度學(xué)習(xí)框架 OneFlow 才開源。因?yàn)槌惺懿涣四欠N高度不確定性、在系統(tǒng)軟件成品出來(lái)之前也不可能有任何反饋的壓力,一些優(yōu)秀的同事辭職離去。 

其實(shí),一旦技術(shù)做到系統(tǒng)這么深的地方,能與之共鳴的「鯨」自然會(huì)少。在知乎,袁進(jìn)輝還是找到了和他一樣關(guān)心底層( fundamental )問(wèn)題的人。 

不少知乎網(wǎng)友在微博時(shí)代就知道「老師木」(袁進(jìn)輝微博網(wǎng)名)。「進(jìn)輝會(huì)在微博上寫一些特別好玩兒的消息,大家也在傳這個(gè)哥們兒到底是誰(shuí)?!褂ミ_(dá) AI 計(jì)算架構(gòu)技術(shù)總監(jiān)楊軍回憶道。袁進(jìn)輝創(chuàng)業(yè)不久,楊軍也在考慮轉(zhuǎn)換工作,兩人通過(guò)知乎認(rèn)識(shí)了。 

在袁進(jìn)輝心目中,楊軍這位集機(jī)器學(xué)習(xí)、深度學(xué)習(xí)(Deep Learning)話題優(yōu)秀答主和 2022 年度新知答主于一身的朋友,常年穩(wěn)定地輸出高質(zhì)量?jī)?nèi)容,自己也從他的思考中獲益良多。 

而在楊軍眼里,袁進(jìn)輝也是一個(gè)比較聊得來(lái)的朋友。楊軍自己也比較分析過(guò)兩大主流深度學(xué)習(xí)框架,為什么這個(gè)階段還有公司愿意投入巨大資源研發(fā) AI 框架。 

2019 年谷歌發(fā)布 MLIR,當(dāng)時(shí)深度學(xué)習(xí)編譯器話題備受關(guān)注。兩人很快出現(xiàn)在「如何看待 Google 關(guān)注 MLIR 項(xiàng)目?」問(wèn)題下,一前一后分享了自己的看法。 

袁進(jìn)輝當(dāng)時(shí)對(duì) MLIR 的評(píng)價(jià)并不高,感覺(jué)編譯器之編譯器這個(gè)概念有點(diǎn)多余。MLIR僅僅為寫深度學(xué)習(xí)編譯器提供了一個(gè)腳手架,沒(méi)有解決深度學(xué)習(xí)編譯器里任何具體難題。 

楊軍更傾向認(rèn)為 MLIR 是一個(gè)好東西。「他對(duì) MLIR 貢獻(xiàn)、價(jià)值還有缺點(diǎn)分析,讓我至今印象深刻?!乖M(jìn)輝說(shuō)。 

隨著思考和討論的加深,楊軍不斷用新想法和收獲更新最初的回答。袁進(jìn)輝也保持著認(rèn)知彈性。2022年,袁進(jìn)輝再度更新最初的回答,「這兩年的發(fā)展說(shuō)明,MLIR提供一個(gè)『腳手架』。......是很有意義的?!?/span> 

人需要一個(gè)環(huán)境,和味道相近的人交流、碰撞,知乎的屬性能夠?qū)崿F(xiàn)這一點(diǎn)。楊軍嘗試解釋這種奇妙的緣分。比如,順著你的問(wèn)題、興趣、文章,自然而然就能判斷是不是可以多聊一聊。 

OneFlow 開源后,有網(wǎng)友「茅塞頓開,才發(fā)現(xiàn),以前苦苦掙扎的一些問(wèn)題,還有這種解決方案?!挂灿腥朔Q贊框架設(shè)計(jì)「清新」。當(dāng)設(shè)計(jì)之美被第三方開發(fā)者甚至學(xué)生心領(lǐng)神會(huì)時(shí),袁進(jìn)輝覺(jué)得「好像你寫了一本小說(shuō),有讀者欣賞?!?nbsp;

而當(dāng)郭必?fù)P因 ChatGPT 陷入焦慮時(shí),最終將他打撈起來(lái)的也是這種「人與人的聯(lián)結(jié)」。

他通過(guò)知乎組建了一個(gè)「孤勇 AI 研究者」群,發(fā)現(xiàn)很多同行也生活在 ChatGPT 「智子」陰影下。也是在那里,他找到了測(cè)器項(xiàng)目合作者。四十多天的奮戰(zhàn),八個(gè)人從頭堅(jiān)持下來(lái),沒(méi)有一人退出,即使在疫情瘋狂的時(shí)刻。

他們自稱 insignificant researchers,但所做的工作希望是significant work。   

在知乎的另一個(gè)角落,謝凌曦分享的一段熱血?dú)q月已收獲 3.2 萬(wàn)個(gè)贊。

「如果中國(guó)重新開發(fā)像 MATLAB、solidworks 這樣的軟件大概需要多久?」三年前的一個(gè)提問(wèn)讓他敲下一段塵封已久的往事。

圖片

十幾年前,幾位清華大學(xué)數(shù)學(xué)系學(xué)生想要做一款科學(xué)計(jì)算軟件,比肩應(yīng)用最廣泛的數(shù)學(xué)軟件 Mathematica。招人廣告貼到了計(jì)算機(jī)系宿舍樓,卻沒(méi)什么人關(guān)注。當(dāng)時(shí),從數(shù)學(xué)系轉(zhuǎn)到計(jì)算機(jī)系、剛學(xué)會(huì) Java 的大三學(xué)生謝凌曦申請(qǐng)加入。四個(gè)多月寫了無(wú)數(shù)文檔,終于做出雛形。一系列榮譽(yù)接踵而至,最后拿下「挑戰(zhàn)杯」全國(guó)特等獎(jiǎng)。 

「僅一腔熱血來(lái)做大規(guī)模系統(tǒng),或許我們的項(xiàng)目就算是最好的結(jié)果了。沒(méi)有成熟的商業(yè)模式或者健康的生態(tài),項(xiàng)目不可能長(zhǎng)期走下去。」多年后,謝凌曦在回答中談到項(xiàng)目的商業(yè)化。

「我們的經(jīng)驗(yàn)是有正面意義的。它至少證明了:任何一個(gè)時(shí)代,都不缺少敢于追夢(mèng)的年輕人?!?nbsp; 

三、尋找「百萬(wàn)寶貝」

袁進(jìn)輝和一流科技被歸入的是一個(gè)新賽道—— AI 大模型。招聘網(wǎng)站上 ChatGPT 相關(guān)崗位開出的薪資最低月入 2 萬(wàn),最高開出月薪 10 萬(wàn)。levals.fyi 顯示, OpenAI 為 AI/ML崗(L5)開出 90 萬(wàn)美元高薪。 

仿佛一夜之間,又回到六年前那個(gè)資本已經(jīng)追不上一個(gè)接一個(gè)的數(shù)學(xué)博士、計(jì)算機(jī)博士、統(tǒng)計(jì)學(xué)博士的時(shí)代。彼時(shí),張一鳴微博「懸賞」100 萬(wàn)美金招聘頂尖機(jī)器學(xué)習(xí)人才;在硅谷,一些具備技術(shù)專長(zhǎng)的高級(jí)管理人員如果在谷歌這類大型上市公司工作,年薪(包括股權(quán)激勵(lì))可達(dá)數(shù)百萬(wàn)美元(「百萬(wàn)寶貝」) 

當(dāng)時(shí),為了組建公司算法團(tuán)隊(duì),剛畢業(yè)就成為圖森未來(lái)首席科學(xué)家的知乎答主 Naiyan Wang (王乃巖)也加入了那場(chǎng)人才爭(zhēng)奪。不過(guò)他另辟蹊徑,在知乎回答「如果你是面試官,你怎么去判斷一個(gè)面試者的深度學(xué)習(xí)水平?」時(shí)留下英雄帖,并聲稱,此三題可考察受試者「八成功力」: 

CNN 最成功的應(yīng)用是在 CV,那為什么 NLP 和 Speech 的很多問(wèn)題也可以用 CNN 來(lái)出來(lái)?為什么 AlphaGo 里也用了 CNN?這幾個(gè)不相關(guān)的問(wèn)題的相似性在哪里?CNN 通過(guò)什么手段抓住了這個(gè)共性? 

再補(bǔ)充一個(gè)問(wèn)題,為什么很多做人臉的 paper 會(huì)最后加入一個(gè) local connected conv。

這三個(gè)問(wèn)題不是典型教科書上的問(wèn)題,正如圖森未來(lái)做的自動(dòng)駕駛是一個(gè)「新物種」,開拓性探索往往需要突破邊界,沒(méi)有可以供參考的先例,更沒(méi)有現(xiàn)成答案。算法工程師只有洞悉貌似沒(méi)有關(guān)聯(lián)事物之間更深層的關(guān)聯(lián),才能去偽存真,讓算法工具更好地為我所用,解決現(xiàn)實(shí)業(yè)務(wù)中的問(wèn)題。 

「應(yīng)該說(shuō)是個(gè)甄別的好題目」當(dāng)時(shí)還是 Facebook 人工智能科學(xué)家的賈揚(yáng)清在回答中揭開其中妙處,「涉及一個(gè)很本質(zhì)的問(wèn)題就是卷積為什么能夠 work?!?回答這個(gè)問(wèn)題的角度有很多,正則化、統(tǒng)計(jì)、編程甚至神經(jīng)科學(xué)等,不同角度回答能從不同側(cè)面折射出被試者的深度學(xué)習(xí)經(jīng)驗(yàn)。 

如果有人對(duì)三個(gè)問(wèn)題的回答基本都正確,就說(shuō)明他對(duì) CNN 理解在線,也是王乃巖要找的人。

一條條接踵而至的回答不斷拉長(zhǎng)進(jìn)度條。「接近了,但不準(zhǔn)確」、「基本靠譜!下面會(huì)讓 HR 聯(lián)系你」、「有興趣的話,發(fā) CV 到**」,基本沾邊的回答,王乃巖都會(huì)回應(yīng),但更多答案下面是寂靜無(wú)聲。如其所料,八成的人并不清楚卷積神經(jīng)網(wǎng)絡(luò)為什么起作用,他們僅僅將它視為一個(gè)工具,跑跑開源代碼。 

一位日本名校畢業(yè)的碩士引起了王乃巖的注意。「本科是清華大學(xué)的,當(dāng)時(shí)在日本讀完碩士正在找工作,他的答案跟我心里想的很接近?!雇跄藥r說(shuō)。接下來(lái)的面試感覺(jué)也很好,立刻給他發(fā)了錄用通知。這是圖森未來(lái)招到的第一位算法工程師員工。如今,他已經(jīng)是公司日本業(yè)務(wù)負(fù)責(zé)人。 

互聯(lián)網(wǎng)使得地理意義的「附近」已經(jīng)轉(zhuǎn)化為數(shù)字意義的「附近」。你可能不了解一步之遙的鄰居,但對(duì)復(fù)雜技術(shù)構(gòu)造出來(lái)的抽象系統(tǒng)高度信任,比如知乎。對(duì)于不少名副其實(shí)的 AI 創(chuàng)業(yè)團(tuán)隊(duì)來(lái)說(shuō),當(dāng)他們需要更多依靠個(gè)人渠道搶人時(shí),這里往往是個(gè)不錯(cuò)選擇。 

就在王乃巖尋找算法工程師時(shí),袁進(jìn)輝也在為開發(fā)深度學(xué)習(xí)框架求賢若渴。注冊(cè)知乎后,袁進(jìn)輝做的第一件就是為他們的工作做「廣告」。有的人看到袁進(jìn)輝的文章和互動(dòng)才知道除了互聯(lián)網(wǎng)大廠,在創(chuàng)業(yè)公司也能做底層架構(gòu)。好幾位一流科技的全職同事包括實(shí)習(xí)生,都是這樣從知乎上招到的。 

更多時(shí)候,袁進(jìn)輝會(huì)主動(dòng)出擊。瀏覽到有意思、充滿真知灼見的回答,他會(huì)去看對(duì)方的 Github,力求較為全面的了解。雖然沒(méi)能「挖到」一些心儀的人,但大家慢慢也成了朋友,會(huì)見面交流一些看法。 

在自己領(lǐng)域做得越久,寫得文章更多、問(wèn)題互動(dòng)更多,社區(qū)反饋也更好。一位面試過(guò)多家公司實(shí)習(xí)崗的本科生在「國(guó)內(nèi)有沒(méi)有本科在讀適合的系統(tǒng)或編譯器實(shí)習(xí)崗」中回復(fù)說(shuō): 

其中我看說(shuō)你對(duì)技術(shù)/coding 有極致的追求,我覺(jué)得袁老師的 oneflow 是一家非常有深度的公司,當(dāng)時(shí)面試我直接和oneflow的面試官聊了一下午C++和并行計(jì)算,從各種優(yōu)化技巧比如sso,stack/dynamic memory,到各種模板,函數(shù)式風(fēng)格編程,以及吹/黑最近的一些ml system的論文。

平時(shí)一向低調(diào)的王乃巖在知乎上特別活躍,寫文章做技術(shù)分享,也是深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和人工智能領(lǐng)域優(yōu)秀答主。關(guān)注他的粉絲中不少是在讀計(jì)算機(jī)專業(yè)學(xué)生,不少人也是通過(guò)「關(guān)注」最終成為圖森未來(lái)的一員。圖森未來(lái)現(xiàn)在的算法崗位有不少本科生,這在很多公司是不可能發(fā)生的。 

其實(shí),他們非常優(yōu)秀。在王乃巖看來(lái),如果按照互聯(lián)網(wǎng)大廠招聘模式,一些沒(méi)有光鮮教育背景也沒(méi)有閃亮論文的「璞玉」會(huì)被那些硬標(biāo)準(zhǔn)直接篩掉。

「很多時(shí)候,他們已經(jīng)有什么沒(méi)那么重要。我們更在意這個(gè)人的基礎(chǔ)能力和潛力,有沒(méi)有自我思考和對(duì)技術(shù)的熱忱,哪怕他是一個(gè)本科生?!?nbsp;

現(xiàn)在,王乃巖仍然會(huì)從知乎上尋找人才。但與創(chuàng)業(yè)初期不同的是,更多是被動(dòng)去找。「不論是關(guān)注的人還是信息流、推薦,已經(jīng)幫我過(guò)濾掉很多無(wú)效信息?!雇跄藥r說(shuō),「真有用的信息,會(huì)在信息流里反復(fù)出現(xiàn)。」 

平時(shí)他會(huì)瀏覽一些熱門話題,看到有意思的回答也會(huì)點(diǎn)擊進(jìn)去了解更多。契合公司需要,他會(huì)轉(zhuǎn)給人事部門。

無(wú)論技術(shù)如何發(fā)展,Top1% 的人不會(huì)變,對(duì)技術(shù)的熱忱、堅(jiān)定的信念仍然是他最看重的。 

四、時(shí)光回響  

ChatGPT 發(fā)布后,知乎答主「Trinkle 」突然現(xiàn)身「如何評(píng)價(jià) OpenAI 的超級(jí)對(duì)話模型 ChatGPT?」問(wèn)題下,公開自己「有幸參與 ChatGPT 訓(xùn)練全過(guò)程」并呈上對(duì)未來(lái)世界的想法: 

「可以開始想象 AGI 之后的世界了,我已經(jīng)想了幾個(gè)月了。......」 

圖片

回答底部, 在 OpenAI 官網(wǎng)致謝內(nèi)容里,「Jiayi Weng」出現(xiàn)在一串貢獻(xiàn)者名單中并被高光,人們逐漸知道「Trinkle 」叫翁家翌。他是 OpenAI 近兩年來(lái)第一位碩士畢業(yè)應(yīng)屆生員工,也是團(tuán)隊(duì)年紀(jì)最小的研發(fā)工程師之一。 

現(xiàn)在,回答已收獲 3000 多個(gè)贊。很少有人知道他一度覺(jué)得自己靠不近 OpenAI,「畢業(yè)投簡(jiǎn)歷時(shí),也認(rèn)為自己靠不近?!顾f(shuō)。 

翁家翌從初一開始接觸編程,當(dāng)時(shí)重心在奧數(shù)上,學(xué)編程不過(guò)是為了拓展數(shù)學(xué)思路。真正感到編程魅力是在高中進(jìn)入福州一中后。

當(dāng)時(shí),他很喜歡卡常數(shù)?!附o一個(gè)固定問(wèn)題,你可以寫一堆代碼,寫相同的算法,有相同的時(shí)間復(fù)雜度,但我可以協(xié)調(diào)一些東西,讓相同的算法比別人跑得快?!惯@種 PK 讓他很有成就感。

當(dāng)時(shí)福州一中信息組有一個(gè)內(nèi)部判題系統(tǒng)( OJ )在線測(cè)評(píng),里面有各種歷史記錄,翁家翌經(jīng)常刷到第一才會(huì)停下來(lái)。 

高二時(shí),翁家翌徹底將重心從數(shù)學(xué)轉(zhuǎn)到編程。為了能上「清北復(fù)交」,他決定參加信息學(xué)奧賽。當(dāng)時(shí)信息組有不少同學(xué)在玩知乎,他也注冊(cè)了一個(gè)賬號(hào)。那時(shí),他不會(huì)想到幾年后會(huì)成為許多網(wǎng)友眼中「高三開始玩知乎的天才少年」。 

阿爾法狗戰(zhàn)勝李世石的那一年,翁家翌也如愿進(jìn)入清華大學(xué)。因?yàn)樾畔W(xué)奧賽發(fā)揮失常,他靠大一達(dá)成全系績(jī)點(diǎn)前十成就轉(zhuǎn)到計(jì)算機(jī)系。大二時(shí)與強(qiáng)化學(xué)習(xí)結(jié)緣。 

與朱軍教授見面一對(duì)一聊天時(shí),朱軍教授問(wèn)他想做什么?組里有三個(gè)方向:貝葉斯、對(duì)抗訓(xùn)練和強(qiáng)化學(xué)習(xí)。雖然選擇了強(qiáng)化學(xué)習(xí),但他當(dāng)時(shí)并不知道什么是強(qiáng)化學(xué)習(xí)。

「一開始以為和做 GAN (對(duì)抗訓(xùn)練)差不多?!惯x完后才知道要打游戲。為了入門,他后來(lái)玩了很多游戲。 

如果說(shuō)高中時(shí)的翁家翌主要在知乎潛水和搜集信息,進(jìn)入清華大學(xué)后,他有了更多分享的欲望?;蛟S這與他高中就立下的人生目標(biāo)有關(guān)——獲得更多的影響力,幫助更多的人。這些都需要與機(jī)器、與人建立連接。 

他在知乎發(fā)布的最重要工作是大四畢業(yè)設(shè)計(jì)強(qiáng)化學(xué)習(xí)算法庫(kù)Tianshou(天授),也是至今對(duì)他影響最大的研究。后來(lái)能進(jìn)入 Open AI 工作也受益于這次「一作」經(jīng)歷。 

最初版本的 Tianshou(天授)是兩年前實(shí)驗(yàn)室四個(gè)人用 Tensorflow 寫的,速度非常慢,沒(méi)什么人用。他曾試著重構(gòu)里面部分代碼,但沒(méi)用。后來(lái)干脆全部推倒重來(lái)。結(jié)果發(fā)現(xiàn),精簡(jiǎn)框架帶來(lái)的收益不僅是代碼層面上的,還有性能上的。 

工作發(fā)布后,有眼尖的網(wǎng)友發(fā)現(xiàn)了這點(diǎn):

「如果同樣的算法比如 dqn+同樣是 pytorch,為什么你的代碼會(huì)快那么多?感覺(jué)除了這兩部分其他代碼的邏輯都類似啊?!?nbsp;

「代碼也是有靈魂的(逃,就是實(shí)現(xiàn)細(xì)節(jié)吧……」他說(shuō)。 

那一次「真正讓我意識(shí)到,如果要?jiǎng)?chuàng)造影響力,你應(yīng)該去寫一些基礎(chǔ)的東西,或者在工程上有所建樹,而不是說(shuō)在一些 research 方面有所建樹?!顾f(shuō)。

AI 領(lǐng)域有很多低質(zhì)量的實(shí)現(xiàn),很可能是因?yàn)檠芯空吖こ棠芰Σ粔?。如果把一些工程方面見解帶入研究,?huì)有不一樣的收獲。 

除了擴(kuò)大工作影響力,翁家翌也熱衷參與清華大學(xué)本科生活有關(guān)的話題?!高x擇在清華大學(xué)念書你后悔嗎?」、「在清華大學(xué)讀計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)是一種什么體驗(yàn)?」問(wèn)題下都留下過(guò)他的痕跡。一段走出迷惘困惑,逐步堅(jiān)定方向的過(guò)往,讓他的回答至今人氣不減。

「感覺(jué)這樣的心態(tài)正是我需要的,快要被你清 fly bitch 折磨瘋了?!挂晃磺迦A校友敲出自己的心聲。 

「學(xué)會(huì)承認(rèn)自己不如人,與自己和解。」翁家翌寫道。高中時(shí),他就發(fā)現(xiàn)不管自己多么努力,總有人站在更高地方俯瞰自己,無(wú)論是信息學(xué)奧賽還是文化課。大學(xué)最初兩年亦復(fù)如此。英語(yǔ)比不過(guò)室友,一些聽不懂的課,總有人不用學(xué)都能過(guò)。 

「要學(xué)會(huì)定義評(píng)價(jià)指標(biāo),不再隨波逐流?!惯@是他的建議。到了大三,翁家翌徹底改變對(duì)自己的評(píng)價(jià)指標(biāo),回歸初心。

他不再按部就班地刷 GPA、「卷」論文,更喜歡做一些「無(wú)用」但有趣的事情,例如寫代碼?!笇憘€(gè)人項(xiàng)目的時(shí)候我覺(jué)得我在創(chuàng)造一件藝術(shù)品?!箤?duì)寫代碼和開源項(xiàng)目的熱愛(ài)也影響了后來(lái)出國(guó)留學(xué)的決定。 

每邁向一個(gè)新的站點(diǎn)——春招、秋招、博士申請(qǐng)、國(guó)內(nèi)找實(shí)習(xí)崗——他都不吝于分享自己的經(jīng)歷,不管是多個(gè) offer 在手的晴朗、還是博士申請(qǐng)被吃「全聚德」的陰郁,每次回答都收獲很高人氣。

現(xiàn)在,翁家翌已經(jīng)貢獻(xiàn)了 33 個(gè)回答,發(fā)布了 3 篇文章,累計(jì)了 2 萬(wàn)多個(gè)關(guān)注者,總共獲得 28,966 次贊同。這些數(shù)字或多或少量化出「用自己的力量幫助更多的人?!?nbsp;

在「你的 2022 秋招進(jìn)展怎么樣了?」問(wèn)答下,他共享出投了上百家公司的經(jīng)驗(yàn)并在這個(gè)近千高贊回答的末了寫,下「選擇大于努力?!?/span>

如果沒(méi)有做出那些基于當(dāng)下環(huán)境的最優(yōu)決策,沒(méi)有參加信息學(xué)大賽、選擇強(qiáng)化學(xué)習(xí),也沒(méi)有申請(qǐng)出國(guó)讀書,又或者堅(jiān)持讀博,還有可能走到今天這個(gè)節(jié)點(diǎn)嗎? 

努力彌補(bǔ)不了決策失誤。Google 目前為什么在 AI 上落后 OpenAI 一大截?采訪時(shí)他反問(wèn)道,然后又徑直給出答案,「因?yàn)樗麄冞x擇了另外一個(gè)方向,與 OpenAI 不同的方向?!?nbsp;

最近,有人問(wèn)「有什么方式加入 OpenAI 做研究嗎?......我認(rèn)為在公司做 research 似乎是更有效果的事情,可以給我一些建議嘛?!?/span>

他將當(dāng)初這個(gè)高贊回答的鏈接轉(zhuǎn)給了對(duì)方。 

圖片

壯觀的珊瑚礁是珊瑚蟲們努力多年的大工程。珊瑚礁僅占全球海床洋底0.5%的面積,卻是四分之一以上海洋生物的家園。 

在知乎,每一個(gè)科技「知乎er 」猶如渺小又神奇的珊瑚蟲和蟲黃藻,借由提問(wèn)、回答和關(guān)注,彼此交換能量信息,周而復(fù)始,一種更加高級(jí)的系統(tǒng)出現(xiàn)了,引來(lái)更多前沿科技「物種」棲息,包括一些頂級(jí)科學(xué)家。 

知乎戰(zhàn)略副總裁、社區(qū)業(yè)務(wù)負(fù)責(zé)人張寧曾表示,站內(nèi)從事科研學(xué)習(xí)和工作的人群總數(shù)高達(dá) 544 萬(wàn)人,僅科技互聯(lián)網(wǎng)領(lǐng)域,就日均圖文生產(chǎn)量?jī)扇f(wàn)多篇,在數(shù)學(xué)、物理、天文、人工智能等多個(gè)領(lǐng)域的回答、文章和視頻數(shù)都超過(guò)了 100 萬(wàn)篇。 

ChatGPT 后,百度「文心一言」發(fā)布、GPT-4 發(fā)布、微軟集成 AI 對(duì)話功能等一線事件發(fā)生時(shí),業(yè)內(nèi)大咖都在第一時(shí)間聚此討論。

3 月 28 日,華裔數(shù)學(xué)家張益唐在知乎上發(fā)出邀請(qǐng):「我將應(yīng)哈佛大學(xué)和歐洲幾個(gè)大學(xué)的邀請(qǐng),做一次直播,主題為:Non-positive sequences in analyticnumber theory & the Landau-Siegel zero(解析數(shù)論中的非正序列&朗道-西格爾零點(diǎn)?!?nbsp;

這一次,在知乎,你又可以聽到號(hào)角的聲音。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2011-05-17 09:58:50

IP

2023-02-20 06:43:46

ChatGPT人工智能

2019-11-25 11:03:19

互聯(lián)網(wǎng)數(shù)據(jù)技術(shù)

2019-11-12 09:20:24

人工智能機(jī)器學(xué)習(xí)技術(shù)

2023-06-07 13:41:48

大型語(yǔ)言模型ChatGPT

2023-08-21 07:55:32

2018-12-13 11:32:55

知乎裁員調(diào)整

2018-03-13 12:46:41

單模多模光纖

2023-06-27 07:20:45

2023-07-18 18:14:51

云原生軟件架構(gòu)

2025-02-11 09:12:55

2025-01-27 12:28:55

2017-06-16 21:00:02

Python爬蟲

2015-07-21 15:22:20

點(diǎn)贊仿知乎按鈕動(dòng)畫

2019-07-16 09:24:32

全光網(wǎng)全光傳送網(wǎng)華為

2016-01-04 09:13:54

2023-10-24 20:32:40

大數(shù)據(jù)

2017-05-24 15:07:19

Python爬蟲爬取

2015-07-22 09:43:30

2020-03-30 15:08:56

知乎崩潰網(wǎng)友
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)