2017年為什么我一定要學(xué)深度學(xué)習(xí)
對(duì)于深度學(xué)習(xí),我也是一個(gè)初學(xué)者,這篇文章只是我的個(gè)人想法,能力有限,所以對(duì)不對(duì),不好說(shuō),但的確是我現(xiàn)在的真實(shí)想法,我也會(huì)按這個(gè)思路去嘗試。請(qǐng)大家?guī)е|(zhì)疑精神去讀吧。
一
我大概是一個(gè)好奇心很重的人,所以每次有新的技術(shù)出來(lái),我都會(huì)在***時(shí)間跟進(jìn)。但我又是一個(gè)記性不太好的人,大部分研究過(guò)的新技術(shù),因?yàn)闆](méi)有天天用,很快又都忘掉了。
深度學(xué)習(xí)剛開(kāi)始流行的時(shí)候,我就做過(guò)簡(jiǎn)單的學(xué)習(xí)。當(dāng)時(shí)我的結(jié)論是短期內(nèi),深度學(xué)習(xí)只能在***能徘徊,很難進(jìn)展到強(qiáng)智能。
這個(gè)結(jié)論在今天看來(lái),也不算過(guò)時(shí)。但真正被深度學(xué)習(xí)給 Shock 到,是去年和某教育 APP 的 CEO 同學(xué)聊天。他告訴我,在教育這個(gè)垂直領(lǐng)域,他們的語(yǔ)音識(shí)別率已經(jīng)比訊飛要高了,依賴于大量的數(shù)據(jù);更 NB 的是,加上 NLP,他們的 AI 已經(jīng)可以幫老師改主觀題了。主觀題啊,就是數(shù)學(xué)的問(wèn)答題,語(yǔ)文的作文。
這讓我開(kāi)始重新思考***能。
二
完全依靠強(qiáng)智能的應(yīng)用場(chǎng)景,會(huì)產(chǎn)生很多問(wèn)題。比如自動(dòng)駕駛,要想在中國(guó)這種各種奇葩狀況層出不窮的交通環(huán)境下運(yùn)行,一時(shí)半會(huì)兒是不行。即使是一個(gè)看起來(lái)簡(jiǎn)單的問(wèn)答機(jī)器人,也沒(méi)一家真正做好,你多問(wèn) siri 幾句,她很快就暈了。
經(jīng)常關(guān)注我微博同學(xué)會(huì)知道,我最喜歡說(shuō)的一句話就是:「能自動(dòng)化的,要自動(dòng)化;不能自動(dòng)化的,要半自動(dòng)化」。
在人工智能上,這個(gè)法則似乎依然是有效的。既然現(xiàn)在強(qiáng)智能還不夠強(qiáng),那么為什么我們不用***能+人工確認(rèn)的方式,來(lái)實(shí)現(xiàn)「半智能化」呢:用機(jī)器幫你做預(yù)選,你來(lái)做最終選擇,雖然依然包含了人工干預(yù),但卻可以把生產(chǎn)效率提升幾十倍。
三
有同學(xué)和我說(shuō),找不到應(yīng)用深度學(xué)習(xí)的場(chǎng)景,這是因?yàn)樘珗?zhí)著于強(qiáng)智能,想讓機(jī)器獨(dú)立處理所有事情;如果使用「半自動(dòng)化」的思路,你會(huì)發(fā)現(xiàn)遍地都是場(chǎng)景。
最典型的場(chǎng)景就是「按需求進(jìn)行組合搭配」。拿今天正式上線的小程序舉例子吧,小程序在框架層上,將功能分隔到了page 的粒度,這使得小程序的組件會(huì)很好的被重用;而在設(shè)計(jì)上,小程序提供了統(tǒng)一的官方指導(dǎo)風(fēng)格,所以不會(huì)出現(xiàn)太多個(gè)性化的東西。
我需要一個(gè)用戶資料管理, xpm install user-profile;我需要?jiǎng)討B(tài) Feed 流,xpm install feed-timeline 。
然后這貨就喊著要去做,還在 GitHub 上開(kāi)了個(gè)坑,據(jù)說(shuō) SDK 已經(jīng)寫完,安裝器年前能開(kāi)始內(nèi)測(cè)。https://git.oschina.net/xpmjs/xpm
然后我告訴他,你得趕緊做,從長(zhǎng)遠(yuǎn)看,通用應(yīng)用***是不太值錢的,因?yàn)楹芸炀陀虚_(kāi)源項(xiàng)目把它做得很好。真正值錢的是,下沉到行業(yè)里邊的應(yīng)用。比如說(shuō)吧,同樣是用戶資料頁(yè),房地產(chǎn)行業(yè)的、獵頭行業(yè)的以及技術(shù)社區(qū)的會(huì)完全不一樣。但區(qū)別也就是添加幾個(gè)行業(yè)特定的字段而已。 大量的「二次開(kāi)發(fā)」工作,才是最為瑣碎又最為掙錢的。
這就是典型的可以用上深度學(xué)習(xí)的場(chǎng)景。通過(guò)抓取對(duì)應(yīng)行業(yè)的 H5 頁(yè)面,我們很快就可以把各個(gè)行業(yè)需要哪些可能的字段給整理出來(lái),然后把這些交給機(jī)器進(jìn)行學(xué)習(xí),當(dāng)再有新的需求進(jìn)來(lái)的時(shí)候,機(jī)器就可以自動(dòng)配好預(yù)設(shè)字段。機(jī)器會(huì)出錯(cuò)么?當(dāng)然。但哪怕是80%的準(zhǔn)確率,也已經(jīng)可以節(jié)省掉好幾個(gè)程序員了。
為什么我要學(xué)深度學(xué)習(xí)? 因?yàn)檫@背后是 TM 白花花的銀子。
四
這是近在眼前的機(jī)會(huì),我再說(shuō)個(gè)遠(yuǎn)點(diǎn)的。大家知道,日本人的科技樹(shù)一般都不按套路長(zhǎng)。早稻田大學(xué)一心想把深度學(xué)習(xí)用在二次元上,他們先是搞了個(gè)項(xiàng)目給黑白畫稿上色;后來(lái)又發(fā)了篇論文給草稿描線。我覺(jué)得很快,他們就要開(kāi)始學(xué)習(xí)漫畫大家的畫風(fēng),通過(guò)線稿生成原稿了
「?jìng)鹘y(tǒng)」的日漫或許很難由機(jī)器生產(chǎn),但現(xiàn)在社交網(wǎng)絡(luò)上大量生產(chǎn)的「條漫」卻對(duì)畫質(zhì)要求不高。尤其是四格類的,經(jīng)常關(guān)注我的同學(xué)應(yīng)該看過(guò)我用 Comipo!軟件「繪制」的四格漫畫。( http://zhijia.io/anthology/101869 ) 當(dāng)機(jī)器參與進(jìn)來(lái)后,根據(jù)腳本生成這種品質(zhì)的漫畫簡(jiǎn)直易如反掌。到時(shí)候,人人都能過(guò)上1%的生活。
為什么我要學(xué)習(xí)深度學(xué)習(xí)?因?yàn)槲乙屛磥?lái)早點(diǎn)來(lái)。
五
上周我發(fā)了條微博,說(shuō)2017年要自學(xué)深度學(xué)習(xí),有過(guò)千的同學(xué)表示愿意一起來(lái)學(xué)。
也有同學(xué)表示,機(jī)器學(xué)習(xí)不是那么好學(xué)的。其實(shí)細(xì)心的同學(xué)會(huì)發(fā)現(xiàn),我一直說(shuō)的是「深度學(xué)習(xí)」而不是「機(jī)器學(xué)習(xí)」。
因?yàn)槲业哪康暮芎?jiǎn)單,那就是用。在學(xué)習(xí)***年,我給自己定的目標(biāo)不是要理解「機(jī)器學(xué)習(xí)」的原理,而是要把「深度學(xué)習(xí)」用到自己產(chǎn)品的方方面面。
用以致學(xué),是我一貫的學(xué)習(xí)方式。剛開(kāi)始不理解沒(méi)關(guān)系,先用起來(lái)。需要理解的時(shí)候,再慢慢理解。說(shuō)到底,也沒(méi)多少人理解自己手機(jī)每一部分的工作原理不是。
先學(xué)「深度學(xué)習(xí)」還有一個(gè)好處,那就是不用太多「機(jī)器學(xué)習(xí)」的基礎(chǔ)。能把tensorflow、kears 這種開(kāi)源框架搭起來(lái),然后喂數(shù)據(jù),然后看結(jié)果。等到優(yōu)化的時(shí)候再去補(bǔ)知識(shí)點(diǎn)。
因?yàn)樯疃葘W(xué)習(xí)更像是一個(gè)黑盒子,現(xiàn)在很多專門搞深度學(xué)習(xí)的同學(xué)也說(shuō)不清楚為什么要建三個(gè)層、要放四個(gè)節(jié)點(diǎn);什么情況下用什么激活函數(shù)。只說(shuō)通過(guò)實(shí)踐+觀察數(shù)據(jù)慢慢調(diào)整。這簡(jiǎn)直就是新手上路的***切入點(diǎn)嘛。
如果不想在本地搭建環(huán)境,AWS 上已經(jīng)有可以用的鏡像,基于 API 的深度學(xué)習(xí)服務(wù)也日益增多。這東西就像水電氣一樣,用比學(xué)重要。
也有同學(xué)嚴(yán)謹(jǐn)?shù)闹赋?,很多?chǎng)合下,機(jī)器學(xué)習(xí)的其他方法遠(yuǎn)比深度學(xué)習(xí)有效。他們是對(duì)的,如果說(shuō)學(xué)好整個(gè)機(jī)器學(xué)習(xí),可以做到90分;那么光用深度學(xué)習(xí),可能只有70分。
但現(xiàn)在絕大部分的程序,連 TM 一點(diǎn)智能都還沒(méi)用上呢。從零分到70分,只需要把深度學(xué)習(xí)用起來(lái)。
為什么我要學(xué)習(xí)深度學(xué)習(xí),因?yàn)檫@ TM的性價(jià)比太高。