自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

萬萬沒想到,枯燥的“機器學(xué)習(xí)”還可以這樣學(xué)!

新聞 機器學(xué)習(xí)
機器學(xué)習(xí)是人工智能的核心之一,涉及領(lǐng)域包括概率論、統(tǒng)計學(xué)等復(fù)雜學(xué)科。對于非專業(yè)人士來說,想要理解它著實不容易。

 [[234276]]

  機器學(xué)習(xí)是人工智能的核心之一,涉及領(lǐng)域包括概率論、統(tǒng)計學(xué)等復(fù)雜學(xué)科。對于非專業(yè)人士來說,想要理解它著實不容易。

  最近,螞蟻 AI 平臺部的栢檸,卻在遛彎中找到解釋“機器學(xué)習(xí)”的關(guān)鍵所在,以深入淺出的方式把“機器學(xué)習(xí)”解釋得趣味盎然。下面一起來學(xué)下吧!

  本文作者:螞蟻金服 AI 平臺部資深產(chǎn)品專家栢檸(朱百寧)

  5 月末的一天中午,螞蟻 AI 平臺部的幾個 PD 同學(xué)吃完老娘舅,在Z空間樓下遛彎。

  期間,某同學(xué)提到一則“小孩子因為雞毛蒜皮的小事,想不開而做出傻事”的新聞。

  當(dāng)大家在紛紛感嘆的時候,一位產(chǎn)品專家同學(xué)形象地說了一句——這個孩子的“模型過擬合、泛化能力太差”。

  這個比喻確實一針見血、入木三分啊!眾人均表示,以此悟性,該同學(xué)“晉升研究員,入主組織部”就指日可待了!

  的確如此,嬌生慣養(yǎng)(過擬合:overfitting)形成的脆弱心智(模型),在面臨真實世界當(dāng)中的種種不如意時,往往不能正確地處理(預(yù)測不準、泛化能力差),從而非常容易釀成悲劇。

  在機器學(xué)習(xí)當(dāng)中,在訓(xùn)練模型時,如果樣本太單一或者特征選擇不當(dāng),就會出現(xiàn)過擬合。即把訓(xùn)練樣本當(dāng)中的特殊情況,當(dāng)成普遍情況。這樣,在面對新的樣本時,就無法正確處理。

  我們常說的應(yīng)試教育和素質(zhì)教育,也有泛化能力的巨大差異。

  應(yīng)試教育整天讓學(xué)生做卷子、刷題庫,訓(xùn)練出來模型過擬合、泛化能力差,就會出現(xiàn)“高分低能”的情況。而素質(zhì)教育則注重能力鍛煉、比較多元化,訓(xùn)練出來的模型泛化能力強,學(xué)生們將來在生活和工作方面都不會有太大的問題。

[[234278]]

  其實,如果你把人的成長與機器學(xué)習(xí)進行仔細比對,你就會發(fā)現(xiàn),兩者還有更多異曲同工之妙。

  一個嬰兒呱呱墜地,他天生就會具備一些能力(自帶算法庫),比如心跳、呼吸、哭、笑、恐懼等等。

  這些能力,都是神奇的進化和偉大的基因帶給我們的。否則,讓我們重新掌握一遍這些技能那就太費勁了。

[[234279]]

  當(dāng)然,為了正常的生活,僅僅有這些自帶的初級算法和模型是還不夠,你還要不斷地掌握一些新的技能(自研算法)。

  比如,吃飯、走路、說話等等。

  要掌握這些技能,需要父母日復(fù)一日,年復(fù)一年,不辭辛苦地反復(fù)教我們,訓(xùn)練我們咿呀學(xué)語、蹣跚學(xué)步。

  這就像在機器學(xué)習(xí)中,需要足夠多的樣本(成千上萬),耗費很多計算資源,經(jīng)過數(shù)分鐘甚至數(shù)小時、數(shù)天的持續(xù)訓(xùn)練,才能獲得一個模型。

  其實,在人的大腦當(dāng)中,不光有常年累月不斷訓(xùn)練而掌握的技能(模型),還會有一些強規(guī)則。

  這些規(guī)則,有些是父母教給我們的,有的是社會道德規(guī)范、法律法規(guī)形成的 。

  比如,父母會對小孩子說:“不要隨便吃陌生人給的食物”、“過馬路時要左右看”。

  在生活當(dāng)中,要尊老愛幼、禮尚往來,要遵紀守法、踐行社會主義核心價值觀等等。

  對于這些規(guī)則,我們記住,以后照做就行了。

  由此可見,我們的大腦就像一個決策中心或者決策中樞,其中包含了無數(shù)規(guī)則和模型

  。每次決策,就是組合地使用這些規(guī)則和模型。

  在實際的機器學(xué)習(xí)應(yīng)用場景中,在各個業(yè)務(wù)線當(dāng)中,也有各種各樣類似的“決策中心”,比如大安全的 UCT、微貸的 AGDS 以及 DecisionX 這樣的“通用決策中心”。

  這個決策中心,就包含了成百上千復(fù)雜的規(guī)則(或者稱為“策略”)以及訓(xùn)練得到的模型。對于某一個,用策略 and/or 模型的組合來進行判斷和決策。

  而且,往往是先判斷策略,如果不滿足某個策略,那么就直接給出決策。

  隨著年齡的增長,除了吃喝拉撒這些基本技能,我們的決策中心還需要掌握更多的技能,比如語文、數(shù)學(xué)、音樂、舞蹈、體育等等。

  在這方面,經(jīng)常會看到某些孩子“天賦異稟”,即系統(tǒng)自帶超牛的算法——他的爸媽給他遺傳了更好的算法。

  不過,我們普通人也不要氣餒,我們可以付出更多努力(大樣本),不斷刻意、刻苦地訓(xùn)練(模型不斷 retrain 和演進),也能取得好的成績。

  人生是場馬拉松,模型訓(xùn)練也是如此。

[[234281]]

  相比之下,在這場馬拉松當(dāng)中,在人生的不同年齡階段,我們所使用的學(xué)習(xí)方法也不盡相同。

  在小時候,我們大多數(shù)采用的是有監(jiān)督的機器學(xué)習(xí)。

  比如,父母會拿著各種各樣的水果教我們:“這是蘋果,這是桔子”。

  動畫片和故事書經(jīng)常告訴我們:哪些是好人,哪些是壞人。

  于是,我們最常用的就是二分類算法:大/小、長/短、是/否、好/壞。

[[234282]]

  而長大以后,我們遇到更多的是無監(jiān)督或者半監(jiān)督的學(xué)習(xí),很多事物并不會帶著明確的是非對錯的標簽。

  因此,我們會用一些聚類算法。跟遇到的人經(jīng)過一段時間熟悉后,才會把他們分為“講義氣”、“酒量大”、“會修電腦”、“愛吃老娘舅”等各個類別。

[[234283]]

  盡管學(xué)習(xí)的方法各異,但大道至簡、萬物相同。

  我們知道,一個人在某個方面有所成就,就很容易在其他領(lǐng)域表現(xiàn)優(yōu)異(遷移學(xué)習(xí)) 。

  比如,愛因斯坦不僅是杰出的科學(xué)家,他還精通小提琴。一個C語言高手,很快就能變身 Java 大拿。

  當(dāng)然,細究起來,人腦與機器學(xué)習(xí)也有不少差異。

  比如,給小孩玩幾個玩具汽車、看幾張汽車圖片,他就會能認識許多造型各異、圖片風(fēng)格迥異的汽車。

  相比之下,要讓機器達到這樣看似簡單的能力,則需要需要數(shù)萬、數(shù)百萬的樣本來訓(xùn)練。

  幾年來,有關(guān) AutoML 的一個研究方向,就是解決如何用少量的樣本完成模型的訓(xùn)練。

[[234284]]

  此外,我們發(fā)現(xiàn),人類“下意識、一瞬間”能做的事情,對于人工智能來說卻很難。

  比如,認識物體和人像(圖像識別能力)、喜怒哀樂的情緒以及行走奔跑的能力。究其原因,還是歸功于偉大的進化——我們的這些模型,是經(jīng)歷了億萬年的進化,經(jīng)過了無數(shù)次地模型演進才獲得的。

  反過來說,人類花很長時間才能做完的事情,對電腦來說卻易如反掌。例如,在短時間內(nèi),對 100 萬個數(shù)字求和,或者把圓周率的精確到小數(shù)點后 100 萬位。

[[234285]]

  然而,要找到人腦和人工智能的能力差異背后的真實原因,人類還有很長一段路要走。

  盡管現(xiàn)在科技日新月異,盡管人們已經(jīng)發(fā)明出了“深度神經(jīng)網(wǎng)絡(luò)”來實現(xiàn)人工智能(深度學(xué)習(xí)),讓機器認識貓、下圍棋,但人類對自己大腦的運作機制仍然知之甚少。

  可以說,人們用自己那神奇的、原理尚不清楚(不可解釋) 的大腦,造出了種種機理尚不清楚(不可解釋)的模型。

  也就是說,盡管你用深度學(xué)習(xí)訓(xùn)練出了一個可以識別貓的模型,但這個模型沒有可解釋性。即,你無法說出這個你訓(xùn)練出的這個牛逼的模型,究竟是靠哪些特征、哪些原則來識別出貓的。

[[234286]]

  人的心智,就是由無數(shù)個如此諱莫如深的模型以及清晰明了的規(guī)則組成。

  人的一生,就是不斷迭代舊算法、retrain 舊模型,研發(fā)新算法、訓(xùn)練新模型的過程。

  所謂“讀萬卷書、行萬里路、與萬人談”,這就是讓我們掌握更多的算法,擁有更全面的樣本,從而訓(xùn)練出更多樣的模型。

  不過,可惜的是,不像“長相、哭、笑”這類特征或技能,人類的大部分模型并不能通過基因來遺傳給我們的孩子。

  比如,一個“精通 Java/Python,擅 debug、調(diào) core”的高級技術(shù)專家(P8),與一個“深諳用戶體驗和人性本質(zhì)”的資深產(chǎn)品經(jīng)理(P6)合體之后,繁衍的后代并不能天生就會寫碼或畫線框圖。

  也就是說,你窮盡一生訓(xùn)練出來的各色優(yōu)雅的模型,有朝一日都會下線(模型下線)。

[[234288]]

  但是,并不要因此感到悲傷,人生本來就是一個體驗美好和精彩的過程。

  人常說,活到老學(xué)到老,這樣的人生才是完整的,才是值得期待的。

  總而言之,螞蟻金服 AI 平臺部匯聚了機器學(xué)習(xí)、大數(shù)據(jù)智能等領(lǐng)域的來自五湖四海、國內(nèi)國外的眾多精英,部門的產(chǎn)品支持了螞蟻金服多個核心產(chǎn)品和業(yè)務(wù)。

  這個團隊不光有才、有料,還有情、有義、有趣!

責(zé)任編輯:張燕妮 來源: 阿里技術(shù)
相關(guān)推薦

2018-05-02 09:38:02

程序員代碼互聯(lián)網(wǎng)

2021-11-29 05:37:24

Windows Def操作系統(tǒng)微軟

2018-01-26 23:23:23

JDBC MySQL數(shù)據(jù)庫

2019-08-19 09:21:36

程序員Bug代碼

2021-08-12 06:52:02

谷歌面試ArrayList

2023-10-31 12:29:25

模型訓(xùn)練

2021-06-02 11:10:09

PythonWeb可視化

2015-07-15 13:00:31

英特爾開源

2019-03-08 10:08:41

網(wǎng)絡(luò)程序猿代碼

2024-01-04 12:33:17

ChatGPTAI視頻

2017-12-12 11:09:39

顯卡散熱CPU

2023-02-26 00:00:02

字符串分割String

2021-02-21 17:14:27

程序員技能開發(fā)者

2021-08-31 09:35:01

TCPIP漏洞

2019-04-28 14:14:48

爬蟲網(wǎng)絡(luò)特價機票

2021-07-21 05:38:20

中國聯(lián)通攜號轉(zhuǎn)網(wǎng)移動

2021-01-27 18:13:35

日志nginx信息

2019-10-12 08:53:26

Redis多線程版本

2019-12-09 10:13:20

HashMap選擇容量

2017-12-26 15:41:26

點贊
收藏

51CTO技術(shù)棧公眾號