自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

傳說中Ilya Sutskever精選論文清單:AI領(lǐng)域40大論文完整版「破解」完成

人工智能 新聞
據(jù)說這份論文清單是 2020 年 OpenAI 的聯(lián)合創(chuàng)始人、首席科學(xué)家 Ilya Sutskever 給另一位計(jì)算機(jī)領(lǐng)域大神,id Software 聯(lián)合創(chuàng)始人,致力于轉(zhuǎn)行 AGI 的 John Carmack 編寫的。

今年 5 月,一份網(wǎng)傳 OpenAI 聯(lián)合創(chuàng)始人兼首席科學(xué)家 Ilya Sutskever 整理的一份機(jī)器學(xué)習(xí)研究文章清單火了。網(wǎng)友稱「Ilya 認(rèn)為掌握了這些內(nèi)容,你就了解了當(dāng)前(人工智能領(lǐng)域) 90% 的重要內(nèi)容?!?/span>

圖片

據(jù)說這份論文清單是 2020 年 OpenAI 的聯(lián)合創(chuàng)始人、首席科學(xué)家 Ilya Sutskever 給另一位計(jì)算機(jī)領(lǐng)域大神,id Software 聯(lián)合創(chuàng)始人,致力于轉(zhuǎn)行 AGI 的 John Carmack 編寫的。

雖然清單準(zhǔn)確性難以考證(John Carmack 本人回應(yīng)說已經(jīng)把列表搞丟了),而且 AI 領(lǐng)域發(fā)展日新月異,但其內(nèi)容很快流傳開來,甚至有人表示它是 OpenAI 入職培訓(xùn)內(nèi)容的一部分。

當(dāng)時(shí),這份清單包含 27 項(xiàng)機(jī)器學(xué)習(xí)資料,包括論文、博客文章、課程和兩本書的章節(jié),均來自 1993 年至 2020 年。

圖片

但據(jù)稱,受 Meta 電子郵件刪除策略的影響,該清單并不完整,原清單中應(yīng)該包含約 40 項(xiàng)閱讀資料。

圖片

轉(zhuǎn)發(fā)來轉(zhuǎn)發(fā)去,一小半內(nèi)容被擠掉了,這你受的了嗎?

特別是,根據(jù)與資料清單一起共享的一項(xiàng)聲明,整個(gè)「元學(xué)習(xí)」類論文列表都丟失了。元學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,是將自動(dòng)學(xué)習(xí)算法應(yīng)用于機(jī)器學(xué)習(xí)實(shí)驗(yàn)的元數(shù)據(jù)上。

就像紅樓夢缺失的 40 回,清單資料缺失的 13 篇論文引發(fā)了不少討論,對(duì)于哪些論文足夠重要而應(yīng)該包括在內(nèi),人們提出了許多不同的想法。

最近,一位名為 Taro Langner 的網(wǎng)友根據(jù) Ilya Sutskever 多年來演講內(nèi)容、OpenAI 共享的資源等,試圖找出清單丟失的資料。最后補(bǔ)充完成了「覆蓋 AI 領(lǐng)域 90% 知識(shí)」的 AI 論文名單。

與此同時(shí),他還指出了一些你必須注意的額外內(nèi)容,包括 Yann LeCun、Ian Goodfellow 等重要 AI 學(xué)者的工作,以及關(guān)于 U-Net、YOLO 目標(biāo)檢測、GAN、WaveNet、Word2Vec 等技術(shù)的論文。

讓我們看看其中的內(nèi)容,和論文推薦的理由。

缺失的「元學(xué)習(xí)」板塊

現(xiàn)在的 AI 系統(tǒng)可以通過大量時(shí)間和經(jīng)驗(yàn)從頭學(xué)習(xí)一項(xiàng)復(fù)雜技能。但是,我們?nèi)绻胧怪悄荏w掌握多種技能、適應(yīng)多種環(huán)境,則不應(yīng)該從頭開始在每一個(gè)環(huán)境中訓(xùn)練每一項(xiàng)技能,而是需要智能體通過對(duì)以往經(jīng)驗(yàn)的再利用來學(xué)習(xí)如何學(xué)習(xí)多項(xiàng)新任務(wù),因此我們不應(yīng)該獨(dú)立地訓(xùn)練每一個(gè)新任務(wù)。

這種學(xué)習(xí)如何學(xué)習(xí)的方法,又叫元學(xué)習(xí)(meta-learning),是通往可持續(xù)學(xué)習(xí)多項(xiàng)新任務(wù)的多面智能體的必經(jīng)之路。

Ilya Sutskever 擔(dān)任 OpenAI 首席科學(xué)家時(shí)曾發(fā)布教育資源「Spinning Up in Deep RL」,并公開發(fā)表過幾次關(guān)于「元學(xué)習(xí)」的演講:

  • Meta Learning and Self Play - Ilya Sutskever, OpenAI (YouTube), 2017
  • OpenAI - Meta Learning & Self Play - Ilya Sutskever (YouTube), 2018
  • Ilya Sutskever: OpenAI Meta-Learning and Self-Play (YouTube), 2018

Taro Langner 據(jù)此推測原始清單應(yīng)該包含以下幾篇研究論文:

  • 《Meta-Learning with Memory-Augmented Neural Networks》
    論文地址:https://proceedings.mlr.press/v48/santoro16.pdf
  • 《Prototypical Networks for Few-shot Learning》
    論文地址:https://arxiv.org/abs/1703.05175
  • 《Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks》
    論文地址:https://proceedings.mlr.press/v70/finn17a/finn17a.pdf

值得注意的是,Ilya Sutskever 在上述「元學(xué)習(xí)」演講中,還提到了以下幾篇論文:

  • 《Human-level concept learning through probabilistic program induction》
    論文地址:https://amygdala.psychdept.arizona.edu/labspace/JclubLabMeetings/Lijuan-Science-2015-Lake-1332-8.pdf
  • 《Neural Architecture Search with Reinforcement Learning》
    論文地址:https://arxiv.org/pdf/1611.01578
  • 《A Simple Neural Attentive Meta-Learner》
    論文地址:https://arxiv.org/pdf/1707.03141

可以發(fā)現(xiàn),強(qiáng)化學(xué)習(xí) (RL) 在演講中也占有重要地位,因?yàn)閺?qiáng)化學(xué)習(xí)與元學(xué)習(xí)有著密切的聯(lián)系。一個(gè)關(guān)鍵概念是競爭性自我博弈,其中智能體在模擬環(huán)境中進(jìn)行交互以達(dá)到特定的目標(biāo)。

Ilya Sutskever 提出了一種進(jìn)化生物學(xué)觀點(diǎn),將競爭性自我博弈與社交互動(dòng)對(duì)大腦大小的影響聯(lián)系起來。根據(jù)他的判斷,在模擬的「智能體社會(huì)」中快速獲得能力最終可能會(huì)為某種形式的通用人工智能提供一條可行的道路。

考慮到他賦予這些概念的重要性,一些被引用的有關(guān)自我博弈的論文也可能被納入閱讀清單:

  • 《Hindsight Experience Replay》
    論文地址:https://arxiv.org/abs/1707.01495
  • 《Continuous control with deep reinforcement learning》
    論文地址:https://arxiv.org/abs/1509.02971
  • 《Sim-to-Real Transfer of Robotic Control with Dynamics Randomization》
    論文地址:https://arxiv.org/abs/1710.06537
  • 《Meta Learning Shared Hierarchies》
    論文地址:https://arxiv.org/abs/1710.09767
  • 《Temporal Difference Learning and TD-Gammon ,1995》
    論文地址:https://www.csd.uwo.ca/~xling/cs346a/extra/tdgammon.pdf
  • 《Karl Sims - Evolved Virtual Creatures, Evolution Simulation, 1994》
    論文地址:https://dl.acm.org/doi/10.1145/192161.192167
  • 《Emergent Complexity via Multi-Agent Competition》
    論文地址:https://arxiv.org/abs/1710.03748
  • 《Deep reinforcement learning from human preferences》
    論文地址:https://arxiv.org/abs/1706.03741

其他可能性

當(dāng)然,原始的 40 篇論文名單上可能還有許多其他作品和作者,但從現(xiàn)在開始,證據(jù)越來越薄弱了。

總體而言,目前補(bǔ)充完整的論文名單在涵蓋不同模型類別、應(yīng)用和理論的同時(shí),還涵蓋了該領(lǐng)域的許多著名作者,端水端得已經(jīng)挺穩(wěn)了。但顯然,還有很多重要內(nèi)容值得注意。

我們似乎可以繼續(xù)列入:

  • Yann LeCun 等人的工作,他在 CNN 的實(shí)際應(yīng)用方面做出了開創(chuàng)性的工作 ——《Gradient-based learning applied to document recognition》
  • Ian Goodfellow 等人的工作,他在生成對(duì)抗網(wǎng)絡(luò)(GAN)方面的工作長期主導(dǎo)了圖像生成領(lǐng)域 ——《Generative Adversarial Networks》
  • Demis Hassabis 等人的工作,他在 AlphaFold 方面的強(qiáng)化學(xué)習(xí)研究獲得了諾貝爾獎(jiǎng) ——《Human-level control through deep reinforcement learning》、《AlphaFold at CASP13》

在更多信息公布之前,這篇文章在很大程度上仍是推測性的。畢竟,原版的「Ilya 閱讀清單」本身也從未得到官方證實(shí)是真的。盡管如此,你可以看出目前補(bǔ)充好的列表是絕對(duì)具有含金量的。總之讓我們先填補(bǔ)好空白,用作者的話來說,這大致相當(dāng)于當(dāng)時(shí)缺失了「重要內(nèi)容的 30%」。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-05-10 09:20:16

數(shù)據(jù)訓(xùn)練

2018-03-13 07:17:39

網(wǎng)絡(luò)限速運(yùn)營商網(wǎng)絡(luò)

2012-03-16 09:57:29

開源

2012-03-16 09:23:50

開源IDC

2013-07-16 10:03:45

移動(dòng)市場移動(dòng)觀察新機(jī)型

2015-05-20 10:02:02

程序員全棧工程師

2017-03-02 12:18:22

5G運(yùn)作基礎(chǔ)

2021-06-01 08:22:53

軟件斷點(diǎn)單片機(jī)

2010-11-04 10:19:31

Chrome OS

2010-03-19 17:30:18

云計(jì)算

2020-11-11 00:40:35

云計(jì)算混合云私有云

2017-12-18 16:55:47

2010-04-26 01:07:07

雙線負(fù)載均衡

2020-11-01 17:01:00

Python字典開發(fā)

2022-09-06 14:57:27

物聯(lián)網(wǎng)物聯(lián)網(wǎng)安全

2010-09-26 17:29:30

2021-12-02 15:20:49

Redis數(shù)據(jù)結(jié)構(gòu)

2018-03-08 10:35:07

2010-09-14 14:07:56

2009-03-11 08:46:46

Chrome瀏覽器更新
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)