十篇經(jīng)典的深度學(xué)習(xí)論文!你知道幾篇?
1.ImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural Networks (利用深度卷積神經(jīng)網(wǎng)絡(luò)進行 ImageNet 分類)是 Alex Krizhevsky, Ilya Sutskever 和 Geoffrey E. Hinton 在 2012 年發(fā)表的一篇具有里程碑意義的論文。這篇論文描述了一種深度卷積神經(jīng)網(wǎng)絡(luò)(CNN),在 ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中取得了顯著的成功。
圖片
2.Deep Residual Learning for Image Recognition
Deep Residual Learning for Image Recognition(深度殘差學(xué)習(xí)在圖像識別中的應(yīng)用)是 Kaiming He, Xiangyu Zhang, Shaoqing Ren 和 Jian Sun 在 2015 年發(fā)表的一篇重要論文。
這篇論文介紹了一種新的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),殘差網(wǎng)絡(luò)(ResNet),在 ImageNet 大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中取得了突破性的成功。
圖片
3.A Few Useful Things to Know about Machine Learning
A Few Useful Things to Know about Machine Learning 是 Pedro Domingos 于 2012 年發(fā)表的一篇重要論文,旨在為機器學(xué)習(xí)實踐者和研究人員提供一些實用的見解和建議,涵蓋了從模型選擇、特征工程、正則化到數(shù)據(jù)質(zhì)量和并行計算等多個方面。這些實用的建議有助于更好地理解和應(yīng)用機器學(xué)習(xí)技術(shù),提高模型的性能和可靠性。
圖片
https://sites.astro.caltech.edu/~george/ay122/cacm12.pdf
4.Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 是 Sergey Ioffe 和 Christian Szegedy 在 2015 年提出的一篇重要論文。
它提出了一種簡單而有效的方法,通過在每一層的輸入上進行歸一化操作,顯著加速了深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,增強了訓(xùn)練的穩(wěn)定性,并提高了模型的最終性能。
批量歸一化已成為深度學(xué)習(xí)中標準的技巧,被廣泛應(yīng)用于各種網(wǎng)絡(luò)架構(gòu)和任務(wù)中。
圖片
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/43442.pdf
5.Sequence to Sequence Learning with Neural Networks
Sequence to Sequence Learning with Neural Networks 是 Ilya Sutskever、Oriol Vinyals 和 Quoc V. Le 在 2014 年提出的一篇具有里程碑意義的論文。
論文提出了一種革命性的架構(gòu)(Seq2Seq),顯著推動了序列到序列任務(wù)的發(fā)展。Seq2Seq 模型通過編碼器-解碼器結(jié)構(gòu),將輸入序列映射到輸出序列,在機器翻譯等任務(wù)中取得了顯著的成功。這一模型的提出不僅開創(chuàng)了新的研究方向,還激發(fā)了后續(xù)大量的改進和創(chuàng)新,如注意力機制和 Transformer 模型。Seq2Seq 已成為自然語言處理和其他序列到序列任務(wù)中的基礎(chǔ)方法。
圖片
6.Generative Adversarial Nets
Generative Adversarial Nets (GANs) 是由 Ian Goodfellow 等人在 2014 年提出的。
GANs 的核心思想是通過兩個神經(jīng)網(wǎng)絡(luò),生成器(Generator)和判別器(Discriminator)相互競爭,從而生成逼真的數(shù)據(jù)。
圖片
7.High-Speed Tracking with Kernelized Correlation Filters
High-Speed Tracking with Kernelized Correlation Filters 是由 Jo?o F. Henriques, Rui Caseiro, Pedro Martins, 和 Jorge Batista 在 2015 年發(fā)表的。
這篇論文提出了一種高效的目標跟蹤方法,稱為 Kernelized Correlation Filters (KCF),在保持高效計算的同時,提供了優(yōu)越的跟蹤性能。
圖片
https://arxiv.org/pdf/1404.7584
8.YOLO9000: Better, Faster, Stronger
YOLO9000: Better, Faster, Stronger 是由 Joseph Redmon 和 Ali Farhadi 于 2016 年提出的一篇重要論文。
這篇論文介紹了一種新的實時目標檢測系統(tǒng) YOLO9000,它不僅能夠在現(xiàn)有的目標檢測任務(wù)上表現(xiàn)出色,還可以檢測超過 9000 種對象類別。
它提出了一種改進的目標檢測模型,通過聯(lián)合訓(xùn)練和層級分類器等創(chuàng)新方法,顯著提升了目標檢測的速度和準確性,并擴展了可檢測對象的種類。YOLO9000 在多個對象檢測基準測試中表現(xiàn)優(yōu)異,是目標檢測領(lǐng)域的一項重要進展。
圖片
此版本的 YOLO 系統(tǒng)實現(xiàn)了卓越的性能指標,可檢測超過 9000 個項目類別,并擊敗了 SSD 和 Faster R-CNN with ResNet 等競爭方法。在 VOC 2007 數(shù)據(jù)集上,YOLOv2 以每秒 67 幀的速度獲得 76.8 mAP,在 COCO 上以每秒 40 幀的速度獲得 78.6 mAP,取得了令人鼓舞的結(jié)果。
https://arxiv.org/abs/1612.08242
9.Fast R-CNN
Fast R-CNN 是由 Ross Girshick 在 2015 年提出的一篇重要論文。
該論文介紹了一種高效的目標檢測方法,稱為 Fast R-CNN,它通過共享卷積特征、RoI 池化和多任務(wù)損失函數(shù),顯著提升了目標檢測的速度和精度。Fast R-CNN 在多個基準測試中表現(xiàn)出色,是目標檢測領(lǐng)域的一項重要進展。它為后續(xù)的檢測算法(如 Faster R-CNN 和 Mask R-CNN)奠定了基礎(chǔ),對計算機視覺的發(fā)展產(chǎn)生了深遠影響。
圖片
https://arxiv.org/abs/1504.08083
10.Large-scale Video Classification with Convolutional Neural Networks
Large-scale Video Classification with Convolutional Neural Networks 是由 André Karpathy 等人在 2014 年提出的一篇論文。
這篇論文提出了一種基于 CNN 的大規(guī)模視頻分類方法,通過多種時間維度處理策略,實現(xiàn)了高效的視頻分類。
論文通過大規(guī)模實驗驗證了方法的有效性,對視頻理解和計算機視覺領(lǐng)域產(chǎn)生了重要影響。
圖片