自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

這份GitHub 2.3k星的ML論文清單拿好,工作用得上

新聞 機(jī)器學(xué)習(xí)
亞馬遜工程師Eugene Yan等人打造了一個論文合集,在這個GitHub項目中,持續(xù)共享Google、亞馬遜、Facebook等等大公司在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面的論文和博客文章。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

工欲善其事,必先利其器。

在工作中動手實(shí)施自己的ML項目之前,了解領(lǐng)域里的前沿進(jìn)展,吸收前人的經(jīng)驗(yàn),是很有必要的。

不過,現(xiàn)在arXiv上每天都有成百篇新論文冒頭,哪些值得看?

為此,亞馬遜工程師Eugene Yan等人打造了一個論文合集,在這個GitHub項目中,持續(xù)共享Google、亞馬遜、Facebook等等大公司在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方面的論文和博客文章。

這份GitHub 2.3k星的ML論文清單拿好,工作用得上

這些論文/文章涵蓋24種不同分類,從搜索排名到NLP、CV,都能在這里找到:

數(shù)據(jù)質(zhì)量

數(shù)據(jù)工程

數(shù)據(jù)挖掘

分類

回歸

推薦算法

搜索排名

嵌入

自然語言處理

序列建模

預(yù)測

計算機(jī)視覺

強(qiáng)化學(xué)習(xí)

異常檢測

圖形

優(yōu)化

信息提取

弱監(jiān)督

生成

效率

驗(yàn)證和A/B測試

倫理道德

實(shí)踐

失敗

目前標(biāo)星2.3k。

以推薦算法為例。

對于不同的行業(yè),業(yè)務(wù)差別很大。即使算法基礎(chǔ)框架大同小異,想要訓(xùn)練出精準(zhǔn)的推薦模型,細(xì)節(jié)上還是有許多不同之處。

而這份清單,收集了電商、視頻、音樂、課程種種不同業(yè)務(wù)的推薦算法技術(shù)博客/論文。

這份GitHub 2.3k星的ML論文清單拿好,工作用得上

比如阿里的《Behavior Sequence Transformer for E-commerce Recommendation in Alibaba》。

論文介紹了行為序列Transformer在阿里電子商務(wù)推薦系統(tǒng)中的應(yīng)用。

研究人員提出,利用Transformer模型來捕捉用戶行為序列背后的順序信號,以增強(qiáng)個性化推薦的有效性,提升點(diǎn)擊量。經(jīng)過實(shí)驗(yàn)驗(yàn)證后,他們將該模型部署在了淘寶線上,證明與基線相比,該方法能顯著提高在線點(diǎn)擊率。

論文鏈接:
https://arxiv.org/abs/1905.06874

在視頻個性化推薦方面,YouTube、網(wǎng)飛、TikTok的技術(shù)方案都有收錄。

這份GitHub 2.3k星的ML論文清單拿好,工作用得上

比如YouTube這篇引用次數(shù)達(dá)到1039次的《Deep Neural Networks for YouTube Recommendations》。

論文重點(diǎn)介紹了深度學(xué)習(xí)給YouTube推薦系統(tǒng)帶來的巨大性能提升。首先,研究人員詳細(xì)介紹了深度候選征程模型和深度排名模型。而后,研究人員還在論文中分享了從設(shè)計、迭代到維護(hù)一個擁有海量用戶的大規(guī)模推薦系統(tǒng)這個過程中,獲得的實(shí)踐經(jīng)驗(yàn)和啟示。

論文地址:
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

另外,比較有趣的是,這份論文/文章列表還收錄了一些失敗的經(jīng)驗(yàn)。

比如Google Photos在給照片打標(biāo)簽時,曾經(jīng)嚴(yán)重翻車:把黑人標(biāo)記成了“大猩猩”。

最近大火的GPT-3,則沒有解決前代GPT-2的“偏見”問題,在生成的文字中,總是將穆斯林和暴力、死亡聯(lián)系在一起。

關(guān)于作者

這一項目的主要維護(hù)者,是亞馬遜應(yīng)用科學(xué)家Eugene Yan。

他本科畢業(yè)于新加坡管理大學(xué),專業(yè)是心理學(xué)和人力資源管理,后于佐治亞理工學(xué)院獲計算機(jī)科學(xué)碩士學(xué)位。

現(xiàn)在的主要工作是利用消費(fèi)者數(shù)據(jù),構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)以提升用戶體驗(yàn)。

傳送門

項目地址:
https://github.com/eugeneyan/applied-ml

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2021-04-04 23:44:06

5G運(yùn)營商網(wǎng)絡(luò)

2009-05-09 09:04:19

無線網(wǎng)絡(luò)3G布局

2014-12-10 12:36:00

微軟Office 365云計算

2016-09-27 16:15:17

IOS 10蘋果

2017-11-14 11:28:49

程序員索引數(shù)據(jù)

2020-07-13 15:56:21

人工智能機(jī)器學(xué)習(xí)技術(shù)

2020-03-04 17:03:10

數(shù)據(jù)分析思維說明

2025-01-08 08:53:05

2020-12-10 10:24:25

AI 數(shù)據(jù)人工智能

2023-08-14 07:58:50

GitHubMetaGPT人工智能

2019-01-04 13:25:40

代碼開發(fā)算法

2020-03-13 10:18:43

GitHub 技術(shù)開源

2021-04-09 16:25:00

GitHub代碼開發(fā)者

2023-07-04 12:57:57

多模態(tài)語言模型

2022-01-26 13:00:07

Vue.js UI組件Web

2021-11-11 15:13:15

人工智能容器技術(shù)

2024-12-02 09:00:00

2022-07-19 06:24:02

微服務(wù)高可用

2017-03-31 13:24:09

2021-10-21 05:57:33

網(wǎng)盤開源云盤系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號