自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<var id="7jri1"><button id="7jri1"><span id="7jri1"></span></button></var>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

作者：魚羊十三 2020-02-25 07:00:54

新聞人工智能算法

在機(jī)器學(xué)習(xí)中，排序也經(jīng)常用于統(tǒng)計(jì)數(shù)據(jù)、信息檢索等領(lǐng)域。那么問(wèn)題來(lái)了，排序算法在函數(shù)角度上是分段線性的，也就是說(shuō)，在幾個(gè)分段的“節(jié)點(diǎn)”處是不可微的。

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處。

快排堆排冒泡排。排序，在計(jì)算機(jī)中是再常見不過(guò)的算法。

在機(jī)器學(xué)習(xí)中，排序也經(jīng)常用于統(tǒng)計(jì)數(shù)據(jù)、信息檢索等領(lǐng)域。

那么問(wèn)題來(lái)了，排序算法在函數(shù)角度上是分段線性的，也就是說(shuō)，在幾個(gè)分段的“節(jié)點(diǎn)”處是不可微的。這樣，就給反向傳播造成了困難。

現(xiàn)在，谷歌大腦針對(duì)這一問(wèn)題，提出了一種快速可微分排序算法，并且，時(shí)間復(fù)雜度達(dá)到了O(nlogn)，空間復(fù)雜度達(dá)為O(n)。

速度比現(xiàn)有方法快出一個(gè)數(shù)量級(jí)！

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

代碼的PyTorch、TensorFlow和JAX版本即將開源。

快速可微分排序算法

現(xiàn)代深度學(xué)習(xí)架構(gòu)通常是通過(guò)組合參數(shù)化功能塊來(lái)構(gòu)建，并使用梯度反向傳播進(jìn)行端到端的訓(xùn)練。

這也就激發(fā)了像LeCun提出的可微分編程 (differentiable programming)的概念。

雖然在經(jīng)驗(yàn)上取得了較大的成功，但是許多操作仍舊存在不可微分的問(wèn)題，這就限制了可以計(jì)算梯度的體系結(jié)構(gòu)集。

諸如此類的操作就包括排序 (sorting)和排名 (ranking)。

從函數(shù)角度來(lái)看都是分段線性函數(shù)，排序的問(wèn)題在于，它的向量包含許多不可微分的“節(jié)點(diǎn)”，而排名的秩要比排序還要麻煩。

首先將排序和排名操作轉(zhuǎn)換為在排列多面體(permutahedron)上的線性過(guò)程，如下圖所示。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

△排列多面體說(shuō)明

在這一過(guò)程后，可以發(fā)現(xiàn)對(duì)于r(θ)，若是θ出現(xiàn)微小“擾動(dòng)”，就會(huì)導(dǎo)致線性程序跳轉(zhuǎn)到另外一個(gè)排序，使得r(θ)不連續(xù)。

也就意味著導(dǎo)數(shù)要么為null，要么就是“未定義”，這就阻礙了梯度反向傳播。

為了解決上述的問(wèn)題，就需要對(duì)排序和排名運(yùn)算符，進(jìn)行有效可計(jì)算的近似設(shè)計(jì)。

谷歌大腦團(tuán)隊(duì)提出的方法，就是通過(guò)在線性規(guī)劃公式中引入強(qiáng)凸正則化來(lái)實(shí)現(xiàn)這一目標(biāo)。

這就讓它們轉(zhuǎn)換成高效可計(jì)算的投影算子(projection operator)，可微分，且服從于形式分析(formal analysis)。

在投影到排列多面體之后，可以根據(jù)這些投影來(lái)定義軟排序(soft sorting)和軟排名(soft ranking)操作符。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

△軟排序和軟排名操作符

在此基礎(chǔ)上，要想完成快速計(jì)算和微分，一個(gè)關(guān)鍵步驟就是將投影簡(jiǎn)化為保序優(yōu)化 (isotonic optimization)。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

接下來(lái)是將保序優(yōu)化進(jìn)行微分，此處采用的是雅可比矩陣(Jacobian)，因?yàn)樗?jiǎn)單的塊級(jí)結(jié)構(gòu)，使得導(dǎo)數(shù)很容易分析。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

而后，結(jié)合命題3和引理2，可以描述投影到排列多面體上的雅可比矩陣。

需要強(qiáng)調(diào)的是，與保序優(yōu)化的雅可比矩陣不同，投影的雅可比矩陣不是塊對(duì)角的，因?yàn)槲覀冃枰獙?duì)它的行和列進(jìn)行轉(zhuǎn)置。

最終，可以用O(n)時(shí)間和空間中的軟算子雅可比矩陣相乘。

實(shí)驗(yàn)結(jié)果

研究人員在CIFAR-10和CIFAR-100數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。

實(shí)驗(yàn)使用的CNN，包含4個(gè)具有2個(gè)最大池化層的Conv2D，RelU激活，2個(gè)完全連接層；ADAM優(yōu)化器的步長(zhǎng)恒定為10-4，k=1。

與之比較的是O(Tn2)的OT方法，以及O(n2)的All-pairs方法。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

△rQ及rE為新算法

結(jié)果表明，在CIFAR-10和CIFAR-100上，新算法都達(dá)到了與OT方法相當(dāng)?shù)木?，并且速度明顯更快。

在CIFAR-100上訓(xùn)練600個(gè)epoch，OT耗費(fèi)的時(shí)間為29小時(shí)，rQ為21小時(shí)，rE為23小時(shí)，All-pairs為16小時(shí)。在CIFAR-10上結(jié)果差不多。

在驗(yàn)證輸入尺寸對(duì)運(yùn)行時(shí)間的影響時(shí)，研究人員使用的是64GB RAM的6核Intel Xeon W-2135，以及GeForce GTX 1080Ti。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

禁用反向傳播的情況下，進(jìn)行1個(gè)batch的計(jì)算，OT和All-pairs分別在n=2000和n=3000的時(shí)候出現(xiàn)內(nèi)存不足。

啟用反向傳播時(shí)，OT和All-pairs分別在n=1000和n=2500的時(shí)候出現(xiàn)內(nèi)存不足。

開啟新的可能性

曾就職于谷歌、NASA的機(jī)器學(xué)習(xí)工程師Brad Neuberg認(rèn)為，從機(jī)器學(xué)習(xí)的角度來(lái)說(shuō)，快速可微分排序、排名算法看上去十分重要。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

而谷歌的這一新排序算法，也在reddit和hacker news等平臺(tái)上引起了熱烈的討論。

有網(wǎng)友對(duì)其帶來(lái)的“新可能性”做出了更為詳細(xì)的討論：

我想，可微分排序生成的梯度信息量更大，使得梯度下降的速度更快，從而能夠進(jìn)一步提升訓(xùn)練速度。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

我認(rèn)為，這意味著某些基于排名的指標(biāo)，以后可以用可微分的形式來(lái)表示。也就是說(shuō)，神經(jīng)網(wǎng)絡(luò)可以輕松地針對(duì)這些結(jié)果直接進(jìn)行優(yōu)化。

對(duì)于谷歌而言，這很顯然會(huì)應(yīng)用于網(wǎng)絡(luò)搜索，以及諸如標(biāo)簽分配之類的東西問(wèn)題。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

也有網(wǎng)友指出，雖然該算法并不是第一個(gè)解決了排序不可微問(wèn)題的方法，但它的效率無(wú)疑更高。

谷歌大腦重磅研究：快速可微分排序算法，速度快出一個(gè)數(shù)量級(jí)

傳送門

論文：https://arxiv.org/pdf/2002.08871.pdf

討論：https://news.ycombinator.com/item?id=22393790https://www.reddit.com/r/MachineLearning/comments/f85yp4/r_fast_differentiable_sorting_and_ranking/

責(zé)任編輯：張燕妮來(lái)源：量子位

谷歌 Android 技術(shù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)