深度解析理解 Transformer 中的3大位置嵌入:從絕對(duì)位置嵌入到旋轉(zhuǎn)位置嵌入
精華
Transformer的關(guān)鍵組件之一是位置嵌入。你可能會(huì)問(wèn):為什么呢?因?yàn)門(mén)ransformer中的自注意力機(jī)制是排列不變的;這意味著它計(jì)算輸入中每個(gè)標(biāo)記從序列中其他標(biāo)記接收的注意力程度,但它沒(méi)有考慮標(biāo)記的順序。實(shí)際上,注意力機(jī)制將序列視為一個(gè)標(biāo)記集合。因此,我們需要另一個(gè)稱(chēng)為位置嵌入的組件,它可以考慮標(biāo)記的順序,并對(duì)標(biāo)記嵌入產(chǎn)生影響。但是,位置嵌入有哪些不同類(lèi)型,它們又是如何實(shí)現(xiàn)的呢?在本文中,我們將研究三種主要...