自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="y6kvm"><tt id="y6kvm"></tt></ruby>

<pre id="y6kvm"><fieldset id="y6kvm"><optgroup id="y6kvm"></optgroup></fieldset></pre>

^{<blockquote id="y6kvm"></blockquote>}

<s id="y6kvm"></s>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

AI 架構(gòu) Transformer 再進(jìn)化：谷歌新方法突破長文本處理，注意力模塊內(nèi)存需求可降至 1/47

作者：故淵 2024-10-09 16:07:02

谷歌公司推出了選擇性注意力（Selective Attention）方法，可以提高 Transformer 架構(gòu)模型的性能。

10 月 9 日消息，科技媒體 marktechpost 昨日（10 月 8 日）發(fā)布博文，報道稱谷歌公司推出了選擇性注意力（Selective Attention）方法，可以提高 Transformer 架構(gòu)模型的性能。

Transformer 架構(gòu)簡介

Transformer 是一種革命性的神經(jīng)網(wǎng)絡(luò)架構(gòu)，由谷歌在 2017 年提出，主要用于處理序列數(shù)據(jù)，特別是在自然語言處理（NLP）領(lǐng)域。

Transformer 的核心是自注意力機(jī)制，允許模型在處理輸入序列時捕捉詞與詞之間的關(guān)系，讓模型能夠關(guān)注輸入序列中的所有部分，而不僅僅是局部信息。

Transformer 由多個編碼器和解碼器組成。編碼器負(fù)責(zé)理解輸入數(shù)據(jù)，而解碼器則生成輸出。多頭自注意力機(jī)制使模型能夠并行處理信息，提高了效率和準(zhǔn)確性。

Transformer 架構(gòu)模型挑戰(zhàn)

Transformer 架構(gòu)的一大挑戰(zhàn)是它們在處理長文本序列時效率低下，由于每個標(biāo)記與序列中的每個其他標(biāo)記都相互作用導(dǎo)致二次復(fù)雜度，這就導(dǎo)致隨著上下文長度的增加，計算和內(nèi)存需求呈指數(shù)增長。

現(xiàn)在解決這一問題的方法包括稀疏注意力機(jī)制（sparse attention mechanisms），它限制了標(biāo)記之間的交互數(shù)量，以及通過總結(jié)過去信息來減少序列長度的上下文壓縮技術(shù)。

不過這種方法是通過減少在注意力機(jī)制中考慮的標(biāo)記數(shù)量達(dá)成的，因此通常以性能為代價，可能會導(dǎo)致上下文關(guān)鍵信息丟失。

谷歌新方法

谷歌研究的研究人員提出了一種名為選擇性注意的新方法，可以動態(tài)忽略不再相關(guān)的標(biāo)記，從而提高 Transformer 模型的效率。

選擇性注意力使用軟掩碼矩陣來確定每個標(biāo)記對未來標(biāo)記的重要性，減少對不重要標(biāo)記的關(guān)注。

研究表明，配備選擇性注意的 Transformer 架構(gòu)模型在多個自然語言處理任務(wù)中表現(xiàn)出色，同時顯著降低了內(nèi)存使用和計算成本。

例如，在擁有 1 億參數(shù)的 Transformer 模型中，注意力模塊的內(nèi)存需求在上下文大小為 512、1024 和 2048 個 tokens 時分別減少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基準(zhǔn)測試中也優(yōu)于傳統(tǒng) Transformer，對于較大的模型規(guī)模實(shí)現(xiàn)了高達(dá) 5% 的準(zhǔn)確率提升。

選擇性注意力允許構(gòu)建更小、更高效的模型，在不損害準(zhǔn)確性的情況下，顯著減少內(nèi)存需求。

IT之家附上參考地址

Selective Attention Improves Transformer
This AI Paper from Google Introduces Selective Attention: A Novel AI Approach to Improving the Efficiency of Transformer Models

責(zé)任編輯：龐桂玉來源： IT之家

AI 架構(gòu)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<u id="jz8yx"></u>

<pre id="jz8yx"><samp id="jz8yx"></samp></pre>

<pre id="jz8yx"><td id="jz8yx"></td></pre>

<style id="jz8yx"></style>

<sub id="jz8yx"></sub>