Karpathy大神問懵DeepSeek！一個(gè)??竟藏53個(gè)Token，思考10分鐘沒解釋出來

作者：量子位 2025-02-14 09:24:31

人工智能新聞

Karpathy大神又帶來他的新實(shí)驗(yàn)新發(fā)現(xiàn)了，結(jié)果直接問懵DeepSeek和ChatGPT。

注意看，這個(gè)??竟然占了53個(gè)token！

（標(biāo)題??是??平替）

Karpathy大神又帶來他的新實(shí)驗(yàn)新發(fā)現(xiàn)了，結(jié)果直接問懵DeepSeek和ChatGPT。

思考過程be like：

DeepSeek硬是思考了十分鐘也還是沒有答上來，覺得要是“l(fā)ol”這個(gè)答案就太簡(jiǎn)單了。

Karpathy表示：但其實(shí)就是這么簡(jiǎn)單。

隨后他進(jìn)一步解釋了這背后的原因——提示詞注入。將一些信息注入進(jìn)字符中，表面上看沒啥區(qū)別，但里面可以表達(dá)各種隱藏信息。對(duì)于善于思考的模型，就會(huì)很容易受到這個(gè)方法的影響。

來看看具體是咋回事。

一個(gè)??竟占53個(gè)Token

這一想法，源于Paul Butler的一篇博客。

他看到有人說，通過零寬連接符（ZWJ），可以把任意的文本藏在emoji符號(hào)當(dāng)中。

結(jié)果一試發(fā)現(xiàn)真的可以，不過可以不需要ZWJ，隱藏信息的載體也不一定非得是emoji，任意Unicode字符都可以。

這背后的原理，涉及到了Unicode編碼字符方式。

對(duì)于簡(jiǎn)單的字符（比如拉丁字母），Unicode編碼點(diǎn)和字符之間有一對(duì)一的映射（例如u+0067表示字符g）。

但對(duì)于復(fù)雜一些的符號(hào)，就需要用多個(gè)序號(hào)連在一起的方式來表示了。

此外，Unicode當(dāng)中還設(shè)置了VS-1至VS-256的變體選擇符（Variation Selector），可以針對(duì)基礎(chǔ)字符做出相應(yīng)的變體，但本身卻沒有自己的“長(zhǎng)相”。

并且只作用于極少部分字符，主要是Unicode中的中日韓統(tǒng)一表意文字（CJKUI），其他大部分的Unicode字符都不會(huì)有任何變化。

但當(dāng)帶有變體選擇符的字符被復(fù)制粘貼時(shí)，選擇符也會(huì)一起進(jìn)入剪貼板。

而在Unicode當(dāng)中，這樣的變體選擇符一共有256個(gè)之多，用來編碼信息已經(jīng)是綽綽有余了。

比如下面的這個(gè)a，只有U+0061表示的是其自身，剩下后面的10多個(gè)全都是變體選擇符。

有了這一理論基礎(chǔ)，接下來的事情無(wú)非就是建立正常字符和變體選擇符之間的轉(zhuǎn)換算法。

當(dāng)然編碼的內(nèi)容越多，變體選擇符也就越長(zhǎng)，并且如果是漢字，還會(huì)產(chǎn)生更多的變體選擇符。

比如我們?cè)噲D將量子位的Slogan“追蹤人工智能新趨勢(shì)，關(guān)注科技行業(yè)新突破”藏在一個(gè)“100分”的emoji（??????????????????????????????????????????????????????????????????????????????????????????????????????????????????）當(dāng)中，產(chǎn)生的變體選擇符數(shù)量達(dá)到了58個(gè)。