ChatGPT4o被越獄了,有人拿來(lái)搞大尺度!
你好啊,我是軒轅。
大家知道,為了防止AI被用于不法用途,各家的AI大模型都設(shè)置了一些安全防護(hù)措施。
當(dāng)你嘗試讓AI去做一些可能涉及到違法的事情時(shí),它會(huì)直接拒絕。
圖片
然鵝,信息技術(shù)的發(fā)展總伴隨著安全攻防對(duì)抗的產(chǎn)生,AI也不例外。
這不,現(xiàn)在就有這么一波“黑客”,他們利用OpenAI的“漏洞”,讓最新版的ChatGPT4o越獄了,突破了這層安全防護(hù),可以執(zhí)行之前不被允許執(zhí)行的指令。
圖片
他們是怎么讓GPT越獄的呢?
其實(shí)很簡(jiǎn)單,他們用的方法,咱們中文互聯(lián)網(wǎng)早就用爛了!
圖片
舉個(gè)例子,在很多平臺(tái)上,為了防止引流,會(huì)監(jiān)控一些關(guān)鍵詞,比如很多人喜歡留微信號(hào),讓別人來(lái)加微信,然后進(jìn)行營(yíng)銷活動(dòng)。
或者為了防止競(jìng)爭(zhēng),一些平臺(tái)禁止出現(xiàn)淘寶等關(guān)鍵詞。
于是,聰明的網(wǎng)友開(kāi)始用各種詞匯來(lái)替代它們,比如微信變成薇信、威信、VX,淘寶變成了桃寶、桃寳,甚至emoji ??寶。
各種火星文層出不窮,反正機(jī)智的網(wǎng)友總能想出一些字符來(lái)躲避審查。
現(xiàn)在,老外們也學(xué)會(huì)了這一招,比如他們要讓GPT寫一個(gè)病毒程序,你直接讓它寫,肯定是會(huì)拒絕的。
但是,把prompt提示詞先處理一下,用一些冷僻單詞表達(dá)同一個(gè)意思:
圖片
這之后再讓GPT來(lái)執(zhí)行,躲避關(guān)鍵詞審查。
除此之外,還可以借鑒上面中文躲避審查的思路,把一些字符進(jìn)行替換,比如e替換成3,字母l替換成數(shù)字1,t替換成7,這樣一來(lái),單詞leet就變成了1337。
圖片
接下來(lái)再把這段“火星文”內(nèi)容讓GPT來(lái)執(zhí)行:
圖片
你看,又繞過(guò)了!
沒(méi)想到中文互聯(lián)網(wǎng)的火星文居然再一次煥發(fā)了生機(jī)。
上面只是讓GPT寫一寫網(wǎng)絡(luò)攻擊的代碼程序,有人就在想,既然這都能行,讓它做點(diǎn)···
圖片
尺度原因,就不放出來(lái)了。
好消息是,截止到現(xiàn)在,這些個(gè)繞過(guò)限制的方式已經(jīng)被OpenAI給堵住了。
不過(guò),就像網(wǎng)絡(luò)安全對(duì)抗一樣,這故事遠(yuǎn)沒(méi)有結(jié)束,或許這只是一個(gè)小小的序曲,人類與人工智能之間的斗智斗勇,可能才剛剛開(kāi)始。