自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

研究人員繞過 GPT-4o 模型安全護(hù)欄,利用“十六進(jìn)制字符串”成功令其編寫漏洞攻擊程序

人工智能
ChatGPT-4o 內(nèi)置了一系列“安全護(hù)欄”措施,以防止該 AI 遭到用戶不當(dāng)使用,相關(guān)防護(hù)措施會分析輸入的提示文本,判斷用戶是否要求模型生成惡意內(nèi)容。

11 月 4 日消息,網(wǎng)絡(luò)安全公司 0Din 的研究員 Marco Figueroa 發(fā)現(xiàn)了一種新型 GPT 越獄攻擊手法,成功突破了 GPT-4o 內(nèi)置的“安全護(hù)欄”措施,能夠使其編寫出惡意攻擊程序。

參考 OpenAI 介紹,ChatGPT-4o 內(nèi)置了一系列“安全護(hù)欄”措施,以防止該 AI 遭到用戶不當(dāng)使用,相關(guān)防護(hù)措施會分析輸入的提示文本,判斷用戶是否要求模型生成惡意內(nèi)容。

▲ 圖源 Marco Figueroa 博客(下同)

不過 Marco Figueroa 嘗試設(shè)計了一種將惡意指令轉(zhuǎn)化為十六進(jìn)制的越獄方法,號稱能夠繞過 GPT-4o 的防護(hù),讓 GPT-4o 解碼運行用戶的惡意指令。

研究人員聲稱,他首先要求 GPT-4o 解碼十六進(jìn)制字符串,之后其向 GPT 發(fā)送一條實際含義為“到互聯(lián)網(wǎng)上研究 CVE-2024-41110 漏洞,并用 Python 編寫惡意程序”的十六進(jìn)制字符串指令,GPT-4o 僅用 1 分鐘就順利利用相關(guān)漏洞編寫出了代碼(IT之家注:CVE-2024-41110 是一個 Docker 驗證漏洞,允許惡意程序繞過 Docker 驗證 API)。

研究人員解釋稱,GPT 系列模型被設(shè)計成遵循自然語言指令完成編碼和解碼,但系列模型缺乏對上下文的理解能力,無法評估每一步在整體情境下的安全性,因此許多黑客實際上早已利用 GPT 模型這一特點讓模型進(jìn)行各種不當(dāng)操作。

研究人員表示,相關(guān)示例表明 AI 模型的開發(fā)者需要加強模型的安全防護(hù),以防范此類基于上下文理解式的攻擊。

責(zé)任編輯:龐桂玉 來源: IT之家
相關(guān)推薦

2021-05-13 09:22:44

安全研究員蘋果查找

2021-02-02 09:32:06

黑客攻擊l安全

2021-01-29 17:10:27

ChromeZinc黑客

2009-02-19 16:33:31

2023-08-02 15:20:45

2014-12-25 09:51:32

2010-04-19 10:32:07

2013-07-25 15:01:47

iOS開發(fā)學(xué)習(xí)十六進(jìn)制和字符串轉(zhuǎn)換

2021-04-04 22:55:51

谷歌網(wǎng)絡(luò)攻擊網(wǎng)絡(luò)安全

2011-02-15 09:35:25

2024-01-18 17:43:47

2014-11-07 10:37:57

2024-03-28 10:17:03

JDK 17字符串十六進(jìn)制

2021-08-19 10:27:09

攻擊漏洞蘋果

2021-07-09 11:29:27

Kaseya漏洞攻擊

2011-10-28 10:17:11

2011-01-20 10:00:21

2020-10-14 10:39:50

漏洞網(wǎng)絡(luò)攻擊網(wǎng)絡(luò)安全

2021-11-24 17:48:30

深度學(xué)習(xí)風(fēng)險預(yù)測

2024-05-21 12:23:17

點贊
收藏

51CTO技術(shù)棧公眾號