AI文本識別重大突破,谷歌水印工具大規(guī)模應(yīng)用
隨著AI生成內(nèi)容在教育、軟件開發(fā)和社交媒體網(wǎng)絡(luò)新聞領(lǐng)域的泛濫,準(zhǔn)確識別和溯源AI文本對于內(nèi)容安全和版權(quán)保護(hù)的重要性與日俱增。但是,準(zhǔn)確識別AI生成內(nèi)容始終是生成式人工智能領(lǐng)域久攻不下的難題之一。
近日,谷歌DeepMind研究團(tuán)隊開發(fā)出一款名為SynthID-TextAI的文本水印技術(shù),可用于標(biāo)記人工智能系統(tǒng)(AI)生成的文本。這一水印系統(tǒng)首次在大規(guī)模的實際應(yīng)用中投入使用,覆蓋數(shù)百萬用戶,引起了廣泛關(guān)注。
這款水印工具可“無痕”嵌入在文本生成過程中,并通過一組加密密鑰檢測AI生成內(nèi)容,在AI文本識別領(lǐng)域?qū)崿F(xiàn)了重要的技術(shù)突破。
AI內(nèi)容識別的重大意義
區(qū)分AI生成文本的能力已成為應(yīng)對假新聞、學(xué)術(shù)作弊等問題的重要工具,同時有助于避免AI模型“自我污染”——即通過AI生成內(nèi)容訓(xùn)練AI模型,導(dǎo)致內(nèi)容失真。
在一次史無前例的大規(guī)模測試中,谷歌的Gemini大型語言模型(LLM)生成的2000萬條回復(fù)中,含水印文本的質(zhì)量評級與無水印文本相當(dāng)。這一成就令業(yè)界感到興奮,馬里蘭大學(xué)的計算機(jī)科學(xué)家Furong Huang指出:“谷歌采取這一步對于科技社區(qū)來說是令人振奮的,相信未來大多數(shù)商業(yè)工具都會采用類似的水印?!?/p>
文本水印比圖像水印難得多
在文本生成過程中加入水印比圖像水印更具挑戰(zhàn)性。DeepMind團(tuán)隊采用的SynthID-Text水印技術(shù),通過在詞匯選擇上加入隱秘但有規(guī)律的調(diào)整,利用加密密鑰將每個可能的詞匯標(biāo)記為候選選項。這些選項會在一系列“錦標(biāo)賽”中進(jìn)行對比,最終“獲勝”的詞匯將用于文本生成。這種“錦標(biāo)賽”過程如同解鎖一個密碼鎖,每一輪比賽代表鎖中的一位數(shù)字,顯著增加了水印被篡改或刪除的難度。
劍橋大學(xué)計算機(jī)科學(xué)家Zakhar Shumaylov評價稱,SynthID-Text在檢測效率和生成速度方面領(lǐng)先于同類水印技術(shù)。相較其他方法,該水印既不減慢文本生成速度,也便于通過加密密鑰檢測,使其成為目前效果較佳的文本水印方案之一。
SynthID-Text系統(tǒng)的競標(biāo)賽采樣方法不僅提升了水印的抗干擾性,也提高了水印的“不可擦除”性。研究人員測試發(fā)現(xiàn),即便通過另一AI模型對帶水印文本進(jìn)行改寫,該系統(tǒng)依然能夠識別出隱藏水印。這種抗干擾性對于內(nèi)容較長的文本尤其顯著,而在較短文本中則表現(xiàn)稍弱。這種設(shè)計讓刪除水印的難度大大增加,也使得偽裝成AI生成文本的“假水印”操作更為困難。
DeepMind的科學(xué)家Pushmeet Kohli認(rèn)為,這款水印工具的初衷是鼓勵良性使用?!拔覀兿M_發(fā)出一個可以由社區(qū)不斷優(yōu)化的工具,協(xié)助AI模型在實際應(yīng)用中更加合規(guī)。”他表示。
如何讓水印不再脆弱?
在AI內(nèi)容安全性領(lǐng)域,水印的韌性及其在抵御“惡意攻擊”方面的表現(xiàn)受到關(guān)注。
盡管水印技術(shù)有助于規(guī)范AI生成內(nèi)容的使用,但如何應(yīng)對蓄意去除水印的行為仍是一大難題。蘇黎世聯(lián)邦理工學(xué)院的研究指出,任何水印都可能面臨“洗白”風(fēng)險,即通過技術(shù)手段去除或偽造水印。此外,政府正著力將水印作為規(guī)范AI內(nèi)容的核心手段,但如何協(xié)調(diào)開發(fā)者自愿加入,以及在全球范圍內(nèi)標(biāo)準(zhǔn)化實施,依然存在政策層面的挑戰(zhàn)。
帝國理工學(xué)院的計算機(jī)科學(xué)家Yves-Alexandre de Montjoye表示:“在AI安全框架下,水印技術(shù)的實際保護(hù)力度尚待驗證?!?/p>