譯者 | 涂承燁
審校 | 重樓
在當(dāng)今的數(shù)字時代,深度造假技術(shù)和語音網(wǎng)絡(luò)釣魚策略的激增,給數(shù)字通信的真實性和安全性帶來了重大挑戰(zhàn)。深度造假者操縱音頻和視頻,創(chuàng)造出令人信服的假冒內(nèi)容,而深度造假者則利用語音模擬來欺騙個人,以泄露敏感信息。準確識別和減輕這些威脅對于保護個人和組織免受錯誤信息、欺詐和身份盜竊的潛在后果至關(guān)重要。
1.理解深度造假和釣魚
深度造假是使用深度學(xué)習(xí)技術(shù)創(chuàng)建的,特別是生成式對抗網(wǎng)絡(luò)(GANs),以生成或修改視頻和音頻錄音,使它們看起來真實。這項技術(shù)可以高精度地交換人臉、模仿聲音和改變表情。
另一方面,釣魚公司使用語音工程來模擬可信的實體,欺騙受害者泄露機密數(shù)據(jù)。隨著文本到語音技術(shù)的進步,創(chuàng)造出聽起來與真人難以區(qū)分的合成聲音變得更容易,放大了基于語音的詐騙的風(fēng)險。
這些技術(shù)構(gòu)成重大風(fēng)險,包括破壞公眾信任、影響政治環(huán)境,以及實施個人和公司欺詐。因此,開發(fā)一種強大的方法來檢測和抵消深度造假和網(wǎng)絡(luò)釣魚行為是至關(guān)重要的。
2.識別深度造假和釣魚的技術(shù)
深度造假的檢測方法通常側(cè)重于識別視覺和聽覺上的不一致性。這些可能包括不自然的眨眼模式,口型錯誤,或說話節(jié)奏的不規(guī)則。對于網(wǎng)絡(luò)釣魚,指標可以包括意外的呼叫來源、呼叫者背景噪聲的差異以及語音模式或音調(diào)的異常。
3.深度學(xué)習(xí)方法
利用人工智能,特別是機器學(xué)習(xí)模型,為自動檢測深度造假和網(wǎng)絡(luò)釣魚提供了一個很有前景的途徑。通過在真實內(nèi)容和被操縱內(nèi)容的數(shù)據(jù)集上訓(xùn)練模型,這些系統(tǒng)可以學(xué)習(xí)區(qū)分真實材料和欺詐材料。
4.用于檢測的代碼樣本
為了提供一個實際操作的例子,我們將概述用于檢測深度假視頻和釣魚音頻剪輯的簡單代碼示例。
5.深偽視頻檢測
我們將使用TensorFlow來構(gòu)建一個卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,將視頻分類為真的或假的。
import tensorflow as tf
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.models import Sequential
model = Sequential([
Conv2D(32, (3, 3), activation='relu', input_shape=(150, 150, 3)),
MaxPooling2D((2, 2)),
Conv2D(64, (3, 3), activation='relu'),
MaxPooling2D((2, 2)),
Conv2D(128, (3, 3), activation='relu'),
MaxPooling2D((2, 2)),
Flatten(),
Dense(512, activation='relu'),
Dense(1, activation='sigmoid')
])
model.compile(optimizer='adam',
loss='binary_crossentropy',
metrics=['accuracy'])
# Assume `train_generator` is a pre-defined generator that feeds data into the model
model.fit(train_generator, epochs=20, steps_per_epoch=100)
6.釣魚音頻檢測
對于釣魚檢測,我們將使用Librosa庫分析音頻特征,以提取Mel-Frequency Cepstral系數(shù)(MFCCs),這是語音和音頻分析的常見特征。
import librosa
import numpy as np
from tensorflow.keras import layers, models
from sklearn.model_selection import train_test_split
# Load and preprocess audio
audio, sr = librosa.load('path/to/audio.wav', sr=None)
mfccs = librosa.feature.mfcc(y=audio, sr=sr)
# Data preparation
X = np.array([mfccs.T])
y = np.array([0, 1]) # Labels: 0 for genuine, 1 for fake
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)
# Model building
model = models.Sequential([
layers.Flatten(input_shape=(X_train.shape[1], X_train.shape[2])),
layers.Dense(256, activation='relu'),
layers.Dropout(0.5),
layers.Dense(1, activation='sigmoid')
])
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
# Train the model
model.fit(X_train, y_train, epochs=50, batch_size=32, validation_data=(X_test, y_test))
結(jié)論
深度造假和網(wǎng)絡(luò)釣魚的出現(xiàn)給數(shù)字信息領(lǐng)域帶來了新的挑戰(zhàn),威脅到信息的完整性和隱私。雖然這里提供的技術(shù)和代碼示例提供了檢測此類威脅的基礎(chǔ)方法,但必須進行持續(xù)的研究和開發(fā)。人工智能和機器學(xué)習(xí)方面的創(chuàng)新對于增強檢測能力至關(guān)重要,以確保我們能夠有效地抵消數(shù)字欺詐和錯誤信息的不斷演變的復(fù)雜性。
理解和解決這些挑戰(zhàn)需要技術(shù)人員、決策者和公眾的共同努力,制定道德準則和可靠的檢測工具。隨著技術(shù)的發(fā)展,提高安全意識和推進技術(shù)解決方案將是保護數(shù)字通信環(huán)境的關(guān)鍵。
譯者介紹
涂承燁,51CTO社區(qū)編輯,省政府采購專家、省綜合性評標專家、公 E 采招標采購專家,獲得信息系統(tǒng)項目管理師、信息系統(tǒng)監(jiān)理師、PMP,CSPM-2等認證,擁有15年以上的開發(fā)、項目管理、咨詢設(shè)計等經(jīng)驗。對項目管理、前后端開發(fā)、微服務(wù)、架構(gòu)設(shè)計、物聯(lián)網(wǎng)、大數(shù)據(jù)、咨詢設(shè)計等較為關(guān)注。
原文標題:AI Against AI: Harnessing Artificial Intelligence To Detect Deepfakes and Vishing,作者:venkataramaiah gude