自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI聽鍵盤聲就能偷你密碼,準確率高達95%

人工智能 新聞
最近,來自杜倫大學(xué)等三所高校的研究人員訓(xùn)練了個AI模型,讓聲學(xué)攻擊變得無比簡單,通過分析鍵盤聲音,就能重構(gòu)用戶輸入的密碼和敏感信息。這要是被惡意泄露給第三方……

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

無了個大語!以后AI靠聽鍵盤聲就能偷你密碼,準確率高達95%!

你沒聽錯,現(xiàn)在鍵盤敲字也不安全了,簡直防不勝防。

最近,來自杜倫大學(xué)等三所高校的研究人員訓(xùn)練了個AI模型,讓聲學(xué)攻擊變得無比簡單,通過分析鍵盤聲音,就能重構(gòu)用戶輸入的密碼和敏感信息。這要是被惡意泄露給第三方……

網(wǎng)友們聽到后直呼可瑞賊,有人表示:

這就是為啥我輸密碼的時候會聽重金屬音樂,并且將音量調(diào)到最大。

危險!危險!危險!

事情還要從英國幾所大學(xué)研究人員發(fā)的這篇題為“A Practical Deep Learning-Based Acoustic Side Channel Attack on Keyboards”的論文說起。

在這項研究中,研究人員用深度學(xué)習(xí)的方法提出了一個完全自動化的鍵盤聲學(xué)側(cè)信道攻擊流程,包括按鍵分割、通過mel頻譜圖進行特征提取、使用CoAtNet模型進行分類幾個大的部分。

具體來說,第一步按鍵分割,就是記錄目標鍵盤上的按鍵

在這項工作中,研究人員用到了手機(iPhone13 mini)和視頻會議軟件Zoom(模擬遠程攻擊場景)來收集聲音,通過按壓MacBookPro上的36個按鍵(0-9,a-z)來制造聲音。

△手機距離目標17cm

每個按鍵被連續(xù)按下25次后,一個記錄按壓聲音的文件就產(chǎn)生了。

接下來就是對錄音進行快速傅里葉變換,然后在頻率上對系數(shù)進行求和以獲得“能量”(energy)。之后定義一個能量閾值,當能量超過這個閾值時,標記這里是一個按鍵音。

通過這個方法,可以從長音頻中分割出獨立的按鍵音段。

圖片

△按鍵分割過程,信號通過FFT轉(zhuǎn)換為能量,當超過閾值時標記按鍵。

和手機錄音不同,由于Zoom會使用降噪技術(shù)來壓縮音量范圍,所以不同按鍵的音量差異很小。這里研究人員提出了一種逐步調(diào)整閾值的方法來解決這個問題。

簡而言之,就是先設(shè)置一個初始閾值,使用當前閾值分割音頻,得到按鍵數(shù)量。如果分割得到的按鍵數(shù)量小于目標數(shù)量,則降低閾值;如果分割得到的按鍵數(shù)量大于目標數(shù)量,則增加閾值。通過逐步微調(diào)閾值,直到分割結(jié)果等于目標按鍵數(shù)量。

這里為了更精細調(diào)整,每次調(diào)整幅度會變小,直到準確分割出所有按鍵。

然后,就可以制作出波形圖和頻譜圖,進行特征提取,可視化每個按鍵的可識別差異。

△左圖為手機錄音的波形圖和相應(yīng)的mel頻譜圖,右圖為Zoom錄音。

下面重頭戲來了,這些頻譜圖圖像會被用來訓(xùn)練一個圖像分類器——CoAtNet。

研究人員將mel頻譜圖作為聲音的視覺表示,以圖像的形式輸入到CoAtNet中。CoAtNet包含卷積層和自注意力層,可以高效學(xué)習(xí)特征并建模特征之間的全局關(guān)系。

并在CoAtNet的基礎(chǔ)上添加了平均池化層和全連接層,以得到最終的按鍵分類結(jié)果。

此外,研究人員還使用了交叉熵損失函數(shù)和Adam優(yōu)化器訓(xùn)練模型,訓(xùn)練過程中,每5個epoch測試一次驗證集精度。通過調(diào)節(jié)學(xué)習(xí)率、epoch數(shù)量等超參數(shù),解決了模型精度突降的問題。

圖片

最終,模型在手機錄制的數(shù)據(jù)集上,分類準確率達到95%;在Zoom錄制的數(shù)據(jù)集上,分類準確率達到93%。

圖片

△手機錄制的MacBook按鍵分類器的混淆矩陣

手機和Zoom兩種錄音方式的結(jié)果僅差2%,也側(cè)面說明了錄音方式的改變不會對準確率產(chǎn)生顯著影響。

此外,值得一提的是,研究人員還發(fā)現(xiàn)大多數(shù)誤分類都是相鄰按鍵,錯誤具有一定規(guī)律性。

AI讓古老的東西「重生」

網(wǎng)友看到這項研究后,一部分人表示驚恐,還有一部分人表示這項研究十幾年前就有了:

顯然,古老的(非常非常古老的)東西再次變得新鮮起來了。

就比如說2005年華人一作的這項工作中,就已對鍵盤聲學(xué)進行了探索。

那么,這里有什么差別?

研究人員表示,之前的方法大多針對的是臺式機鍵盤,已經(jīng)過時了,而這項研究中用的是MacBook鍵盤,很多型號通用,潛在危險更大。

還有現(xiàn)在的麥克風(fēng)也不是當年的了,之前是外置話筒,而這項研究中用的是手機和Zoom錄制按鍵聲。

最主要的是方法不太一樣,以前一種較為常見的方法是用隱馬爾可夫模型(HMM),現(xiàn)在用的是CoAtNet模型。

HMM是在文本語料庫上訓(xùn)練的模型,用于預(yù)測序列位置中最可能的單詞或字符。例如,如果分類器輸出“Hwllo”,則可以使用HMM來推斷“w”實際上是錯誤分類的“e”。

相信對于廣大網(wǎng)友來說,這些都不是重點,重要的是怎么防范啊!

怎么防鍵盤竊聽?

應(yīng)對AI竊密也不是木得法子。研究人員就說了,可以通過改變打字風(fēng)格,從標準十指摳鍵盤變?yōu)樽杂纱蜃?,降低識別準確率。還有一些方法:

  • 使用隨機復(fù)雜密碼,包含不同大小寫字母,增加攻擊難度。
  • 在語音通話軟件中添加隨機假打字音頻干擾信號,檢測到按鍵聲時添加干擾。
  • 使用雙重認證,比如指紋等生物特征,避免通過鍵盤輸入密碼。

除此之外,此前有研究也提出過一些,但今時今日效果可能較差,比如使用觸屏鍵盤、檢查房間內(nèi)是否有隱藏麥克風(fēng)、關(guān)閉麥克風(fēng)、不在視頻通話時輸入關(guān)鍵信息等。

網(wǎng)友也給出了一些奇招,比如說:

把敲密碼改成復(fù)制/粘貼?

家人們還有啥法子不?

論文鏈接:https://arxiv.org/abs/2308.01074

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-08-08 13:54:15

2022-12-26 12:36:32

腹瀉AI識別準確率

2023-08-07 11:41:44

2020-10-09 08:31:00

AI

2018-06-08 15:51:56

CNN皮膚癌人工智能

2023-05-04 09:39:16

AI模型

2023-06-21 09:15:30

AI 技術(shù)神經(jīng)網(wǎng)絡(luò)

2017-09-26 14:07:16

2022-01-10 23:57:36

人工智能語音識別技術(shù)

2019-08-05 08:02:31

AI 數(shù)據(jù)人工智能

2024-11-11 10:00:00

ChatGPT模型

2018-06-12 07:15:18

阿里巴巴技術(shù)語音識別

2019-01-03 09:04:04

谷歌系統(tǒng)機器

2025-02-17 10:37:27

2018-06-19 10:30:55

2017-10-31 17:05:25

人工智能醫(yī)療領(lǐng)域診斷癌癥

2018-11-14 10:01:30

谷歌開源機器學(xué)習(xí)

2020-04-17 10:35:28

微軟AI系統(tǒng)安全漏洞

2023-10-23 15:02:43

AI 中醫(yī)人工智能
點贊
收藏

51CTO技術(shù)棧公眾號