自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

安全
昨天,烏云漏洞報(bào)告平臺(tái)宣布網(wǎng)易郵箱漏洞過(guò)億數(shù)據(jù)泄漏,數(shù)據(jù)達(dá)億級(jí)別。阿里巴巴可視化工程師周寧奕(主攻 webgl、海量數(shù)據(jù)可視化、地理相關(guān)可視化,曾在參數(shù)化事務(wù)所 hhd-fun 工作)寫(xiě)了一篇文章,討論了下現(xiàn)在最常被使用的各種不合理密碼,以及究竟什么密碼才比較安全。

編者按:昨天,烏云漏洞報(bào)告平臺(tái)宣布網(wǎng)易郵箱漏洞過(guò)億數(shù)據(jù)泄漏,數(shù)據(jù)達(dá)億級(jí)別。阿里巴巴可視化工程師周寧奕(主攻 webgl、海量數(shù)據(jù)可視化、地理相關(guān)可視化,曾在參數(shù)化事務(wù)所 hhd-fun 工作)寫(xiě)了一篇文章,討論了下現(xiàn)在最常被使用的各種不合理密碼,以及究竟什么密碼才比較安全。

昨天,烏云漏洞報(bào)告平臺(tái)宣布網(wǎng)易郵箱漏洞過(guò)億數(shù)據(jù)泄漏,據(jù)說(shuō)有億級(jí)別的用戶(hù)密碼流出。現(xiàn)在網(wǎng)易官方與烏云各執(zhí)一詞,真相估計(jì)還需要時(shí)間,但小編反問(wèn),你的密碼設(shè)計(jì)合理嗎?

2011 年起有一系列重大網(wǎng)站密碼泄露,csdn 社區(qū)、人人網(wǎng)、多玩網(wǎng)、微博的部分密碼數(shù)據(jù)都被掛到了網(wǎng)上(數(shù)據(jù)請(qǐng)自行 google,本文討論思路,展示結(jié)果,不泄露信息)。

我們以當(dāng)時(shí)微博的3315156 條用戶(hù)名密碼數(shù)據(jù),開(kāi)始分析之旅。

工具(可以選擇略過(guò)這段!)

而我們下載到的文件類(lèi)似于 csv (逗號(hào)分隔) 或 tsv 格式(空格分隔)數(shù)據(jù),如下:

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

數(shù)據(jù)很大,需要的查詢(xún)可能很復(fù)雜,純腳本處理很難勝任,我們需要數(shù)據(jù)庫(kù), 本文用 mongoDB。

我們可以在命令行里使用 mongoimport 命令導(dǎo)入數(shù)據(jù),也可以使用腳本(我用 node.js)導(dǎo)入,腳本更靈活。導(dǎo)完后,可以直接在命令行(如 mac 的 terminal)查詢(xún):

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

以上,括號(hào)里面的叫查詢(xún)條件,這在本文中很重要,我們可以在查詢(xún)條件里插入正則表達(dá)式(網(wǎng)上資料大大的),讓查詢(xún)變得更復(fù)雜:

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

最后,有時(shí)候我們要統(tǒng)計(jì),比如密碼以 a、b、c、d..,各有多少,這時(shí)我們需要用 mapreduce 進(jìn)行累加。

嘿嘿,工具只是手段,白貓黑貓,能抓老鼠的就是好貓。

讓我們啟程!

密碼top 100

首先跑出重復(fù)率前 100 的密碼, 以下是前 20:

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

很容易發(fā)現(xiàn)規(guī)律,俺將密碼主人分五大派系:

極懶派
手勢(shì)派
規(guī)律派
手機(jī)派
生日派
情感派

一、極懶派

這 3 萬(wàn)多同學(xué)真是懶的令人發(fā)指,也刷新了哥的常識(shí),喝喝...

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

1. 那時(shí)候微博竟然能通過(guò)一個(gè)字的密碼。

2. password 也是老外的高頻詞,我不知道是不是某些網(wǎng)站輸入框里 password 提示詞,或是很多設(shè)備默認(rèn)密碼是這個(gè)。

3. 單字重復(fù)型,如 11111,讓我們深入發(fā)掘下。

4. 最有意思的是 163.com 和 @qq.com 出現(xiàn)的頻率,而這 1000 多用戶(hù),密碼=用戶(hù)名后半部分... 醉了

極懶派之 一字重復(fù) n 次

統(tǒng)計(jì)形如 ‘aa’, ‘11111’, 'ssssssss’ 這類(lèi)若干個(gè)相同單字的密碼總數(shù):

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

我統(tǒng)計(jì)了 1、2、3、4、5、6、7、8、9、0、q、a、z、w、s、d 的頻率分布,其中用 11111 型的用戶(hù)最多,這些密碼總計(jì) 6w 多人,占 2%。 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

極懶派之 用戶(hù)名=密碼

上述統(tǒng)計(jì)不包含用戶(hù)名和密碼相同的密碼,這部分密碼共有多少呢? 以 abcd@qq.com 為例,我們統(tǒng)計(jì) abcd@qq.com / abcd / @qq.com 這 3 種模式的數(shù)量之和:

99671 個(gè)人,有點(diǎn)意外,整整占了 3% 呢!#p#

二、手勢(shì)派

密碼太長(zhǎng),能在鍵盤(pán)上排成一種形狀,記憶成本就大大壓縮,在密碼排行榜上,和圖形有關(guān)的密碼是哪些? 123456 云云者,勉強(qiáng)算吧,在數(shù)字鍵盤(pán)劃一字。同理 qwerty 開(kāi)頭的也是這個(gè)原理。 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

對(duì)此,我看到一位老外很牛逼地總結(jié)了 20 種模式: 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

這個(gè)模式很牛逼,圖上是鍵盤(pán)密碼。但 11年 已經(jīng)有很多人用手機(jī)上微博了。有不少這種手機(jī)鍵盤(pán): 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

因此很多密碼的原理就迎刃而解了: 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律#p# 

三、規(guī)律派

記住一串?dāng)?shù)字的規(guī)律,我們就可以把一串簡(jiǎn)單的數(shù)字演繹成復(fù)雜密碼,而你記住規(guī)則就好。

很勉強(qiáng),123456 就是個(gè)等差數(shù)列 fn = n 而 13579 是 fn = 2*n-1

很多人會(huì)用疊詞 如 123123,112233,或疊加后對(duì)稱(chēng) 123321 。

高分密碼有這些: 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

可以引申下,同樣是數(shù)列,用了中學(xué)知識(shí)就不一樣啦,假設(shè)我們讓 fn = n^2, 我們就可以構(gòu)造一個(gè)數(shù)列了:

1 2 3 4 5 6 -> 1 4 9 16 25 36…

我查詢(xún)了含有 1491625 的所有密碼,共找到 30 幾個(gè),真是海內(nèi)存知己(因?yàn)樵?jīng)我也是這么設(shè)計(jì)的)

同理 1 8 27 64 125 的只有 3 個(gè)人,高手啊

如果你拿 12345 開(kāi)根號(hào)、取三角函數(shù)、取對(duì)數(shù),忘記密碼,在手機(jī)計(jì)算機(jī)里算一遍(別忘了公式)。

海內(nèi)無(wú)知己,天涯只有你,你贏了!

四、手機(jī)派

使用自己和親人的生日、電話、手機(jī)做密碼,已是我對(duì)普通密碼的印象了,這部分人究竟多不多?

用手機(jī)做密碼,一開(kāi)始我設(shè)置了 11 位的數(shù)字的條件,但是有很多錯(cuò)誤的結(jié)果。好在網(wǎng)上有對(duì)手機(jī)號(hào)碼檢測(cè)的正則表達(dá)式,包含了 2013年 前所有的手機(jī)字段:

移動(dòng):139 138 137 136 135 134 147 150 151 152 157 158 159 178 182 183 184 187 188

聯(lián)通: 130 131 132 155 156 185 186 145 176

電信: 133 153 177 180 181 189

虛擬運(yùn)營(yíng)商:170

因此大哥整理了一個(gè)可以查詢(xún)手機(jī)號(hào)的正則表達(dá)式:

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律

 

親測(cè)有效哦,出來(lái)的密碼幾乎都是手機(jī)號(hào), 172418 個(gè)同學(xué)用手機(jī)號(hào)做密碼 占比 5%。#p#

五、生日 / 紀(jì)念日派

我們查詢(xún)所有包含年份的密碼,這些年份都以 19 和 20 開(kāi)頭,且有 4 位連續(xù)數(shù)字, 考慮到 5201314 (我愛(ài)你一生一世) 也是高頻密碼,且密碼數(shù)據(jù)的時(shí)間為 2011年,此時(shí) 2013 不該出現(xiàn),所以排除 2011年 以后的年份,我們得到如下結(jié)果:

 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

543559 個(gè)密碼使用了年份,占總量的 18%。 真不是小數(shù)字,但數(shù)據(jù)還是很復(fù)雜,有大量年份和字母,符號(hào)混合的,也不一定就是年份。那我們縮小范圍,如果包含生日的有多少人?

月份比較復(fù)雜,1月1日 出生的,也許寫(xiě) 11,也許寫(xiě) 0101,也有 1.1、1-1 的。但后者其實(shí)比較少,且在在一篇分析人人和 csdn 密碼的文章里看到 YYMMDD 型的生日是最多的: 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

那我們的查詢(xún)?nèi)缦拢?nbsp;

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

318022 個(gè)密碼符合條件 占總量的 10%。

這批密碼還是頗為復(fù)雜,因?yàn)楹芏嗳嗽谧帜负推渌麛?shù)字后加入生日的,僅以生日作為密碼的人會(huì)有多少? 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

答案是 137697, 4%的人用自己生日做密碼,而其中,也有些奇葩的答案,如好幾個(gè) 19190504。我去,這是 xx 團(tuán)委的公眾號(hào)么…

六、情感派

寫(xiě)一句有含義的密碼,寫(xiě)什么重復(fù)率最高? 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

現(xiàn)實(shí)里壓抑的我們難得一說(shuō)我愛(ài)你,不論國(guó)內(nèi)國(guó)外,都有很多人對(duì)著服務(wù)器許愿,說(shuō)出 wo ai xx,這些我愛(ài)你型密碼的總數(shù)讓我非常震驚。

這份密碼數(shù)據(jù)里,woaini 以 2659 次重復(fù)榮居意義型密碼榜首,iloveyou 則不到 woaini 的一半。 但事實(shí)上文字版的都弱爆了,位居第五名的 5201314(我愛(ài)你一生一世)有 15000 個(gè)人同時(shí)使用,還有各種變體…其中第 13 名最缺愛(ài) 7758521(親親我吧愛(ài)我吧)

除了我愛(ài)你,我還愛(ài)誰(shuí)? 讓我們查詢(xún)?nèi)魏魏?woai(我愛(ài))的密碼,還是基本都是在各種愛(ài)你… 偶爾有 woaiwojia woaishui woainima… 有意思的是我愛(ài)我家,這中介公司的名字取得真是合理。 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

如果我們查詢(xún)含有 ‘wo’ 字的密碼,也會(huì)發(fā)現(xiàn)我最喜歡做的事情就是愛(ài) xx… 除了愛(ài)你,我還愛(ài)誰(shuí)呢,老公、老婆、媽媽、爸爸?…

woailaopo + laopowoai 的人數(shù)有 291 人 。

laogongwoai 和 woailaogong 的人數(shù)有 98 人。

這些都是少數(shù)派密碼了。

我們?cè)囋囄覑?ài)媽媽 (201) 和我愛(ài)爸爸 (60) 的比例,竟然也是 3:1。

出于好奇,我又統(tǒng)計(jì)了密碼里包含’ laopo’ 的和包含’ laogong’ 的比例:

老公: 454

老婆: 1118

包含老公的密碼基本都是形如: ‘zuiailaogong’、 ‘qinaidelaogong’、 ‘pplaogong’,我擦看不下去了,真是一部 show 恩愛(ài)寶典…

愛(ài)老婆的數(shù)量還是完勝,可惜,這是一組良莠不齊的密碼, 還是有不少形如 laopo38、 laoposhizhu choulaopo laopocaolei sblaopo777 的密碼…(總數(shù)還是不算多)

相反,罵人的人比例很少,fuck shit cao 說(shuō)的人都不算多。而這其中,也有些有趣的點(diǎn):

魯迅在雜文《論他媽的》中說(shuō)他媽的是中國(guó)的國(guó)罵,但是時(shí)代變了,也許是受了上古十大神獸草泥馬(當(dāng)年暴走漫畫(huà)王尼瑪還沒(méi)火吧),nima 的頻率 2714 次遠(yuǎn)高于 tama 101 次。也完勝 ‘fuck’、 ‘shit’、 'wocao’ 這些 400-500 次之間的詞。

用什么字做密碼最安全

我不是黑客,不知破解算法是怎么做的,但只要鍵入一個(gè)字,就讓你的密碼與眾不同,你會(huì)怎么敲? 我們對(duì)密碼里用到的所有字進(jìn)行統(tǒng)計(jì),得出下圖: 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

1 是第一名,被 300 多萬(wàn)用戶(hù)累計(jì)輸入 300 多萬(wàn)次,1 是一個(gè)很有趣的數(shù)字,超過(guò) 60%的人密碼會(huì)用到 1,而 30%的人會(huì)以 1 作為密碼開(kāi)頭, 可以看到’.’ ‘@’ 等特殊字符,在符號(hào)里排名很靠前。曾經(jīng)看到說(shuō)用’_‘在密碼里較為安全,因?yàn)楸?rsquo;-‘少,事實(shí)上也的確如此,但你何必按 shift 打_號(hào)呢,’,'的比例比前面所有的標(biāo)點(diǎn)符號(hào)都少。

我們可以看到,數(shù)據(jù)下降非??焖?,有規(guī)律可循嗎?將柱狀圖的大小全部取對(duì)數(shù),那么四大陣營(yíng)的階梯形一覽無(wú)余: 1-9 排在了所有的字母之前,幾乎所有的字母排在了大寫(xiě)字母之前: 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

最后,糾正一個(gè)數(shù)據(jù)錯(cuò)誤,我們看到 ‘E’ 和 ‘+’ 的比例非常異常,他們理應(yīng)沒(méi)有那么多,為什么? 

你的密碼真的安全?看看當(dāng)年三百萬(wàn)樣本中的弱密碼規(guī)律 

好,看到這里,你應(yīng)該覺(jué)得很熟悉, 5201314,123456, 都是熟悉的密碼,而 E+13 這種也很熟悉。excel 里輸入一個(gè)長(zhǎng)度超過(guò) 11 位的純數(shù)字,excel 會(huì)自動(dòng)將數(shù)字轉(zhuǎn)化為這個(gè)樣子的。這份數(shù)據(jù)應(yīng)該是被誰(shuí)用 excel 打開(kāi)后又保存了,所以,大寫(xiě)字母最多的應(yīng)該是 ‘A’,而 '+'的用量也排不到符號(hào)類(lèi)的第二名。

你的密碼安全嗎

回到 2011年,我在微博上找一個(gè)郵箱,然后破解你的密碼,哥成功的概率有多大?

前 100 名的密碼,第一名的密碼 123456 共 165882 條,占 5%。前 10 名的密碼有 316085 條,占 10%,而前 100 條密碼共 442555 條,占 15%

累計(jì) 15%的人能被這 100 個(gè)密碼破解。

用戶(hù)名和密碼匹配(包含之前提到的前綴相同,后綴相同和 后綴 +@ 相同)共 99671 人。

累計(jì)計(jì) 18%的用戶(hù)都會(huì)在 103 次窮舉后被破解。

近 100年 的生日有 365*100 個(gè),如果我遍歷那么多次,總有一個(gè)是對(duì)的,這樣我可以破解 4%的密碼。

累計(jì) 22%的人已經(jīng)被破解。

倘若我知道你的手機(jī)號(hào)碼,5%的人的密碼會(huì)被破解,累計(jì) 27%

如果我知道你的名字 (這份數(shù)據(jù)無(wú)法分析你的名字和密碼的關(guān)系) 這個(gè)比例會(huì)更高。

2011年,1/3 的人密碼是不安全的。

你覺(jué)得你的密碼設(shè)計(jì)的科學(xué)嗎?

參考:

[ZIPF 分布、PARETO 分布和冪律分布]

[CSDN 及人人網(wǎng)的用戶(hù)密碼分析]

[最新手機(jī)號(hào)碼驗(yàn)證正則表達(dá)式]

責(zé)任編輯:藍(lán)雨淚 來(lái)源: 36氪
相關(guān)推薦

2015-10-26 13:05:22

2015-05-25 10:24:19

2019-06-14 15:10:54

密碼管理存儲(chǔ)密碼攻擊

2020-12-28 09:42:25

弱密碼密碼加密

2012-08-14 10:34:01

2014-06-03 17:14:31

2022-01-09 16:41:09

All in One 漏洞安全漏洞

2021-10-29 11:46:07

NIST密碼建議網(wǎng)絡(luò)安全

2011-11-23 13:05:01

2012-04-16 13:43:49

2020-04-14 11:48:59

密碼網(wǎng)絡(luò)攻擊網(wǎng)絡(luò)安全

2011-12-29 09:32:32

2021-07-09 13:55:27

密碼管理器密碼數(shù)據(jù)安全

2015-09-15 13:33:16

2013-07-17 17:15:57

2012-11-30 13:43:30

2009-06-15 11:22:06

2021-01-06 10:52:02

MySQL數(shù)據(jù)庫(kù)安全

2012-12-04 16:09:17

2024-01-29 06:35:00

ChatGPT模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)