敏感信息檢測系統(tǒng)--UnisSISS 操作探秘
【51CTO.com 綜合消息】UnisSISS互聯(lián)網(wǎng)敏感信息檢索系統(tǒng)使用了事件驅(qū)動的檢測技術(shù),提供了網(wǎng)頁低俗內(nèi)容、敏感信息檢測功能,采用廣度優(yōu)先、目錄還原、準(zhǔn)確匹配等技術(shù),協(xié)助監(jiān)管部門進(jìn)行檢查,幫助網(wǎng)站所有者及時發(fā)現(xiàn)風(fēng)險,改進(jìn)網(wǎng)站服務(wù)質(zhì)量。
對Web信息的合規(guī)性進(jìn)行人工檢查和審計是一項復(fù)雜且耗時的工作,不僅需要極大的耐心還需要一定的技術(shù)經(jīng)驗。對于一般的Web管理人員來說,基于內(nèi)容的合規(guī)性管理將占用大量工作時間。自動化的檢測工具能夠大幅簡化對于不良信息的檢測工作,有助于Web管理人員將精力轉(zhuǎn)向如何處理上。
UnisSISS 專為當(dāng)前復(fù)雜的Web環(huán)境而設(shè)計,作為自動化的Web敏感信息檢測工具,適用于網(wǎng)站所有者進(jìn)行自查、IDC進(jìn)行檢查、監(jiān)管部門進(jìn)行檢查等。
一、安裝部署
1.安裝需求
![]() |
表1 |
2.安裝過程
◆獲得產(chǎn)品
從產(chǎn)品提供商獲得產(chǎn)品及使用手冊。
◆安裝
運(yùn)行安裝程序,直到安裝完成。
◆提供必要的注冊信息
在“關(guān)于”->“用戶注冊”對話框中獲取系統(tǒng)信息,并提供自己的名稱和網(wǎng)站域名授權(quán)信息。
◆獲得許可證
從產(chǎn)品提供商處獲得許可證。
◆注冊
在“關(guān)于”->“用戶注冊”輸入“用戶信息”和“注冊信息”。
◆升級插件
在“關(guān)于”,點(diǎn)擊“升級”,更新不良信息庫、規(guī)則庫到最新版本。
3.卸載
可以在“添加/刪除程序”中卸載程序,也可以在開始菜單中通過快捷方式進(jìn)行卸載。 #p#
二、使用說明
注意事項:根據(jù)中華人民共和國相關(guān)法律規(guī)定,本產(chǎn)品只適用于已獲得掃描授權(quán)的網(wǎng)站。任何違反法律規(guī)定的行為由使用者自行承擔(dān),與UnisSISS及開發(fā)者無關(guān),特此聲明。
1.向?qū)?/STRONG>
為了方便用戶直接使用本產(chǎn)品的功能,UnisSISS提供了使用向?qū)В恍枘顚懟蜻x擇一些必要的信息,就可以快速開始(按照系統(tǒng)默認(rèn)配置,適用于大多數(shù)的應(yīng)用環(huán)境)進(jìn)行掃描。
2.網(wǎng)站掃描
低俗信息檢測系統(tǒng)部署配置:
確保該系統(tǒng)可以訪問所有需要監(jiān)控的WEB服務(wù)器
在系統(tǒng)配置界面選擇工具欄按鈕“新建任務(wù)”,系統(tǒng)彈出如下向?qū)υ捒?nbsp;
![]() |
圖1 |
按照向?qū)нM(jìn)行下一步操作,填寫任務(wù)的基本信息(如下圖),最簡單的方式直接輸入需要檢測的URL在起始URL輸入框中,即可。
![]() |
圖2 |
也可以通過任務(wù)基本信息獲取工具來獲取任務(wù)的相關(guān)信息(一般當(dāng)網(wǎng)站需要認(rèn)證時使用該工具),該工具是一個內(nèi)置的網(wǎng)站瀏覽器,可以隨時保存會話信息。
![]() |
圖3 |
接下來繼續(xù)下一步,輸入檢測的域名范圍,一般為需要監(jiān)控網(wǎng)站的域名。如果需要全站檢測,則選擇爬蟲級別為0,否則可以選擇只檢測幾層的網(wǎng)頁;
![]() |
圖4 |
下一步是要設(shè)定檢查策略,當(dāng)要檢測頁面正確性的時候,一定要輸入確認(rèn)頁面正確的關(guān)鍵字,以;隔開
![]() |
圖5 |
接下來選擇,任務(wù)執(zhí)行的時間周期及具體時間
![]() |
圖6 |
最后輸入該任務(wù)的名稱
![]() |
圖7 |
如此循環(huán)將所有要監(jiān)控的網(wǎng)站都創(chuàng)建相應(yīng)的監(jiān)控任務(wù)。
點(diǎn)擊工具欄按鈕“開始”,開始監(jiān)控所有網(wǎng)站。
3.設(shè)置
通常情況下,軟件已經(jīng)默認(rèn)定制了通用的掃描方式和屬性,適應(yīng)大部分網(wǎng)站掃描。如果遇到一些特殊情況,可以通過設(shè)置來定制掃描方式和屬性。
3.1 HTTP選項設(shè)置
![]() |
圖8 配置選項 |
◆UserAgent:掃描網(wǎng)站時在HTTP頭設(shè)置UserAgent的字符串,如果某些網(wǎng)站限制特定UserAgent的訪問,則需要修改默認(rèn)值。
◆頁面大小:當(dāng)遇到過大的網(wǎng)頁或者其他文件時,網(wǎng)頁爬蟲就不需要獲取,如,爬蟲爬到某一比較大的avi文件時,就不需要獲取其詳細(xì)內(nèi)容。
◆網(wǎng)絡(luò)超時:您可以靈活設(shè)置。
3.2爬蟲設(shè)置
![]() |
圖9爬蟲設(shè)置 |
◆文件后綴過濾:爬蟲遇到一些二進(jìn)制文件,由于其中不可能會包含下一級的鏈接地址,因此不需要獲取其具體內(nèi)容。
◆表單內(nèi)容填寫:當(dāng)爬蟲爬到一些需要用戶輸入的表單內(nèi)容時,爬蟲需要自動填寫的內(nèi)容,軟件默認(rèn)值為:1