網(wǎng)康網(wǎng)頁過濾庫突破2000萬
日前,網(wǎng)康科技發(fā)布消息,截至2011年2月,其上網(wǎng)行為管理產(chǎn)品的核心技術(shù)“網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫”已經(jīng)突破2000萬條URL,繼續(xù)保持了其“全球***的中文網(wǎng)頁過濾數(shù)據(jù)庫”的領(lǐng)先地位,并且在內(nèi)容覆蓋范圍、分類精準度和過濾速度等方面遠遠超出同類產(chǎn)品,倍受業(yè)界廠商和用戶的關(guān)注。
自2005年網(wǎng)康科技***次發(fā)布“網(wǎng)頁過濾數(shù)據(jù)庫”以來,通過“網(wǎng)頁預(yù)分類數(shù)據(jù)庫”技術(shù)進行網(wǎng)頁訪問過濾就成為了上網(wǎng)行為管理產(chǎn)品必不可少的重要功能之一。而在早期,這種數(shù)據(jù)庫的URL條目積累主要依靠“網(wǎng)絡(luò)爬蟲”+“智能分類”+“人工校驗”的方式進行,存在積累速度慢,更新不及時的缺憾。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)康科技不斷引入分布式計算、云分析、語義分析等新技術(shù),使得“網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫”技術(shù)飛速發(fā)展,目前每日更新URL數(shù)量已經(jīng)達到300萬條,最終在2011年年初突破了2000萬大關(guān)。
與時俱進 迎接網(wǎng)頁應(yīng)用挑戰(zhàn)
“網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫”技術(shù)的發(fā)展和應(yīng)用,大大提升了上網(wǎng)行為管理類產(chǎn)品的部署價值,從最初幫助用戶屏蔽“內(nèi)容不健康”的不良網(wǎng)站,到封堵“偷菜、炒股、游戲”等Web 2.0網(wǎng)頁應(yīng)用提高工作效率,以及過濾“論壇、博客”類網(wǎng)站保護機密信息外泄,“網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫”技術(shù)已經(jīng)發(fā)展成為上網(wǎng)行為管理產(chǎn)品的核心技術(shù)。
網(wǎng)康科技“互聯(lián)網(wǎng)應(yīng)用及內(nèi)容研究實驗室”網(wǎng)頁預(yù)分類研究小組組長張永臣介紹說:“隨著互聯(lián)網(wǎng)應(yīng)用的日趨豐富和復(fù)雜,尤其是Web 2.0之后,網(wǎng)頁已經(jīng)不僅僅是一個HTML文檔,最典型的示例就是‘開心網(wǎng)’的‘偷菜’?!倍S著這種網(wǎng)頁應(yīng)用的流行,上網(wǎng)行為管理產(chǎn)品的網(wǎng)頁過濾功能也需要與時俱進,“網(wǎng)康科技的網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫技術(shù)可以實現(xiàn)對開心網(wǎng)分項控制,例如允許登錄開心網(wǎng),但是不能進入“停車、偷菜”等子應(yīng)用,這就是網(wǎng)康科技給用戶帶來的精細化管理價值?!?/P>
啟用云分析 實現(xiàn)分鐘級實時過濾
在Web 2.0時代網(wǎng)頁內(nèi)容的變化更為頻繁,而要滿足用戶精準、有效的網(wǎng)頁訪問控制要求,就必須加快網(wǎng)頁的抓取、分析、分類過程,為了實現(xiàn)這個目標,網(wǎng)康科技適時啟用“云分析”技術(shù)。一方面,網(wǎng)康科技利用“云計算”技術(shù)在全國部署了大量云服務(wù)器,同時進行網(wǎng)頁內(nèi)容抓取、分析、分類工作,加快了對網(wǎng)頁內(nèi)容的實時跟蹤,達到“分鐘級”的分類更新,即當(dāng)網(wǎng)頁內(nèi)容發(fā)生變化后的1分鐘內(nèi),網(wǎng)康網(wǎng)頁預(yù)分類網(wǎng)頁過濾數(shù)據(jù)庫就能完成對其內(nèi)容變化的分析,并根據(jù)變化重新進行分類。
另一方面,在開啟云分析模式下,當(dāng)用戶訪問網(wǎng)頁時如果遇到未分類網(wǎng)頁或者網(wǎng)頁分類不精準的情況,可以立即向網(wǎng)康云服務(wù)器發(fā)送請求,云服務(wù)器接到請求后將實時進行智能分析和分類,并將結(jié)果反饋給用戶,之后再更新到總過濾數(shù)據(jù)庫中供其他用戶使用。
目前,網(wǎng)康科技的上網(wǎng)行為管理用戶可以在設(shè)備中設(shè)置每天更新“網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫”,以獲得***的網(wǎng)頁分類結(jié)果。
定位中文網(wǎng)頁 優(yōu)勢不容超越
網(wǎng)康科技是網(wǎng)絡(luò)應(yīng)用管理領(lǐng)域的的領(lǐng)導(dǎo)廠商,是上網(wǎng)行為管理理念的開創(chuàng)者和***品牌,多年來堅持自主研發(fā)和技術(shù)創(chuàng)新,深厚的技術(shù)積累讓網(wǎng)康更了解中國用戶的上網(wǎng)習(xí)慣,結(jié)合中國的法律、道德、文化環(huán)境,最終形成了國外同類產(chǎn)品無法逾越的、具有中國特色的“全球***的中文網(wǎng)頁過濾數(shù)據(jù)庫”。在分類準確度、中文內(nèi)容分析、網(wǎng)頁應(yīng)用識別等方面,網(wǎng)康科技的技術(shù)實力已經(jīng)達到國際***水平。
在國內(nèi),網(wǎng)康2000萬條URL的數(shù)據(jù)庫更是遠超行業(yè)平均水平。網(wǎng)頁過濾數(shù)據(jù)庫的形成是一個不斷積累的過程,并且要隨著互聯(lián)網(wǎng)發(fā)展帶來的挑戰(zhàn)而不斷進行技術(shù)創(chuàng)新,以應(yīng)對新形勢下用戶對上網(wǎng)行為管理的更高要求。網(wǎng)康科技作為“網(wǎng)頁預(yù)分類過濾數(shù)據(jù)庫”技術(shù)的***,經(jīng)過6年多不斷探索和積累,并引入了“網(wǎng)絡(luò)爬蟲系統(tǒng)”“網(wǎng)頁智能分類系統(tǒng)”“分布式計算”“語義分析”“云分析”等高精尖技術(shù),不僅提高了產(chǎn)品的核心競爭力,也使用戶能夠獲得更高的應(yīng)用價值。