十字符病毒,殺不死的小強:一次云服務(wù)器淪陷實錄
一、現(xiàn)象
接到客戶的電話,說自己的云服務(wù)器被提供商禁止訪問了,原因是監(jiān)測到網(wǎng)絡(luò)流量暴滿,服務(wù)器不停的向外發(fā)包,在確認(rèn)客戶沒有業(yè)務(wù)量突增的情況下,初步判斷可能服務(wù)器遭受了流量攻&擊(DDOS),不過按照常理來說,客戶的業(yè)務(wù)系統(tǒng)就是一個小的web系統(tǒng),平時流量不大,影響力也一般,不至于遭受DDOs,帶著這些疑問,要到了客戶服務(wù)器的登錄方式,廢話少說,還是進入系統(tǒng),一查究竟吧。
二、排查問題
下圖是登錄系統(tǒng)后,執(zhí)行top命令的輸出結(jié)果,綜合查看,系統(tǒng)整體負(fù)載并不高,但是帶寬占用很高,由于云服務(wù)器帶寬基本耗盡,ssh登錄服務(wù)器也非常慢,幾乎不能執(zhí)行任何操作。
此外,還發(fā)現(xiàn)第一個進程占用很大cpu資源,就是名為apgffcztwi的進程,這個進程名剛好10個字符,這是什么進程,名字相當(dāng)古怪,肯定有問題,從文件名看出,這不像一個正常的系統(tǒng)進程。
既然有古怪,那就看看這個進程是哪個程序啟動的,操作方式見下圖:
簡單吧,通過剛才那個進程的pid,然后去proc下面查看pid目錄下面對應(yīng)的exe文件,就能找到進程對應(yīng)的啟動程序,linux就是這么敞亮,一下子找到了這個程序位于/usr/bin目錄下。
既然找到了這個程序,那就詳細(xì)查看下這個程序的屬性信息吧,如下圖:
看到了嗎,第一個文件,文件的讀、寫和執(zhí)行屬性均沒有,相當(dāng)古怪。好吧,先記錄下來這個文件的位置和路徑。
下面繼續(xù)查看系統(tǒng)進程信息,看看有無其它異常,通過ps命令又發(fā)現(xiàn)了新的線索,如下圖:
在/usr/bin目錄下有隱藏的.sshd文件,這個文件是正常系統(tǒng)所沒有的,又一個可疑線路,仍然記錄下來。
繼續(xù)查看系統(tǒng)進程,可疑進程還遠(yuǎn)遠(yuǎn)不止這些,這不,又發(fā)現(xiàn)了一個可疑進程,如下圖:
/usr/bin/dpkgd/ps -ef這個進程很明顯是個變種的病毒,因為我們指定ps命令肯定不會存在/usr/bin/dpkgd目錄下,既然說到/usr/bin/dpkgd目錄,那么就到這個目錄下去看個究竟,繼續(xù)上圖:
又發(fā)現(xiàn)一些隱藏的病毒文件了,比如lsof ps netstat ss,這些都是變種病毒文件,主要用來替換系統(tǒng)中的一些命令,當(dāng)看到netstat這個命令時,基本明白了這個病毒的意圖了,它無非就是發(fā)流量包,造成網(wǎng)絡(luò)癱瘓,病毒替換了系統(tǒng)原有的包,換成自身經(jīng)過改寫的命令包,這樣,既隱藏了自己的行為,又不會對服務(wù)器造成太大影響,但是它的真正目的就是用咱們的機器做肉雞啊。真是用心良苦。
記錄這個線索,然后繼續(xù)通過dmesg命令查看系統(tǒng)信息,看看有沒有異常,上圖:
果然有異常信息,nf_conntrack是iptables里面的連接跟蹤模塊,它通過哈希表記錄已建立的連接,包括其他機器到本機、本機到其他機器、本機到本機的連接,出現(xiàn)dropping packet,就是由于服務(wù)器訪問量大,內(nèi)核netfilter模塊conntrack相關(guān)參數(shù)配置不合理,導(dǎo)致新連接被drop掉。查看nf_conntrack_max,看看設(shè)置多大:
- [root@server~]# cat /proc/sys/net/netfilter/nf_conntrack_max
- 2097152
nf_conntrack_max設(shè)置200多萬,已經(jīng)設(shè)置很大了,看來不是這個參數(shù)設(shè)置導(dǎo)致的。估計應(yīng)該是上面的一些異常進程導(dǎo)致的。
三、開始干活
通過上面發(fā)現(xiàn)的幾個線索,為了能快速解決問題,先嘗試關(guān)閉或刪除進程和文件,然后看看網(wǎng)絡(luò)是否能夠恢復(fù)正常,一不做二不休,開整吧!
第一步,先刪除/usr/bin/.sshd文件,然后關(guān)閉此文件對應(yīng)的進程,看下面的圖:
這樣先刪除進程對應(yīng)的文件,然后kill掉.sshd進程,那么,進程就無法重新啟動了。
第二步,刪除/usr/bin/dpkgd目錄下所有的變種病毒文件,同時刪除/usr/bin/apgffcztwi文件,寫個腳本,批量刪除如下:
執(zhí)行刪除后,發(fā)現(xiàn)ps命令不好使了,可惡啊,不過,這點問題,難不倒俺,重新安裝一個ps命令即可,或者從別的機器拷貝一個ps命令過來,這里來個干脆的,重新安裝一個,安裝過程看下圖:
大家能看到這個操作吧,先看看ps命令屬于按個rpm包,然后yum在線安裝一個新的包即可。
這個procps包安裝完成后,ps命令又可以使用了,現(xiàn)在通過ps命令查看到的系統(tǒng)信息,才是真實的系統(tǒng)啊,剛才那個ps命令是加殼的,屏蔽了很多系統(tǒng)中黑暗的勾當(dāng)。
還在興奮中,接著執(zhí)行了一個lsof命令,又發(fā)現(xiàn)新情況了:
剛剛刪除了/usr/bin/apgffcztwi文件,但是又自動生成了新的文件,/usr/bin/fhmlrqtqvz,并且還有一個文件/usr/bin/fgqnvqzzck已經(jīng)被刪除了,但是進程仍然存在,那個deleted就是文件的狀態(tài)。并且新生成的文件,仍然是10個字符。
看來是低估這個病毒程序了,繼續(xù)往下深究!
考慮到會自動產(chǎn)生病毒文件,感覺應(yīng)該是linux下的crontab完成的工作,那么是不是病毒在crontab里面做了手腳,去看看就知道了。
切換到系統(tǒng)的/var/log/cron目錄下(此目錄記錄了linux下所有用戶的計劃任務(wù)信息,以crontab -u -e方式寫入的計劃任務(wù)都會在此目錄下生成文件),沒看到任何文件,看來不是用戶級別的crontab在作怪,那么再看看系統(tǒng)級別的crontab,就是/etc/crontab文件,貼圖如下:
看最后一行,發(fā)現(xiàn)了一個定時任務(wù),此任務(wù)每三分鐘執(zhí)行一次,任務(wù)對應(yīng)的是個kill.sh腳本,找到腳本就好辦了,看看這個腳本的內(nèi)容:
腳本很簡單,但是卻是個重大發(fā)現(xiàn),此腳本會自動重啟網(wǎng)卡,然后執(zhí)行一個cp操作,將/lib/libkill.so文件復(fù)制一個/lib/libkill.so.6文件,然后執(zhí)行這個文件。這個文件是個二進制的文件,無法查看內(nèi)容,猜想應(yīng)該就是自動生成那個十個字符文件的病原體。
這里看到的病原體名稱是libkill.so,它的名稱不是固定的,常見的還有類似libudev.so、/lib/udev/udev等類似名稱,但是作用應(yīng)該都是一樣的。
到這里為止,思路基本清楚了,大概理了一下思路,這個×××執(zhí)行的原理應(yīng)該是這樣的:libkill.so是所有進程的病原體,通過kill.sh腳本每隔3分鐘自動檢測一次,如果發(fā)現(xiàn)病毒程序不存在了,就從病原體復(fù)制一份兒到/lib/libkill.so.6,病毒副本/lib/libkill.so.6執(zhí)行后,就會生成一個隨機命名(10個字符)的程序,放到/usr/bin/、/boot,/etc/init.d等目錄下。 同時還修改了自啟動配置chkconfig –add xxx,修改自啟動項/etc/rc.local等,讓×××程序開機自動運行。
這就是為什么無法殺掉病毒進程的原因。
至此,病毒運行的原理已經(jīng)清晰了,下面的工作就是清除病毒程序。
四、清除病毒
清除病毒也是需要技巧的,如果直接刪除kill.sh文件,你會發(fā)現(xiàn),這個文件又自動生成了,這就是病毒程序在起作用。
那么怎么徹底清除呢,可通過下面方式實現(xiàn):
通過top或者lsof命令可以獲取那個自動啟動的×××進程的pid為17161,然后執(zhí)行如下操作:
- kill -STOP 17161
注意,這里-STOP選項的含義,不是關(guān)閉這個進程,而是停止這個進程。進程停止執(zhí)行后,進程仍然存在,這樣就繞過了病毒進程就監(jiān)測。緊接著,再來點硬貨:
- chattr +i /etc/crontab
這樣,先鎖定crontab文件,不讓任何進程寫入數(shù)據(jù)。
下面就可以安靜的刪除之前的那些病毒文件了。
先刪除這個kill.sh文件,讓他不再定期執(zhí)行:
- [root@server ~]# ll /etc/cron.hourly/kill.sh
接著刪除/usr/bin下和/etc/init.d下的所有可疑文件:
比如上圖中,第1、2、4、5、6都是可疑文件,隨便看一個文件:
可以看到,這個文件又指向了/root/xd文件,而這個xd文件肯定也是病毒文件,需要刪除。
最后,刪除病原體文件:
- [root@server ~]# rm -rf /lib/libkill.so.6
- [root@server ~]# rm -rf /lib/libkill.so
最最后,別忘了,還要清理現(xiàn)場,關(guān)閉一直處于停止?fàn)顟B(tài)的那個pid為17161的病毒進程:
- [root@server ~]# kill -9 17161
現(xiàn)在就可以直接執(zhí)行kill -9的操作了,因為病原體已經(jīng)被刪除,定時任務(wù)文件也被鎖定,定時執(zhí)行的腳本也被刪除,所以這個病毒再無回天之力了。
最后,再看下清除病毒后的系統(tǒng)狀態(tài):
整個世界清靜了。
但是,但是,好像我又發(fā)現(xiàn)了什么,是的,我發(fā)現(xiàn)了一個redis進程在運行。瞬間,明白了這個事件發(fā)生的原因了:估計是Redis未授權(quán)訪問漏洞導(dǎo)致的。
經(jīng)過驗證,確實如此,服務(wù)器上的redis沒有密碼驗證機制,可直接登錄,不過這不算什么,最悲催的是redis的6379端口默認(rèn)對全網(wǎng)開放。。。。。
這里科普下什么是十字叉病毒,它是一個或者多個十位隨機字母組成的木&馬病毒進程,主要目的消耗服務(wù)各項資源。屬于一種掛馬,此病毒會自我保護和自我恢復(fù)。主要特征是會往外發(fā)送大量數(shù)據(jù)包。