Hadoop分布式文件系統(tǒng)安全隱患不得不防
本節(jié)向大家介紹一下Hadoop分布式文件系統(tǒng)既是HDFS的安全隱患問題,主要包括Hadoop概念和配置介紹,HDFS環(huán)境和安全隱患等內(nèi)容,歡迎大家一起來學(xué)習(xí),希望通過本節(jié)的介紹大家對HDFS安全隱患有一定的認識,以便在以后學(xué)習(xí)和使用Hadoop過程中減少不必要的麻煩。
Hadoop分布式文件系統(tǒng)(HDFS)的安全隱患
一.基礎(chǔ)問題
hadoop是什么?如何配置等基礎(chǔ)概念以下不做討論.
一個分布式系統(tǒng)基礎(chǔ)架構(gòu),由Apache基金會開發(fā)。用戶可以在不了解分布式底層細節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力高速運算和存儲。
簡單地說來,Hadoop是一個可以更容易開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺。
Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡稱HDFS。HDFS有著高容錯性(fault-tolerent)的特點,并且設(shè)計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(highthroughput)來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streamingaccess)文件系統(tǒng)中的數(shù)據(jù)。
二.Hadoop分布式文件系統(tǒng)環(huán)境
軟件環(huán)境:hadoop-0.19.1
HDFS系統(tǒng):公網(wǎng)linux2.4若干臺
Namenode:nn1臺
Datenode:dn若干臺
客戶端:OSX10.6
三.如何對Hadoop文件進行攻擊要點(安全隱患)
1)
獲得HadoopNameNodeURI,例如nn:9001
配置到客戶端hadoop-site.xml中即可.
2)
客戶端通過FSshell進行文件操作,
次步驟可簡單理解為客戶端通過本地Hadoop中配置hadoop-site.xmlnamenodeuri進行遠程訪問,獲取HDFS文件列表,
3)
*如遇到驗證失敗,在本地創(chuàng)建用戶名xxx用戶,xxx本地用戶名和提示驗證用戶名稱一直即可.
*解釋:HDFS啟動時會以啟動用戶(root或hadoop)為HDFSRoot用戶,所以客戶端進行訪問時本地新建此用戶名和HDFSRoot用戶名稱一致即可,HDFS并不進行驗證密碼.
*此時,就獲得的HDFS系統(tǒng)的HDFSRoot權(quán)限,可以為所欲為了.:)
4)
HadoopAPI與FSShell以上述同理
四.思考
雖然nn可以設(shè)置的比較隱秘,但是依然可以被掃描到,所以只靠隱秘nn方法對HDFS系統(tǒng)的安全保障是并不可取的.
雖然可以用網(wǎng)絡(luò)劃分或防火墻進行隔離,但是對于Hadoop框架設(shè)計而言,是有重大安全遺漏的.
我認為依然有許多HDFS系統(tǒng)目前正在公網(wǎng)運行中本節(jié)關(guān)于Hadoop分布式文件系統(tǒng)的安全隱患介紹到這里。
【編輯推薦】