自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="v25z4"><p id="v25z4"><th id="v25z4"></th></p></blockquote>

<kbd id="v25z4"></kbd>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

nutch+hadoop配置使用方法簡明介紹

作者：zb's zone 2010-06-07 15:07:24

開發(fā) 架構(gòu) Hadoop

Hadoop相信大家都比較熟悉了，這里向大家介紹一下nutch+hadoop配置使用問題，希望通過本文的介紹大家對有關(guān)hadoop配置方面的知識有新的認(rèn)識。

本節(jié)繼續(xù)向大家介紹一下nutch+hadoop配置方面的內(nèi)容，上節(jié)介紹了配置的步驟，本節(jié)介紹一下nutch+hadoop配置完成后如何使用，歡迎大家一起來學(xué)習(xí)。

nutch+hadoop配置使用

中文分詞：
1.對建立索引所用分詞工具的修改
將下載的中文分詞包放到lib目錄下，改名為analysis-zh.jar(當(dāng)然，你也可以不用改）。找到下面文件
src\java\org\apache\nutch\analysis\NutchDocumentAnalyzer.java
修改tokenStream方法如下
publicTokenStreamtokenStream(StringfieldName,Readerreader){
Analyzeranalyzer;
analyzer=newMMAnalyzer();
returnanalyzer.tokenStream(fieldName,reader);
}
注意：由于加入信息的分析類，你需要將該類導(dǎo)入。使用如下語句。
importjeasy.analysis.*;

2.對查詢所用分析部分的修改
nutch+hadoop配置使用總需要對查詢所用分析部分的修改。src\java\org\apache\nutch\analysis\中的NutchAnalysis.jj文件
將<SIGRAM:<CJK>>
改為:|<SIGRAM:(<CJK>)+>
使用javacc工具將NutchAnalysis.jj生成java文件，共會生成7個java文件，將他們拷貝到下面的文件夾中替換原有文件。
src\java\org\apache\nutch\analysis

如何安裝與使用javacc？
下載javacc并解壓，然后將javacc的主目錄添加到環(huán)境變量下。進(jìn)入命令行，輸入javacc，如果不出現(xiàn)不能識別該命令之類的說法，證明安裝成功。
進(jìn)入NutchAnalysis.jj文件所在的目錄，輸入javaccNutchAnalysis.jj命令就會生成7個java文件了。

3.重新編譯工程文件
這里你需要用到ant工具了，那么ant工具怎么安裝呢？
ant的安裝與配置與javacc類似，下載后解壓，然后在path環(huán)境變量中加如指向ant下的bin文件夾的路徑。
使用：從命令行進(jìn)入nutch目錄中，輸入ant命令，它會自動根據(jù)當(dāng)前目錄下的build.xml進(jìn)行重建。重建完畢后會在改目錄下產(chǎn)生一個build文件夾。

4.重建后的文件替換
一、將nutch-0.x.x.job文件拷貝出來替換nutch目錄下的同名文件。
二、將\build\classes\org\apache\nutch\analysis目錄下的所有文件拷貝替換nutch-0.x.x.jar中org\apache\nutch\analysis目錄下的文件。
三、將nutch-0.x.x.jar文件和你的分詞包（我的是analysis-zh.jar）拷貝到tomcat中WEB-INF\lib下面。

5.重新爬行與建立索引，重新啟動tomcat即可。

nutch搜索url過濾規(guī)則：
對于每一次(由depth決定)對url進(jìn)行filter，所以要搜子頁面，首頁一定要通過filter，否則搜索不到。本節(jié)關(guān)于nutch+hadoop配置使用介紹到這里。

【編輯推薦】

nutch+hadoop配置步驟及問題解決方法深入剖析
Hadoop配置注意事項(xiàng)及命令使用經(jīng)驗(yàn)總結(jié)
Hadoop配置和啟動Hadoop方法詳解
Hadoop集群搭建過程中相關(guān)環(huán)境配置詳解
Hadoop完全分布模式安裝實(shí)現(xiàn)詳解

責(zé)任編輯：佚名來源： javaeye.com

nutch+hadoop配置

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sup id="6dfz1"></sup>