自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

11大Java開源中文分詞器的使用方法和分詞效果對比

開發(fā) 后端
本文給出了11大Java開源中文分詞的使用方法以及分詞結(jié)果對比代碼,至于效果哪個(gè)好,那要用的人結(jié)合自己的應(yīng)用場景自己來判斷。

[[171673]]

本文的目標(biāo)有兩個(gè):

1、學(xué)會(huì)使用11大Java開源中文分詞器

2、對比分析11大Java開源中文分詞器的分詞效果

本文給出了11大Java開源中文分詞的使用方法以及分詞結(jié)果對比代碼,至于效果哪個(gè)好,那要用的人結(jié)合自己的應(yīng)用場景自己來判斷。

11大Java開源中文分詞器,不同的分詞器有不同的用法,定義的接口也不一樣,我們先定義一個(gè)統(tǒng)一的接口:

 

 

從上面的定義我們知道,在Java中,同樣的方法名稱和參數(shù),但是返回值不同,這種情況不可以使用重載。

這兩個(gè)方法的區(qū)別在于返回值,每一個(gè)分詞器都可能有多種分詞模式,每種模式的分詞結(jié)果都可能不相同,***個(gè)方法忽略分詞器模式,返回所有模式的所有不重復(fù)分詞結(jié)果,第二個(gè)方法返回每一種分詞器模式及其對應(yīng)的分詞結(jié)果。

在這里,需要注意的是我們使用了Java8中的新特性默認(rèn)方法,并使用stream把一個(gè)map的value轉(zhuǎn)換為不重復(fù)的集合。

下面我們利用這11大分詞器來實(shí)現(xiàn)這個(gè)接口:

1、word分詞器

 

 

2、Ansj分詞器

 

 

3、Stanford分詞器

 

 

4、FudanNLP分詞器

 

 

5、Jieba分詞器

 

 

6、Jcseg分詞器

 

 

7、MMSeg4j分詞器

 

 

8、IKAnalyzer分詞器

 

 

9、Paoding分詞器

 

 

10、smartcn分詞器

 

 

11、HanLP分詞器

 

 

現(xiàn)在我們已經(jīng)實(shí)現(xiàn)了本文的***個(gè)目的:學(xué)會(huì)使用11大Java開源中文分詞器。

***我們來實(shí)現(xiàn)本文的第二個(gè)目的:對比分析11大Java開源中文分詞器的分詞效果,程序如下:

 

 

運(yùn)行結(jié)果如下:

 

 

 

 

責(zé)任編輯:趙寧寧 來源: 36大數(shù)據(jù)
相關(guān)推薦

2021-09-03 11:26:39

分詞器ElasticSear

2019-01-10 14:49:14

開源技術(shù) 工具包

2021-04-12 08:17:12

ElasticSear分詞中文

2011-06-03 16:04:05

SEO分詞

2024-09-04 15:12:35

2022-09-07 08:16:09

MySQL索引

2010-02-22 09:54:19

Ubuntu mysq

2011-06-30 18:33:09

分詞

2011-08-16 16:24:28

全文檢索數(shù)據(jù)挖掘

2012-03-16 10:07:30

IK AnalyzerJava

2024-02-26 00:40:00

AIGPT

2024-08-02 11:00:00

分詞器搜索查詢

2023-09-21 23:05:50

jiebaPython

2020-10-28 14:03:22

NLP自然語言分詞

2023-12-14 15:27:12

中文分詞Python

2024-02-22 09:51:56

代碼AI

2010-05-28 19:32:24

MySQL使用方法

2016-12-09 13:45:21

RNN大數(shù)據(jù)深度學(xué)習(xí)

2013-07-15 15:12:40

iOS多線程NSOperationNSOperation

2011-06-03 13:25:32

分詞索引庫
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號