自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

IK Analyzer 2012發(fā)布 中文分詞庫

開發(fā) 后端
IK Analyzer是一個開源的,基于java語言開發(fā)的輕量級的中文分詞工具包。從2006年12月推出1.0版開始, IKAnalyzer已經(jīng)推出了4個大版本。最初,它是以開源項目Luence為應(yīng)用主體的,結(jié)合詞典分詞和文法分析算法的中文分詞組件。

IK Analyzer是一個開源的,基于java語言開發(fā)的輕量級的中文分詞工具包。從2006年12月推出1.0版開始, IKAnalyzer已經(jīng)推出了4個大版本。最初,它是以開源項目Luence為應(yīng)用主體的,結(jié)合詞典分詞和文法分析算法的中文分詞組件。從3.0版本開 始,IK發(fā)展為面向Java的公用分詞組件,獨立于Lucene項目,同時提供了對Lucene的默認(rèn)優(yōu)化實現(xiàn)。在2012版本中,IK實現(xiàn)了簡單的分詞 歧義排除算法,標(biāo)志著IK分詞器從單純的詞典分詞向模擬語義分詞衍化。

IK Analyzer 2012特性:

  • 采用了特有的“正向迭代最細(xì)粒度切分算法“,支持細(xì)粒度和智能分詞兩種切分模式;
  • 在系統(tǒng)環(huán)境:Core2 i7 3.4G雙核,4G內(nèi)存,window 7 64位, Sun JDK 1.6_29 64位 普通pc環(huán)境測試,IK2012具有160萬字/秒(3000KB/S)的高速處理能力。
  • 2012版本的智能分詞模式支持簡單的分詞排歧義處理和數(shù)量詞合并輸出。
  • 采用了多子處理器分析模式,支持:英文字母、數(shù)字、中文詞匯等分詞處理,兼容韓文、日文字符。
  • 優(yōu)化的詞典存儲,更小的內(nèi)存占用。支持用戶詞典擴(kuò)展定義。特別的,在2012版本,詞典支持中文,英文,數(shù)字混合詞語。

下載地址:http://code.google.com/p/ik-analyzer/downloads/list

原文鏈接:http://www.oschina.net/news/26788/ikanalyzer-2012

【編輯推薦】

  1. 推薦5個提高Java開發(fā)效率的工具
  2. Magnolia 4.5發(fā)布 Java的企業(yè)級CMS系統(tǒng)
  3. ExpressionJ 0.9 Beta2發(fā)布 Java算數(shù)表達(dá)式計算
  4. Apache Camel 2.9.1發(fā)布 Java規(guī)則引擎
  5. EWeb4J-1.8.6發(fā)布 Java開源框架
責(zé)任編輯:林師授 來源: 開源中國社區(qū)
相關(guān)推薦

2012-01-25 19:35:08

SQL Server

2021-04-12 08:17:12

ElasticSear分詞中文

2011-11-18 13:48:38

SQL Server

2011-10-25 13:54:25

2012-04-20 09:50:20

云計算微軟System Cent

2012-05-11 14:51:06

Windows Ser

2009-06-21 13:37:53

2009-02-25 09:35:12

LinuxBASH 4.0OS X v10.4

2009-09-27 13:41:55

Eclipse 3.5

2011-11-02 17:08:48

OpenBSD發(fā)布

2012-03-15 16:46:02

JavaMyBatis

2011-06-07 10:07:06

LibreOffice

2011-12-21 08:58:23

Java

2012-11-14 09:31:13

CloudStackIaaSCitrix

2011-02-24 09:36:33

LibreOffice

2011-08-02 09:15:49

LibreOffice

2012-03-15 09:57:59

JavaDynamicRepo

2013-08-15 10:17:40

Windows SerWindows Ser

2009-07-03 14:47:50

PHPnow中文

2012-03-01 09:42:21

JavaApache Whir
點贊
收藏

51CTO技術(shù)棧公眾號