资源简介
Lucene提取新闻关键词Top-N
JDK版本要求1.7,lucene版本要求5.5.3
使用说明:
1、在IndexDocs.java右键run as java application
2、在GetTopTerms.java右键run as java application
代码片段和文件信息
package lucene.ik;
import java.io.Reader;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.util.IOUtils;
public class IkAnalyzer6x extends Analyzer {
@Override
protected TokenStreamComponents createComponents(String arg0) {
Reader reader=null;
try{
reader=new StringReader(arg0);
IKTokenizer6x it = new IKTokenizer6x(reader);
return new Analyzer.TokenStreamComponents(it);
}finally {
IOUtils.closeWhileHandlingException(reader);
}
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-05-10 11:18 lucene\
文件 788 2018-05-09 17:52 lucene\.classpath
文件 382 2018-05-08 16:11 lucene\.project
目录 0 2018-05-10 11:12 lucene\.settings\
文件 120 2018-05-10 11:13 lucene\.settings\org.eclipse.core.resources.prefs
目录 0 2018-09-07 15:59 lucene\bin\
文件 414 2018-05-10 10:31 lucene\bin\IKAnalyzer.cfg.xm
目录 0 2018-09-07 15:59 lucene\bin\lucene\
目录 0 2018-09-07 15:59 lucene\bin\lucene\ik\
文件 2556 2018-09-07 15:59 lucene\bin\lucene\ik\IKTokenizer6x.class
文件 1208 2018-09-07 15:59 lucene\bin\lucene\ik\IkAnalyzer6x.class
目录 0 2018-09-07 15:59 lucene\bin\lucene\test\
文件 1277 2018-09-07 15:59 lucene\bin\lucene\test\GetTopTerms$1.class
文件 3543 2018-09-07 15:59 lucene\bin\lucene\test\GetTopTerms.class
文件 3689 2018-09-07 15:59 lucene\bin\lucene\test\IndexDocs.class
文件 5461 2018-05-10 11:16 lucene\bin\stopword.dic
目录 0 2018-09-07 16:00 lucene\indexdir\
文件 373 2018-09-07 16:00 lucene\indexdir\_r.cfe
文件 49843 2018-09-07 16:00 lucene\indexdir\_r.cfs
文件 359 2018-09-07 16:00 lucene\indexdir\_r.si
文件 136 2018-09-07 16:00 lucene\indexdir\segments_s
文件 0 2018-05-09 17:52 lucene\indexdir\write.lock
目录 0 2018-05-09 17:52 lucene\lib\
文件 1165347 2018-05-08 17:44 lucene\lib\IKAnalyzer2012_u6.jar
文件 1576969 2018-05-09 17:50 lucene\lib\lucene-analyzers-common-5.5.3.jar
文件 3603440 2018-05-09 17:50 lucene\lib\lucene-analyzers-smartcn-5.5.3.jar
文件 2371553 2018-05-09 17:51 lucene\lib\lucene-core-5.5.3.jar
文件 144817 2018-05-09 17:51 lucene\lib\lucene-highlighter-5.5.3.jar
文件 33804 2018-05-09 17:51 lucene\lib\lucene-memory-5.5.3.jar
文件 251571 2018-05-09 17:51 lucene\lib\lucene-queries-5.5.3.jar
文件 402732 2018-05-09 17:51 lucene\lib\lucene-queryparser-5.5.3.jar
............此处省略13个文件信息
相关资源
- jieba分词jar包
- 基于CRF++的中文分词 数据+CRF++工具+
- lucene4.0常用jar包
- 基于java的文本搜索引擎的设计与实现
- java版结巴分词工具
- android和lucene组合实现全文检索代码
- IKAnalyzer2012_u6中文分词器jar包
- lucene-core-3.6.1.jar
- lucene-core-3.6.0.jar
- IKAnalyzer中文分词器jar包
- 中文分词库 IKAnalyzer For Lucene 5.2.1适用
- IK分词器完整资源包 有配置文件和j
- IKAnalyzer2012FF_u1.jar download
- 中文分词与关键词提取NLPIR java版
- lucene-core-3.6.2.jar
- lucene全文检索需要jar包
- java 实现的中文分词算法代码
- Jieba-Analysis 结巴分词
- 基于java的中文自动分词自然语言处理
- lucene-core-2.4.1.jar
- IK-Analyzer-4.10.1.jar
- Java中通过HanLP实现文本分词、提取关
- nlpir汉语分词系统
- lucene4.6所有jar包
- 最全的lucene-2.4.0jar包
- Java Web+爬虫+lucene 大学新闻网
- java大作业之词频统计
- Lucene项目(华电内部文档搜索系统)
- 解密搜索引擎技术实战Lucene&Java精华版
- 解密搜索引擎技术实战Lucene&Java精华版
评论
共有 条评论