资源简介
VS2013使用盘古分词先对用户输入的句子进行分割,在进行词语的查询的使用软件
代码片段和文件信息
using System.Collections;
using System.IO;
using Lucene.Net.Analysis;
namespace NSharp.SearchEngine.Lucene.Analysis.Cjk
{
/**/
/**
* Filters CJKTokenizer with StopFilter.
*
* @author Che Dong
*/
public class CJKAnalyzer : Analyzer
{
//~ Static fields/initializers ---------------------------------------------
/**/
/**
* An array containing some common English words that are not usually
* useful for searching and some double-byte interpunctions.
*/
public static string[] STOP_WORDS = {
“a“ “and“ “are“ “as“ “at“ “be“
“but“ “by“ “for“ “if“ “in“
“into“ “is“ “it“ “no“ “not“
“of“ “on“ “or“ “s“ “such“ “t“
“that“ “the“ “their“ “then“
“there“ “these“ “they“ “this“
“to“ “was“ “will“ “with“ ““
“www“
};
//~ Instance fields --------------------------------------------------------
/**/
/**
* stop word list
*/
private Hashtable stopTable;
//~ Constructors -----------------------------------------------------------
/**/
/**
* Builds an analyzer which removes words in {@link #STOP_WORDS}.
*/
public CJKAnalyzer()
{
stopTable = StopFilter.MakeStopSet(STOP_WORDS);
}
/**/
/**
* Builds an analyzer which removes words in the provided array.
*
* @param stopWords stop word array
*/
public CJKAnalyzer(string[] stopWords)
{
stopTable = StopFilter.MakeStopSet(stopWords);
}
//~ Methods ----------------------------------------------------------------
/**/
/**
* get token stream from input
*
* @param fieldName lucene field name
* @param reader input reader
* @return TokenStream
*/
public override TokenStream TokenStream(string fieldName TextReader reader)
{
TokenStream ts = new CJKTokenizer(reader);
return new StopFilter(ts stopTable);
//return new StopFilter(new CJKTokenizer(reader) stopTable);
}
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2016-10-16 21:30 盘古分词\
目录 0 2016-11-04 20:09 盘古分词\盘古分词\
文件 1005 2016-10-16 21:30 盘古分词\盘古分词.sln
文件 65536 2016-11-15 23:28 盘古分词\盘古分词.v12.suo
文件 321 2016-10-19 15:04 盘古分词\盘古分词\App.config
目录 0 2016-10-17 18:05 盘古分词\盘古分词\bin\
目录 0 2016-10-17 21:59 盘古分词\盘古分词\bin\Debug\
目录 0 2016-10-16 21:46 盘古分词\盘古分词\bin\Debug\Dict\
文件 1001 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\ChsDoubleName1.txt
文件 1011 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\ChsDoubleName2.txt
文件 1006 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\ChsSingleName.txt
文件 3642500 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\Dict.dct
文件 251 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\Stopword.txt
文件 75361 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\Synonym.txt
文件 215 2016-10-16 21:33 盘古分词\盘古分词\bin\Debug\Dict\Wildcard.txt
文件 856064 2012-09-18 14:51 盘古分词\盘古分词\bin\Debug\Lucene.Net.dll
文件 78336 2012-09-18 15:30 盘古分词\盘古分词\bin\Debug\PanGu.dll
文件 6144 2012-09-18 15:30 盘古分词\盘古分词\bin\Debug\PanGu.Lucene.Analyzer.dll
文件 20992 2016-10-19 16:15 盘古分词\盘古分词\bin\Debug\盘古分词.exe
文件 321 2016-10-19 15:04 盘古分词\盘古分词\bin\Debug\盘古分词.exe.config
文件 52736 2016-10-19 16:15 盘古分词\盘古分词\bin\Debug\盘古分词.pdb
文件 24224 2016-11-15 23:08 盘古分词\盘古分词\bin\Debug\盘古分词.vshost.exe
文件 321 2016-10-19 15:04 盘古分词\盘古分词\bin\Debug\盘古分词.vshost.exe.config
文件 490 2013-03-18 17:00 盘古分词\盘古分词\bin\Debug\盘古分词.vshost.exe.manifest
目录 0 2016-10-17 18:05 盘古分词\盘古分词\bin\Release\
文件 2643 2016-10-16 21:37 盘古分词\盘古分词\CJKAnalyzer.cs
文件 9541 2016-10-16 21:37 盘古分词\盘古分词\CJKTokenizer.cs
目录 0 2016-10-16 21:33 盘古分词\盘古分词\Dict\
文件 1001 2016-10-16 21:33 盘古分词\盘古分词\Dict\ChsDoubleName1.txt
文件 1011 2016-10-16 21:33 盘古分词\盘古分词\Dict\ChsDoubleName2.txt
文件 1006 2016-10-16 21:33 盘古分词\盘古分词\Dict\ChsSingleName.txt
............此处省略42个文件信息
- 上一篇:个人防火墙 v3.0 专业版
- 下一篇:doudizhu.rar
相关资源
- Emgu.CV 打开视频与人脸检测
- .NET BS结构 物流管理系统 三层架构
- 麦克纳姆轮程序.rar
- Visual Basic.NET自动化系统监控.(范逸之
- Unity3D 实战视频教程 保卫萝卜 2D 游戏
- net微信支付
- lucene.net+盘古分词多条件全文检索并匹
- .net开源的维基百科系统
- lucene.net2.3.1.2盘古分词演示程序.rar
- 闪电猫-电商下图助手5.0.zip
- Json.net
- 3. BizTalk企业应用集成方案深度演绎
- FastReport.Net V2014.4.8 For .Net2.0
- NET Reflector 8.3破解版自带代码导出
- AutoMapper的使用
- ADO.net基础,里面有登陆,注册界面教
- InTheHand.Net.Personal 3.5版 3.7版 (32fee
- Microsoft.NET Remoting权威指南
- CLRProfiler 内存泄漏工具 .net
-
unityVS .Net fr
amework3. 5安装 - Simple Assembly Explorer v1.14.4.NET Class Edi
- NET DLL 查看器
- Novamind 5.7.4-安装+和谐文件+.NET 4+安装
- Parallel Programming with Microsoft.NET.pdf
- Xenocode+Postbuild+2010+for+.NET程序混淆器(
- DNGuard_HVM_Unpacker(.net2.0-4.0)
- 清华大学计算机系网络课程之模式识
- Unity3D课程设计 模拟火焰效果
- Unity录屏模块封装清晰的可调AVPro Mo
- 1 AutoCAD .NET开发指南2012版》.rar
评论
共有 条评论