资源简介
2017最新整理71.6万词库,适用于 elasticsearch 的 IK分词,解决搜索结果包含相关度低的稿件
解决方法:
1.丰富分词词库(由27.5万词,增加到71.6万词)
2.建索引时采用ik_max_word分词策略,搜索词分词采用ik_smart分词策略,平衡分词粒度,避免搜索不全或搜索不准
代码片段和文件信息
相关资源
- 伪原创同义词库(13000条)
- sphinx中文分词 xdict_1.1.tar.gz
- 人民日报语料库中文分词语料库
- 带词性标注的中文分词词典
- 最全的情感分析词库
- 基于双向LSTM+tensorflow中文分词
- 最全中文情感词库
- Luence的与盘古分词的使用软件
- 最全中文情感和语义词库包含好几种
- 最新整理 盘古分词 dct词库文件 7205
- people_daily_2014_corpus.zip
- 最全中文情感和语义词库
- 维基百科中文语料已分词
- 盘古分词 DictManage.exe
- lucene.net+盘古分词多条件全文检索并匹
- lucene.net2.3.1.2盘古分词演示程序.rar
- 新版盘古分词词库
- 小i机器人知识问答词库.zip
- Paoding中文分词
- 搜狗中文文本分析语料库
- 北大人民日报语料库1998两份带词性标
- 英语单词库带音标版本.xlsx
- 敏感词库.zip
- coreseek中日韩分词词库
- tfidf特征提取
- 搜狗词库带词性词频
- 英语四级词库数据库
- 安卓 背单词 含源代码 词库 编辑功能
- jieba+百度分词词库
- 中科院汉语词法分析系统ICTCLAS安装包
评论
共有 条评论