资源简介
2017最新整理71.6万词库,适用于 elasticsearch 的 IK分词,解决搜索结果包含相关度低的稿件
解决方法:
1.丰富分词词库(由27.5万词,增加到71.6万词)
2.建索引时采用ik_max_word分词策略,搜索词分词采用ik_smart分词策略,平衡分词粒度,避免搜索不全或搜索不准
代码片段和文件信息
相关资源
- 爬虫+分词+Word2vec向量化的实现.zip
- crf分词标注训练语料
- 英文分词工具
- 2019年1月整理伪原创同义词
- 百万级词库 - 同音异形词库
- 常用词词库
- 品牌词库总.txt
- 《深度学习》自建搜狗各学科中文词
- solr7.x ikanalyzer pinyin 分词
- 中文分词词库整理.rar
- 中文分词词库整理
- NLPIR分词、去停用词
- elasticsearch-analysis-ik-6.2.4插件
- ik中文分词词库30万中文分词词库(含
- 正向最大匹配中文分词算法
- 中文文本自动分词和标注
- 测试中文分词.rar
- 最新中文分词工具的词库
- 微软亚洲研究院中文分词语料库
- 中文词库素材词汇量超过10万+语料库
- SEO伪原创词库15万同义词已整理.txt
- 淘宝天猫京东品牌词库大全
- 英文词库.txt
- 搜狗输入法词库
- jieba分词词典和停用词
- 奥创词库转换工具- 搜狗细胞词库转换
- 专业商品词库
- Solr6.5 IK分词器
- hanlp-1.7.2-release.zip
- 最新知网hownet文本词库
评论
共有 条评论