资源简介
在使用TF-IDF算法进行自然语言处理时,大家在处理文本时会首先进行切割,生成包含所有词的词典,但此时往往会有许多重复的词,这些词可能是经常使用的词,比如”的“,这样的词语太多会影响处理效果,因此需要去掉这些停用词在进行处理,在此提供停用词表!
代码片段和文件信息
相关资源
- 常见停用词词典
- 中文最全停用词表,个人整理1704个
- 自然语言处理-中文停用词表1893个
- 最新中文停用词表1208个
- 中文停用词库 chineseStopWords.txt
- 哈工大停用词超全版
- 哈工大停用词表
- Hadoop MapReduce实现tfidf源码
- 哈工大停用词
- 中文停用词
- k-means训练
- 最全的中文停用词表20K
- 各类停用词表整合
- 中英文停用词合集内含哈工大、四川
- 文本分类之词频统计分词、词干提取
- 中文语料停用词
- 最全中文停用词表1893个
- 中文文本分类停用词表
- 最新简体中文停用词表 stopwords.txt
- 超详细的中文停用词表
- 中文停用词表.txt
- 情感字典+停用词+程度副词+否定词
评论
共有 条评论