资源简介
花了几天从各大名牌分词软件中提出的中文词组,已经对词组进行了整理和排序,保存成了三个txt文件,精简:74248个词组、常用:118021个词组、全部:222685个词组、常用标点符号文件共四个文件。

代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
.CA...R 283 2011-09-02 12:16 标点.txt
.CA...R 866083 2011-09-02 13:03 常用118021.txt
.CA...R 1751294 2011-09-02 13:04 全部222685.txt
.CA...R 540470 2011-09-02 13:03 精简74248.txt
----------- --------- ---------- ----- ----
3158130 4
----------- --------- ---------- ----- ----
.CA...R 283 2011-09-02 12:16 标点.txt
.CA...R 866083 2011-09-02 13:03 常用118021.txt
.CA...R 1751294 2011-09-02 13:04 全部222685.txt
.CA...R 540470 2011-09-02 13:03 精简74248.txt
----------- --------- ---------- ----- ----
3158130 4
- 上一篇:中联HIS门诊工作站操作指南
- 下一篇:Win10-K3V10.4-DLL.zip
相关资源
- sphinx中文分词 xdict_1.1.tar.gz
- 人民日报语料库中文分词语料库
- 带词性标注的中文分词词典
- 基于双向LSTM+tensorflow中文分词
- Paoding中文分词
- 北大人民日报语料库1998两份带词性标
- 中文分词字典
- ICTCLAS2009版中文分词系统
- 最新中文分词词库整理
- 中文分词词库
- 汉语文本聚类
- freeICTCLAS中科院中文分词(拼音中文输
- 正向最大匹配算法实现中文分词
- 百万级词库 - 同音异形词库
- 中文分词词库整理.rar
- 中文分词词库整理
- ik中文分词词库30万中文分词词库(含
- 正向最大匹配中文分词算法
- 测试中文分词.rar
- 最新中文分词工具的词库
- 微软亚洲研究院中文分词语料库
- 中文分词+关键字提取
- SCWS 中文分词
- HMM隐马尔可夫模型用于中文分词
- 基于svm的中文文本分类系统
- CRF,LSTM,最大后向匹配法实现中文分
- lucene中文分词器Jceseg和IK Analyzer使用
- 中科院中文分词系统ICTCLAS2015
- lucene 中文分词
- 中文自然语言处理中文分词训练语料
评论
共有 条评论