资源简介
“复旦大学计算机信息与技术国际数据库中心自然语言处理小组”提供的小样本中文文本分类语料,分为训练集和测试集两部分。内容真实有效

代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 4144 2012-03-18 21:06 中文文本分类项目数据集\hlt_stop_words.txt
文件 405 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\101.txt
文件 1223 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\1010.txt
文件 668 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\102.txt
文件 1218 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\103.txt
文件 1517 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\104.txt
文件 429 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\105.txt
文件 584 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\106.txt
文件 897 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\107.txt
文件 1041 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\108.txt
文件 860 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\109.txt
文件 377 2000-01-12 09:31 中文文本分类项目数据集\test_corpus\161.TXT
文件 890 2003-05-01 20:06 中文文本分类项目数据集\test_corpus\162.txt
文件 1038 2003-05-01 20:07 中文文本分类项目数据集\test_corpus\163.txt
文件 1696 2003-05-01 20:15 中文文本分类项目数据集\test_corpus\164.txt
文件 543 2003-05-01 20:16 中文文本分类项目数据集\test_corpus\165.txt
文件 1030 2003-05-01 18:18 中文文本分类项目数据集\test_corpus\166.txt
文件 1066 2003-05-01 20:19 中文文本分类项目数据集\test_corpus\167.txt
文件 1036 2003-05-01 20:26 中文文本分类项目数据集\test_corpus\168.txt
文件 1153 2003-05-01 20:27 中文文本分类项目数据集\test_corpus\169.txt
文件 628 2003-05-02 00:07 中文文本分类项目数据集\test_corpus\170.txt
文件 2377 1997-09-20 18:57 中文文本分类项目数据集\test_corpus\241.TXT
文件 8562 1997-09-20 18:57 中文文本分类项目数据集\test_corpus\242.TXT
文件 2156 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\243.TXT
文件 3460 1997-09-20 18:58 中文文本分类项目数据集\test_corpus\244.TXT
文件 2034 1997-09-20 18:58 中文文本分类项目数据集\test_corpus\245.TXT
文件 2474 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\246.TXT
文件 1984 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\247.TXT
文件 3368 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\248.TXT
文件 3177 1997-09-20 16:58 中文文本分类项目数据集\test_corpus\249.TXT
............此处省略2903个文件信息
----------- --------- ---------- ----- ----
文件 4144 2012-03-18 21:06 中文文本分类项目数据集\hlt_stop_words.txt
文件 405 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\101.txt
文件 1223 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\1010.txt
文件 668 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\102.txt
文件 1218 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\103.txt
文件 1517 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\104.txt
文件 429 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\105.txt
文件 584 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\106.txt
文件 897 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\107.txt
文件 1041 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\108.txt
文件 860 2003-04-30 21:57 中文文本分类项目数据集\test_corpus\109.txt
文件 377 2000-01-12 09:31 中文文本分类项目数据集\test_corpus\161.TXT
文件 890 2003-05-01 20:06 中文文本分类项目数据集\test_corpus\162.txt
文件 1038 2003-05-01 20:07 中文文本分类项目数据集\test_corpus\163.txt
文件 1696 2003-05-01 20:15 中文文本分类项目数据集\test_corpus\164.txt
文件 543 2003-05-01 20:16 中文文本分类项目数据集\test_corpus\165.txt
文件 1030 2003-05-01 18:18 中文文本分类项目数据集\test_corpus\166.txt
文件 1066 2003-05-01 20:19 中文文本分类项目数据集\test_corpus\167.txt
文件 1036 2003-05-01 20:26 中文文本分类项目数据集\test_corpus\168.txt
文件 1153 2003-05-01 20:27 中文文本分类项目数据集\test_corpus\169.txt
文件 628 2003-05-02 00:07 中文文本分类项目数据集\test_corpus\170.txt
文件 2377 1997-09-20 18:57 中文文本分类项目数据集\test_corpus\241.TXT
文件 8562 1997-09-20 18:57 中文文本分类项目数据集\test_corpus\242.TXT
文件 2156 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\243.TXT
文件 3460 1997-09-20 18:58 中文文本分类项目数据集\test_corpus\244.TXT
文件 2034 1997-09-20 18:58 中文文本分类项目数据集\test_corpus\245.TXT
文件 2474 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\246.TXT
文件 1984 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\247.TXT
文件 3368 1997-09-20 16:57 中文文本分类项目数据集\test_corpus\248.TXT
文件 3177 1997-09-20 16:58 中文文本分类项目数据集\test_corpus\249.TXT
............此处省略2903个文件信息
相关资源
- 全情感词情感词典大全
- 带词性标注的中文分词词典
- 自然语言处理 中英文句法分析与依存
- 自然语言处理-关键词提取四种方法
- 哈工大自然语言处理课件及实验
- 中文文本相似度匹配算法
- 自然语言处理、文本挖掘论文40篇 包
- 人体疾病,病症数据库
- 搜狗中文文本分析语料库
- gensim包的tfidf方法计算中文文本相似度
- 处理好的人民日报语料,可以直接用
- 中文情感词典
- 唐宇迪word2vec的系列代码自然语言处理
- 统计自然语言处理宗成庆
- 2016年国科大NLP自然语言处理期末考试
- 自然语言处理之文本主题判别
- 自然语言处理大作业-对联系统
- 基于深度学习的自然语言处理 英文版
- 中文文本情感分类已标注
- 用RNN与LSTM网络原理进行唐诗生成.ta
- 搜狗词库带词性词频
- GATE 自然语言处理
- 自然语言处理课程设计--中文情感分类
- 汉语分词语料库
- 自然语言处理技术
- 哈工大同义词词林扩展版
- 中文文本纠错数据集.zip
- 中文信息处理发展报告2016+知识图谱发
- Foundations of Statistical Natural Language Pr
- 国科大自然语言处理期末试卷(宗成
评论
共有 条评论