资源简介
文本分类现成语料库,是SogouC.mini.20061127.zip格式的,可用于web数据挖掘-Off-the-shelf text classification corpus is SogouC.mini.20061127.zip format, can be used for web data mining
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 138 2006-10-26 11:37 SogouC.mini\ClassList.txt
文件 2635 2006-10-27 17:37 SogouC.mini\Sample\C000007\10.txt
文件 793 2006-10-27 17:37 SogouC.mini\Sample\C000007\11.txt
文件 3498 2006-10-27 17:37 SogouC.mini\Sample\C000007\12.txt
文件 4192 2006-10-27 17:37 SogouC.mini\Sample\C000007\13.txt
文件 6314 2006-10-27 17:37 SogouC.mini\Sample\C000007\14.txt
文件 566 2006-10-27 17:37 SogouC.mini\Sample\C000007\15.txt
文件 7428 2006-10-27 17:37 SogouC.mini\Sample\C000007\16.txt
文件 1962 2006-10-27 17:37 SogouC.mini\Sample\C000007\17.txt
文件 3746 2006-10-27 17:37 SogouC.mini\Sample\C000007\18.txt
文件 952 2006-10-27 17:37 SogouC.mini\Sample\C000007\19.txt
..AD... 0 2009-11-21 21:36 SogouC.mini\Sample\C000007
文件 4275 2006-10-27 17:40 SogouC.mini\Sample\C000008\10.txt
文件 608 2006-10-27 17:40 SogouC.mini\Sample\C000008\11.txt
文件 1877 2006-10-27 17:40 SogouC.mini\Sample\C000008\12.txt
文件 1267 2006-10-27 17:40 SogouC.mini\Sample\C000008\13.txt
文件 1469 2006-10-27 17:40 SogouC.mini\Sample\C000008\14.txt
文件 507 2006-10-27 17:40 SogouC.mini\Sample\C000008\15.txt
文件 485 2006-10-27 17:40 SogouC.mini\Sample\C000008\16.txt
文件 5297 2006-10-27 17:40 SogouC.mini\Sample\C000008\17.txt
文件 5066 2006-10-27 17:40 SogouC.mini\Sample\C000008\18.txt
文件 498 2006-10-27 17:40 SogouC.mini\Sample\C000008\19.txt
..AD... 0 2009-11-21 21:36 SogouC.mini\Sample\C000008
文件 311 2006-10-27 17:40 SogouC.mini\Sample\C000010\10.txt
文件 587 2006-10-27 17:40 SogouC.mini\Sample\C000010\11.txt
文件 766 2006-10-27 17:40 SogouC.mini\Sample\C000010\12.txt
文件 6793 2006-10-27 17:40 SogouC.mini\Sample\C000010\13.txt
文件 919 2006-10-27 17:40 SogouC.mini\Sample\C000010\14.txt
文件 2386 2006-10-27 17:40 SogouC.mini\Sample\C000010\15.txt
文件 1006 2006-10-27 17:40 SogouC.mini\Sample\C000010\16.txt
............此处省略86个文件信息
----------- --------- ---------- ----- ----
文件 138 2006-10-26 11:37 SogouC.mini\ClassList.txt
文件 2635 2006-10-27 17:37 SogouC.mini\Sample\C000007\10.txt
文件 793 2006-10-27 17:37 SogouC.mini\Sample\C000007\11.txt
文件 3498 2006-10-27 17:37 SogouC.mini\Sample\C000007\12.txt
文件 4192 2006-10-27 17:37 SogouC.mini\Sample\C000007\13.txt
文件 6314 2006-10-27 17:37 SogouC.mini\Sample\C000007\14.txt
文件 566 2006-10-27 17:37 SogouC.mini\Sample\C000007\15.txt
文件 7428 2006-10-27 17:37 SogouC.mini\Sample\C000007\16.txt
文件 1962 2006-10-27 17:37 SogouC.mini\Sample\C000007\17.txt
文件 3746 2006-10-27 17:37 SogouC.mini\Sample\C000007\18.txt
文件 952 2006-10-27 17:37 SogouC.mini\Sample\C000007\19.txt
..AD... 0 2009-11-21 21:36 SogouC.mini\Sample\C000007
文件 4275 2006-10-27 17:40 SogouC.mini\Sample\C000008\10.txt
文件 608 2006-10-27 17:40 SogouC.mini\Sample\C000008\11.txt
文件 1877 2006-10-27 17:40 SogouC.mini\Sample\C000008\12.txt
文件 1267 2006-10-27 17:40 SogouC.mini\Sample\C000008\13.txt
文件 1469 2006-10-27 17:40 SogouC.mini\Sample\C000008\14.txt
文件 507 2006-10-27 17:40 SogouC.mini\Sample\C000008\15.txt
文件 485 2006-10-27 17:40 SogouC.mini\Sample\C000008\16.txt
文件 5297 2006-10-27 17:40 SogouC.mini\Sample\C000008\17.txt
文件 5066 2006-10-27 17:40 SogouC.mini\Sample\C000008\18.txt
文件 498 2006-10-27 17:40 SogouC.mini\Sample\C000008\19.txt
..AD... 0 2009-11-21 21:36 SogouC.mini\Sample\C000008
文件 311 2006-10-27 17:40 SogouC.mini\Sample\C000010\10.txt
文件 587 2006-10-27 17:40 SogouC.mini\Sample\C000010\11.txt
文件 766 2006-10-27 17:40 SogouC.mini\Sample\C000010\12.txt
文件 6793 2006-10-27 17:40 SogouC.mini\Sample\C000010\13.txt
文件 919 2006-10-27 17:40 SogouC.mini\Sample\C000010\14.txt
文件 2386 2006-10-27 17:40 SogouC.mini\Sample\C000010\15.txt
文件 1006 2006-10-27 17:40 SogouC.mini\Sample\C000010\16.txt
............此处省略86个文件信息
- 上一篇:FPGA驱动LCD12864程序
- 下一篇:基于tensorflow的语音识别
相关资源
- 删除文本中有相同列值的行(pl文件)
- 基于weka的数据分类分析实验报告(精
- 模式识别/分类Pattern Classification (D
- Flex识别文本文件
- IBM SPSS Modeler数据与文本挖掘实战---数
- 自己做的手写数字样本及knn分类代码
- ICD-10疾病分类与代码(全套)
- 基于bootstrap-treeview做的一个漂亮的无
- 汇编语言实验,包括比较字符串,查
- 2020.04.25中国行政区划文件包含txt文本
- 多文本剪贴板 剪贴板 v1.3.1无限期版
- Hownet知网情感词典
- 第三次国土调查工作分类图示符号库
- Waste-Sorter-master.zip
- tinyMCE 富文本编辑器 line-height 行高插
- 微信小程序富文本编辑器插件editor微
- flash as3 文本编辑器
- js实现五星评分类似淘宝
- 多国语言开发必备工具(点阵字库+多
- 从文本文件读取控制点实现在OPENGL中
- 搜狗新闻的自动文本摘要的数据集
- 基于labview的visa串口通信数据为5位帧
- 垃圾邮件分类
- 无导师学习神经网络的分类-水源判别
- 有导师学习神经网络的分类-花朵识别
- OpenCV基于SVM与BoW类型的图片分类的实
- 基于R的数据挖掘之信用卡是否违约预
- nlpcc2013样例集,excel版
- C 一屏一屏浏览TXT文本文件内容.ra
- 慧达顺丰快递单号生成器 v10.0.zip
评论
共有 条评论