资源简介
基于内容的文本分类系统,使用libsvm 进行分类。
代码片段和文件信息
import libsvm.*;
import java.io.*;
import java.util.*;
class svm_predict {
private static svm_print_interface svm_print_null = new svm_print_interface()
{
public void print(String s) {}
};
private static svm_print_interface svm_print_stdout = new svm_print_interface()
{
public void print(String s)
{
System.out.print(s);
}
};
private static svm_print_interface svm_print_string = svm_print_stdout;
static void info(String s)
{
svm_print_string.print(s);
}
private static double atof(String s)
{
return Double.valueOf(s).doubleValue();
}
private static int atoi(String s)
{
return Integer.parseInt(s);
}
private static void predict(BufferedReader input DataOutputStream output svm_model model int predict_probability) throws IOException
{
int correct = 0;
int total = 0;
double error = 0;
double sumv = 0 sumy = 0 sumvv = 0 sumyy = 0 sumvy = 0;
int svm_type=svm.svm_get_svm_type(model);
int nr_class=svm.svm_get_nr_class(model);
double[] prob_estimates=null;
if(predict_probability == 1)
{
if(svm_type == svm_parameter.EPSILON_SVR ||
svm_type == svm_parameter.NU_SVR)
{
svm_predict.info(“Prob. model for test data: target value = predicted value + z\nz: Laplace distribution e^(-|z|/sigma)/(2sigma)sigma=“+svm.svm_get_svr_probability(model)+“\n“);
}
else
{
int[] labels=new int[nr_class];
svm.svm_get_labels(modellabels);
prob_estimates = new double[nr_class];
output.writeBytes(“labels“);
for(int j=0;j output.writeBytes(“ “+labels[j]);
output.writeBytes(“\n“);
}
}
while(true)
{
String line = input.readLine();
if(line == null) break;
StringTokenizer st = new StringTokenizer(line“ \t\n\r\f:“);
double target = atof(st.nextToken());
int m = st.countTokens()/2;
svm_node[] x = new svm_node[m];
for(int j=0;j {
x[j] = new svm_node();
x[j].index = atoi(st.nextToken());
x[j].value = atof(st.nextToken());
}
double v;
if (predict_probability==1 && (svm_type==svm_parameter.C_SVC || svm_type==svm_parameter.NU_SVC))
{
v = svm.svm_predict_probability(modelxprob_estimates);
output.writeBytes(v+“ “);
for(int j=0;j output.writeBytes(prob_estimates[j]+“ “);
output.writeBytes(“\n“);
}
else
{
v = svm.svm_predict(modelx);
output.writeBytes(v+“\n“);
}
if(v == target)
++correct;
error += (v-target)*(v-target);
sumv += v;
sumy += target;
sumvv += v*v;
sumyy += target*target;
sumvy += v*target;
++total;
}
if(svm_type == svm_parameter.EPSILON_SVR ||
svm_type == svm_parameter.NU_SVR)
{
svm_predict.info(“Mean squared error = “+error/total+“ (regression)\n“);
svm_predict.info(“Squared correlation coefficient = “+
((total*sumvy-sumv*sumy)*(total*sumvy-sumv*sumy))/
((total*sumvv-sumv*sumv)*(total*sumyy-sumy*sumy))+
“ (regression)\n“);
}
else
svm_predict.info(“Accuracy = “
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2425 2013-12-29 22:31 .classpath
文件 383 2013-12-29 16:52 .fatjar
文件 390 2013-12-16 15:34 .project
目录 0 2013-12-17 11:50 .settings\
文件 598 2013-12-16 15:34 .settings\org.eclipse.jdt.core.prefs
文件 9720077 2013-12-31 14:36 Classification_fat.jar
文件 1042 2013-10-19 11:37 Configure.xm
目录 0 2013-12-30 21:37 Data\
文件 3520144 2013-10-19 11:37 Data\BiWord.big
文件 1696620 2013-10-19 11:37 Data\CoreDict.pdat
文件 1786424 2013-10-19 11:37 Data\CoreDict.pos
文件 478168 2013-10-19 11:37 Data\CoreDict.unig
文件 262236 2013-10-19 11:37 Data\FieldDict.pdat
文件 72 2013-10-19 11:37 Data\FieldDict.pos
文件 1978128 2013-10-19 11:37 Data\GranDict.pdat
文件 1778776 2013-10-19 11:37 Data\GranDict.pos
文件 37253 2013-10-19 11:37 Data\ICTCLAS30.ctx
文件 288 2013-10-19 11:37 Data\ICTCLAS_First.map
文件 406 2013-10-19 11:37 Data\ICTPOS.map
文件 307 2013-10-19 11:37 Data\PKU.map
文件 288 2013-10-19 11:37 Data\PKU_First.map
文件 0 2013-12-30 21:37 Data\UserDict.map
文件 262560 2013-12-30 21:37 Data\UserDict.pdat
文件 524280 2013-10-19 11:37 Data\character.idx
文件 65540 2013-10-19 11:37 Data\character.type
文件 2213 2013-10-19 11:37 Data\nr.ctx
文件 3008 2013-10-19 11:37 Data\nr.fsa
文件 1757200 2013-10-19 11:37 Data\nr.role
文件 127 2013-12-31 16:27 ICTCLAS.log
文件 240640 2013-10-19 11:37 ICTCLAS50.dll
文件 9898 2013-10-19 11:37 ICTCLAS50.h
............此处省略161个文件信息
相关资源
- SVM学习笔记+伪码.pdf
- 基于hog+pca+svm行人检测源码
- 机器学习-Hog+SVM小狮子识别.zip
- VMware Remote Console 10.0.3 for WindowsVMware
- 网易文本分类数据 - 好东西
- 卡方特征词选择法选取1000个特征词
- 自己训练SVM分类器进行HOG行人检测
- hog+svm性别识别源码
- opencv SVM训练检测车牌
- RNN 文本分类
- 车牌识别-opencv
- 基于HAAR特征SVM分类器训练模型,包含
- 基于HOG特征与SVM的车辆检测方法研究
- LBP/HOG/SIFT/SURF特征SVM的trainAuto范例
- opencv SVM图分类训练图片和测试图片
- CRF,LSTM,最大后向匹配法实现中文分
- NLP小白入门——超全中文文本分类系
- 基于weka的文本分类器
- VS2013+opencv2.4.10提取SURF_BOW特征使用s
- VS2013+OpenCV2.4.10提取傅里叶描述子特征
- VS2013+OPENCV2.4.10 提取HOG特征使用SVM多分
- 情感识别的特征提取与与分类
- 车牌识别系统opencv版
- 中文文本分类语料由复旦大学李荣陆
- 中文文本分类语料-测试集
- SVM源代码和测试图片
- hog+svm行人检测分类器训练
- 手势识别代码上,下,左,右
- svm-车牌识别正负样本
- 基于Gabor+PCA+SVM的性别识别(3)
评论
共有 条评论