资源简介

使用逻辑回归对iris数据集进行分类,只选取了前2种花的部分样本。java实现。

资源截图

代码片段和文件信息

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.util.ArrayList;
import java.util.List;
import java.util.Scanner;

/**
 * Created with IntelliJ IDEA.
 * User: Wangyu
 * Date: 10/13/16
 * Time: 16:28 
 * 将从文本读入的数据进行结构化处理
 * 
 */
public class DataSet {

    public static List readDataSet(String file) throws FileNotFoundException {
        List dataset = new ArrayList();
        Scanner scanner = new Scanner(new File(file));
        //按行读入
        while(scanner.hasNextLine()) {
            String line = scanner.nextLine();
            //第一行用于说明,不读取
            if (line.startsWith(“#“)) {
                continue;
            }
            //String[] columns = line.split(“\\s+“);
            String[] columns = line.split(““);//用逗号分割字符串
            // skip first column and last column is the label
            /*int i = 1;
            double[] data = new double[columns.length-2];
            for (i=1; i            int i = 0;//前面是数据,最后一列是标签
            double [] data = new double [columns.length - 1];
            for(i = 0;i < columns.length - 2;i++){
                //data[i-1] = Integer.parseInt(columns[i]);
             data[i] = Double.parseDouble(columns[i]);//将字符串转换成double
            }
            //int label = Integer.parseInt(columns[i]);
            int label = Integer.parseInt(columns[columns.length-1]);//将最后一列的标签转换成整数
            Instance instance = new Instance(label data);
            dataset.add(instance);
        }
        return dataset;
    }
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2016-10-14 11:52  LogRegression\
     文件         301  2016-10-13 14:12  LogRegression\.classpath
     文件         389  2016-10-13 14:12  LogRegression\.project
     目录           0  2016-10-14 11:52  LogRegression\.settings\
     文件         598  2016-10-13 14:12  LogRegression\.settings\org.eclipse.jdt.core.prefs
     文件          96  2012-06-28 09:53  LogRegression\README.md
     目录           0  2016-10-14 11:52  LogRegression\bin\
     文件        1677  2016-10-13 16:54  LogRegression\bin\DataSet.class
     文件         510  2016-10-13 16:54  LogRegression\bin\Instance.class
     文件        2883  2016-10-13 17:10  LogRegression\bin\Logistic.class
     文件        1015  2016-10-13 14:55  LogRegression\bin\iris.txt
     文件        1011  2016-10-13 16:32  LogRegression\iris.txt
     目录           0  2016-10-14 11:52  LogRegression\src\
     文件        1736  2016-10-13 16:54  LogRegression\src\DataSet.java
     文件         445  2016-10-13 16:54  LogRegression\src\Instance.java
     文件        2889  2016-10-13 17:10  LogRegression\src\Logistic.java
     文件        1015  2016-10-13 14:55  LogRegression\src\iris.txt

评论

共有 条评论

相关资源