资源简介
资源包含了大数据挖掘经典算法,譬如Apriori,KNN,神经网络算法等
代码片段和文件信息
package apriori;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.TreeSet;
public class AprioriAlgorithm {
private int minSup;
private static List data;
private static List> dataSet;
public static void main(String[] args) {
long startTime = System.currentTimeMillis();
AprioriAlgorithm apriori = new AprioriAlgorithm();
//使用书中的测试集
data = apriori.buildData();
//设置最小支持度
apriori.setMinSup(2);
//构造数据集
data = apriori.buildData();
//构造频繁1项集
List> f1Set = apriori.findF1Item(data);
apriori.printSet(f1Set 1);
List> result = f1Set;
int i = 2;
do{
result = apriori.arioriGen(result);
apriori.printSet(result i);
i++;
}while(result.size() != 0);
long endTime = System.currentTimeMillis();
System.out.println(“共用时: “ + (endTime - startTime) + “ms“);
}
public void setMinSup(int minSup){
this.minSup = minSup;
}
/**
* 构造原始数据集,可以为之提供参数,也可以不提供
* 如果不提供参数,将按程序默认构造的数据集
* 如果提供参数为文件名,则使用文件中的数据集
*/
List buildData(String...fileName){
List data = new ArrayList();
if(fileName.length != 0){
File file = new File(fileName[0]);
try{
BufferedReader reader = new BufferedReader(new FileReader(file));
String line;
while( ( line = reader.readLine()) != null ){
data.add(line);
}
}catch (FileNotFoundException e){
e.printStackTrace();
}catch (IOException e){
e.printStackTrace();
}
}else{
data.add(“I1 I2 I5“);
data.add(“I2 I4“);
data.add(“I2 I3“);
data.add(“I1 I2 T4“);
data.add(“I1 I3“);
data.add(“I2 I3“);
data.add(“I1 I3“);
data.add(“I1 I2 I3 I5“);
data.add(“I1 I2 I3“);
}
dataSet = new ArrayList>();
Set dSet;
for(String d : data){
dSet = new TreeSet();
String[] dArr = d.split(“ “);
for(String str : dArr){
dSet.add(str);
}
dataSet.add(dSet);
}
return data;
}
/**
* 找出候选1项集
* @param data
* @return result
*/
List> findF1Item(List data){
List> result = new ArrayList>();
Map dc = new HashMap();
for(String d : data){
String[] items = d.split(“ “);
for(String item : items){
if(dc.containsKey(item)) {
dc.put(item dc.get(item)+1);
}else{
dc.put(item 1);
}
}
}
Set itemKeys = dc.keySet();
Set tempKeys = new TreeSet();
for(String str : itemKeys){
tempKeys.add(str);
}
for(String item : tempKeys){
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 12274 2016-09-02 17:50 k_means\K-means算法运算结果图.jpg
文件 8079 2016-09-02 17:50 k_means\Kmeans.java
文件 989 2016-09-02 17:50 k_means\test.java
目录 0 2018-11-08 15:46 k_means
文件 1073 2016-09-02 17:46 kmedoids\Cluster.java
文件 2711 2016-09-02 17:46 kmedoids\ClusterAnalysis.java
文件 1458 2016-09-02 17:46 kmedoids\DataPoint.java
文件 3173 2016-09-02 17:46 kmedoids\K中心点算法运算结果.jpg
文件 1379 2016-09-02 17:46 kmedoids\Mediod.java
文件 1925 2016-09-02 17:46 kmedoids\TestMain.java
目录 0 2018-11-08 15:46 kmedoids
文件 481 2016-09-02 14:33 knn\input.txt
文件 3355 2016-09-01 10:57 knn\KNN.java
文件 801 2016-09-02 14:37 knn\KNNNode.java
文件 8001 2016-09-02 16:29 knn\knn运算结果.png
文件 196 2016-09-02 14:32 knn\test.txt
文件 1915 2016-09-02 14:37 knn\TestKNN.java
目录 0 2018-11-08 15:46 knn
文件 4385 2016-09-14 18:31 LogicRegression\linearRegressionAnalysis\LinearRegression.java
文件 6364 2016-09-02 16:30 LogicRegression\linearRegressionAnalysis\线性逻辑回归.png
目录 0 2018-11-08 15:46 LogicRegression\linearRegressionAnalysis
文件 260 2016-09-14 18:31 LogicRegression\multipleLinearRegressionAnalysis\DataPoint.java
文件 1525 2016-09-14 18:31 LogicRegression\multipleLinearRegressionAnalysis\LinearRegression.java
文件 4446 2016-09-14 18:31 LogicRegression\multipleLinearRegressionAnalysis\RegressionLine.java
文件 6711 2016-09-02 16:30 LogicRegression\multipleLinearRegressionAnalysis\多元线性回归.png
目录 0 2018-11-08 15:46 LogicRegression\multipleLinearRegressionAnalysis
目录 0 2018-11-08 15:46 LogicRegression
文件 17087 2016-09-02 14:46 randomforest\CARTTool.java
文件 4015 2016-09-02 14:46 randomforest\DecisionTree.java
文件 481 2016-09-02 14:33 randomforest\input.txt
............此处省略47个文件信息
- 上一篇:解决重启电量不显示,华硕fx50j 黑苹果电池驱动
- 下一篇:学生网页设计
评论
共有 条评论