资源简介



【核心代码】

代码片段和文件信息

def valueFilter(fname1fname2):  #fname1为输入文件,fname2为临时文件输出
    f1 = open(fname1‘r‘)
    f2 = open(fname2‘w‘)
    for line in f1 :
        if line.find(‘?‘)== -1 :  #过滤掉有‘?’的数据
            l1 = line.replace(‘>50K‘‘1‘)  #将类别标签改为0和1
            l2 = l1.replace(‘<=50K‘‘0‘)
            newLine = l2.replace(‘ ‘ ‘‘)  #过滤空格
            f2.write(newLine)
    f1.close()
    f2.close()


def loadDataSet(fname):  #读取文件,形成数据集
    dataSet = []
    f = open(fname‘r‘)
    for line in f :
        line = line.strip(‘\n‘).split(‘‘)
        dataSet.append(line)
    return dataSet

def charaFilter(dataSet):  #删除部分不容易处理的特征(本例删除数值型数据)
    import numpy
    import random
    dataMat = numpy.mat(dataSet)
    m = numpy.shape(dataMat)[0]
    dataSet_new = []
    for i in range(m):

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      68395  2016-05-22 18:04  贝叶斯和KNN算法比较——基于Adult数据集\1.txt

     文件       4500  2016-05-22 22:20  贝叶斯和KNN算法比较——基于Adult数据集\bayes.py

     文件       2271  2016-05-22 20:37  贝叶斯和KNN算法比较——基于Adult数据集\k=1.png

     文件       2203  2016-05-22 20:37  贝叶斯和KNN算法比较——基于Adult数据集\k=3.png

     文件       2279  2016-05-22 20:38  贝叶斯和KNN算法比较——基于Adult数据集\k=5.png

     文件       6624  2016-05-22 20:41  贝叶斯和KNN算法比较——基于Adult数据集\knn.py

     文件       2137  2016-05-22 20:47  贝叶斯和KNN算法比较——基于Adult数据集\knn去掉非数值.png

     文件       1622  2016-05-22 20:17  贝叶斯和KNN算法比较——基于Adult数据集\原始.png

     文件       1543  2016-05-22 20:15  贝叶斯和KNN算法比较——基于Adult数据集\去掉部分特征.png

     文件       1287  2016-05-22 20:19  贝叶斯和KNN算法比较——基于Adult数据集\将判决条件改变.png

     文件       1247  2016-05-22 22:25  贝叶斯和KNN算法比较——基于Adult数据集\改变判断条件.png

     文件     125043  2016-05-22 22:59  贝叶斯和KNN算法比较——基于Adult数据集\朴素贝叶斯及应用.pptx

     文件       1489  2016-05-13 10:14  贝叶斯和KNN算法比较——基于Adult数据集\神奇的结果.png

     目录          0  2016-05-28 22:29  贝叶斯和KNN算法比较——基于Adult数据集

----------- ---------  ---------- -----  ----

               220640                    14


评论

共有 条评论