• 大小: 176KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-06
  • 语言: Python
  • 标签:

资源简介

西电数据挖掘作业——对数据进行kmeans聚类python实现,使用的是python3版本,自己编写的,能够完美运行,里面有两个py文件,一个是主程序,一个是导入的算法,只需要运行主程序就行,数据啥的都准备好了

资源截图

代码片段和文件信息

import numpy as np
import pandas as pd

data = input(‘请输入文件名: ‘)
k = int(input(‘分类数 :‘))
n= int(input(‘循环次数: ‘))
‘‘‘
def getdata(data):
    with open(data) as f:
        data = []
        datalist = f.readlines()
        for each in datalist:
            each = each.strip().split(‘\t‘)
            each = list(map(floateach))
            data.append(each)

        data = np.array(data)
            
        return(data)
        ‘‘‘


def getdata(data):
    f = pd.read_csv(data)
    data =f.values
    truelabel = np.transpose([data[:-1]])
    newdata = np.delete(data-1axis = 1)
    
    return(newdata)

def dist(AB):
    return np.sqrt(np.sum(np.power(A - B 2)))

def randcent(datak):
    n = np.shape(data)[1]
    cent = np.zeros((kn))
    for j in r

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       3813  2017-10-22 11:29  kmeans均值data\KMeans.py

     文件     555497  2017-10-22 10:07  kmeans均值data\waveform.data

     目录          0  2018-03-13 14:51  kmeans均值data

----------- ---------  ---------- -----  ----

               559310                    3


评论

共有 条评论