-
大小: 176KB文件类型: .rar金币: 1下载: 0 次发布日期: 2021-01-06
- 语言: Python
- 标签:
资源简介
西电数据挖掘作业——对数据进行kmeans聚类python实现,使用的是python3版本,自己编写的,能够完美运行,里面有两个py文件,一个是主程序,一个是导入的算法,只需要运行主程序就行,数据啥的都准备好了
代码片段和文件信息
import numpy as np
import pandas as pd
data = input(‘请输入文件名: ‘)
k = int(input(‘分类数 :‘))
n= int(input(‘循环次数: ‘))
‘‘‘
def getdata(data):
with open(data) as f:
data = []
datalist = f.readlines()
for each in datalist:
each = each.strip().split(‘\t‘)
each = list(map(floateach))
data.append(each)
data = np.array(data)
return(data)
‘‘‘
def getdata(data):
f = pd.read_csv(data)
data =f.values
truelabel = np.transpose([data[:-1]])
newdata = np.delete(data-1axis = 1)
return(newdata)
def dist(AB):
return np.sqrt(np.sum(np.power(A - B 2)))
def randcent(datak):
n = np.shape(data)[1]
cent = np.zeros((kn))
for j in r
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 3813 2017-10-22 11:29 kmeans均值data\KMeans.py
文件 555497 2017-10-22 10:07 kmeans均值data\waveform.data
目录 0 2018-03-13 14:51 kmeans均值data
----------- --------- ---------- ----- ----
559310 3
评论
共有 条评论