• 大小: 2KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2022-06-20
  • 语言: Python
  • 标签: python  

资源简介

利用python进行聚类分析,适用于python3.7版本,经过实际例子验证。

资源截图

代码片段和文件信息

#-*- coding: utf-8 -*-
#使用K-Means算法聚类消费行为特征数据

import pandas as pd

#参数初始化
inputfile = ‘d:/Python/data/consumption_data.xls‘ #销量及其他属性数据
outputfile = ‘d:/Python/tmp/data_type.xls‘ #保存结果的文件名
k = 3 #聚类的类别
iteration = 500 #聚类最大循环次数
data = pd.read_excel(inputfile index_col = ‘Id‘) #读取数据
data_zs = 1.0*(data - data.mean())/data.std() #数据标准化

from sklearn.cluster import KMeans
model = KMeans(n_clusters = k n_jobs = 4 max_iter = iteration) #分为k类,并发数4
model.fit(data_zs) #开始聚类

#简单打印结果
r1 = pd.Series(model.labels_).value_counts() #统计各个类别的数目
r2 = pd.Dataframe(model.cluster_centers_) #找出聚类中心
r = pd.concat([r2 r1] axis = 1) #横向连接(0是纵向),得到聚类中心对应的类别下的数目
r.columns = list(data.columns) + 

评论

共有 条评论