• 大小: 5KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-08
  • 语言: Python
  • 标签: ID3算法  id3代码  

资源简介

ID3算法Python代码和数据集

资源截图

代码片段和文件信息

#-*- coding: utf-8 -*-
#使用ID3决策树算法预测销量高低
import pandas as pd

#参数初始化
inputfile = ‘G:/code/data/sales_data.xls‘
data = pd.read_excel(inputfile index_col = u‘序号‘) #导入数据

#类别标签‘好’,‘是’,‘高’ 赋值为1,其他为-1
data[data == u‘好‘] = 1
data[data == u‘是‘] = 1
data[data == u‘高‘] = 1
data[data != 1] = -1
x = data.iloc[::3].as_matrix().astype(int)#把数据中的前三列数据赋给x
y = data.iloc[:3].as_matrix().astype(int)#目标数据赋给y
print(y)
print(x)
from sklearn.tree import DecisionTreeClassifier as DTC
dtc = DTC(criterion=‘entropy‘) #建立基于信息熵的决策树模型
dtc.fit(x y) #训练模型

#导入相关函数,可视化决策树
#导出dot文件,利用Graphviz转换为pdf或者png
from sklearn.tree import export_graphviz
x = pd.Dataframe(x)
from sklearn.externals.six import StringIO
x = pd.Dataframe(x)
with open(“tree.dot“ ‘w‘) as f:
  f = export_graphviz(dtc featur

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      27136  2015-12-05 21:05  sales_data.xls

     文件       1057  2017-06-26 11:09  decision_tree.py

----------- ---------  ---------- -----  ----

                28193                    2


评论

共有 条评论