资源简介
ID3算法Python代码和数据集
代码片段和文件信息
#-*- coding: utf-8 -*-
#使用ID3决策树算法预测销量高低
import pandas as pd
#参数初始化
inputfile = ‘G:/code/data/sales_data.xls‘
data = pd.read_excel(inputfile index_col = u‘序号‘) #导入数据
#类别标签‘好’,‘是’,‘高’ 赋值为1,其他为-1
data[data == u‘好‘] = 1
data[data == u‘是‘] = 1
data[data == u‘高‘] = 1
data[data != 1] = -1
x = data.iloc[::3].as_matrix().astype(int)#把数据中的前三列数据赋给x
y = data.iloc[:3].as_matrix().astype(int)#目标数据赋给y
print(y)
print(x)
from sklearn.tree import DecisionTreeClassifier as DTC
dtc = DTC(criterion=‘entropy‘) #建立基于信息熵的决策树模型
dtc.fit(x y) #训练模型
#导入相关函数,可视化决策树
#导出dot文件,利用Graphviz转换为pdf或者png
from sklearn.tree import export_graphviz
x = pd.Dataframe(x)
from sklearn.externals.six import StringIO
x = pd.Dataframe(x)
with open(“tree.dot“ ‘w‘) as f:
f = export_graphviz(dtc featur
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 27136 2015-12-05 21:05 sales_data.xls
文件 1057 2017-06-26 11:09 decision_tree.py
----------- --------- ---------- ----- ----
28193 2
- 上一篇:中科大高级计算机网络实验2代码实验报告
- 下一篇:遗传算法python实现
评论
共有 条评论