资源简介
决策树对于数据分类的Python实现,测试集和训练集分别给出,而且数据已经处理好的,
代码片段和文件信息
import os
import sys
import logging
import pandas as pd
train_file = os.path.join(“data““train.csv“)
test_file = os.path.join(“data““test.csv“)
train_df = pd.read_csv(train_filesep=““header = 0quoting = 3)
X_train=train_df.iloc[:1:]
y_train=train_df.iloc[::1]
test_df=pd.read_csv(test_filesep=‘‘header=0quoting=3)
X_test=test_df.iloc[::]
from sklearn.ensemble import RandomForestClassifier
clf=RandomForestClassifier(n_estimators=100)
clf.fit(X_trainy_train)
y_pred=clf.predict(X_test)
print(y_pred)
with open(os.path.join(‘random_forest.csv‘)‘w‘) as my_file:
my_file.write(‘ImageidLabel\n‘)
for i in range(len(y_pred)):
my_file.write(‘%d%d\n‘%(iy_pred[i]))
print(‘save‘)
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-05-15 17:31 随机森林的应用\
文件 745 2018-04-19 10:42 随机森林的应用\redom_forest.py
文件 51118296 2018-04-12 09:37 随机森林的应用\test.csv
文件 76775041 2018-04-12 09:37 随机森林的应用\train.csv
评论
共有 条评论