资源简介
kaggle-美国人口普查年收入比赛,随机森林Python版本有很可以调用的库,使用随机森林非常方便,主要用到以下的库:
sklearn
pandas
numpy
代码片段和文件信息
# 本程序参考网页:
# https://blog.csdn.net/randompeople/article/details/81429264
# 数据已包含在同名文件夹中,且在上述网页中可以找到下载链接。
# 王磊-中国石油大学(北京) 2019-3-4 18:19:16
# coding: utf-8
# In[9]:
import pandas as pd # load csv‘s (pd.read_csv)
import numpy as np # math (lin. algebra)
import sklearn as skl # machine learning
from sklearn.ensemble import RandomForestClassifier
#from plotnine import *
import matplotlib.pyplot as plt
from sklearn.preprocessing import LabelEncoder
from sklearn_pandas import DataframeMapper
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report
# In[10]:
def get_train_data():
#下面两个文件路径替换为你电脑上该文件的路径
train_path = “D:/workspace/Data/kggal/AmericaIncome/adult.data“
test_path = ‘D:/workspace/Data/kggal/AmericaIncome/adult.test‘
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2019-03-04 18:17 kaggle-2-American_population_income_prediction\AmericaIncome\
文件 3974305 2019-03-04 17:00 kaggle-2-American_population_income_prediction\AmericaIncome\adult.data
文件 5229 2019-03-04 17:00 kaggle-2-American_population_income_prediction\AmericaIncome\adult.names
文件 2003153 2019-03-04 17:00 kaggle-2-American_population_income_prediction\AmericaIncome\adult.test
文件 4267 2019-03-04 17:00 kaggle-2-American_population_income_prediction\AmericaIncome\old.adult.names
文件 3655 2019-03-04 18:19 kaggle-2-American_population_income_prediction\American_population_income_prediction.py
目录 0 2019-03-04 18:17 kaggle-2-American_population_income_prediction\
评论
共有 条评论