资源简介
本次实战内容,将使用Logistic回归来预测患疝气病的马的存活问题。原始数据集下载地址:http://archive.ics.uci.edu/ml/datasets/Horse+Colic
这里的数据包含了368个样本和28个特征。这种病不一定源自马的肠胃问题,其他问题也可能引发马疝病。该数据集中包含了医院检测马疝病的一些指标,有的指标比较主观,有的指标难以测量,例如马的疼痛级别。另外需要说明的是,除了部分指标主观和难以测量外,该数据还存在一个问题,数据集中有30%的值是缺失的。
预处理数据做两件事:
如果测试集中一条数据的特征值已经确实,那么我们选择实数0来替换所有缺失值,因为本文使用
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 3790 2019-03-21 20:26 数据集\horseColicTest.txt
文件 60657 2019-03-21 20:33 数据集\horseColicTraining.txt
目录 0 2019-03-22 16:45 数据集
----------- --------- ---------- ----- ----
64447 3
----------- --------- ---------- ----- ----
文件 3790 2019-03-21 20:26 数据集\horseColicTest.txt
文件 60657 2019-03-21 20:33 数据集\horseColicTraining.txt
目录 0 2019-03-22 16:45 数据集
----------- --------- ---------- ----- ----
64447 3
评论
共有 条评论