资源简介
包含数据分析和数据挖掘的学习代码和实战代码
本项目很多内容属于边学边试。参考了书籍,但是很多代码存在过时和错误均被我修改。
数据挖掘是最近几年才出现的一个名词,其归根到底的目的就是经过一系列手段处理数据得到一个适合的建模数据,利用建模数据建立模型挖掘已有数据的隐含价值。
一般步骤(详细内容子目录有叙述,且后面的实战项目我会严格按照这个步骤进行)
数据获取
利用各种手段获取数据,数据样式不限制,但一般而言是形如excel或者csv这样的表格格式。
数据探索
对数据进行初步探索,得到数据特征(如每一列的平均值,分位数,最大最小值,空值数目)。
数据预处理
毫不夸张,这是整个数据挖掘过程中最费时间的部分。对原始数据进行处理,得到合适的建模数据(如处理异常值,属性规约,数据清洗,数据变换,数据标准化)。
数据挖掘建模
如果任务明确,模型的选择是指定的,但是算法的优化,准确率的考究等是需要处理的。(如分类预测、关联规则获取。
后续处理
一般是指模型的实际应用。
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 0 2020-07-23 01:26 鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?
文件 63744343 2020-07-23 01:24 鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?DataMining-master.zip
文件 520 2020-07-23 01:24 __MACOSX\鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?._DataMining-master.zip
----------- --------- ---------- ----- ----
文件 0 2020-07-23 01:26 鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?
文件 63744343 2020-07-23 01:24 鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?DataMining-master.zip
文件 520 2020-07-23 01:24 __MACOSX\鍖呭惈鏁版嵁鍒嗘瀽鍜屾暟鎹寲鎺樼殑瀛︿範浠g爜鍜屽疄鎴樹唬鐮?._DataMining-master.zip
相关资源
- 数据库设计入门经典 中文完整版
- USACO翻译及题解及数据.rar
- 21个二线城市建筑物轮廓和楼层数据
- 排课系统数据库设计
- 用户评论情感分析数据集细粒度收集
- UDP接收赛车类游戏数据
- 自动生成excel表,并将生成的数据以邮
- 开源大数据引擎:分布式Greenplum数据
- 数据挖掘原理与SPSS+Clementine应用宝典
- mini版imagenet数据集
- apache-hive-1.2.1-bin.tar.gz
- 数据仓库与数据挖掘 - 陈志泊
- 高光谱/遥感图像常用数据集2
- 火车头软件V7.6企业版_破解淘宝等数据
- 中科院亚洲人人脸数据集[计算机视觉
- 全国基础地理数据库2017版
- Hadoop+Spark大数据巨量分析与机器学习
- cifar10经典数据集
- 湖南工业大学大型数据库应用历年试
- POPGENE32及SSR共显性数据分析相关教程
- 高清完整版 数据库索引设计与优化
- 全国县道矢量地图数据
- pygame-飞机大战.py
- 数据库课程设计-考勤信息管理系统
- CartoonGAN的动漫数据集
- 中文文本分类语料复旦完整版
- ENVI遥感图像处理方法(邓书斌)电子
- 康奈尔影评数据集
- 激光雷达数据.las格式
- 复杂数据统计方法-基于R应用第三版
评论
共有 条评论