资源简介
由于数据的记录,维护,处理和存储方式,大数据分析面临挑战。 我们证明了分层的,多元的统计机器学习算法,即增强回归树(BRT)可以解决大数据挑战以推动决策。 这项研究面临的挑战是缺乏互操作性,因为数据,GIS形状文件集合,遥感图像以及聚合和内插的时空信息都存储在整体硬件组件中。 对于建模过程,有必要创建一个公共输入文件。 通过将数据源合并在一起,创建了一个结构化但嘈杂的输入文件,该文件显示了不一致和冗余。 在此表明,BRT可以处理不同的数据粒度,异构数据和丢失。 特别是,BRT的优点是默认情况下允许通过区分是否缺失值以及缺失值来处理缺失数据。 最重要的是,BRT提供了多种关于结果解释的可能性,并且通过考虑使用变量在树中定义拆分的频率来自动执行变量选择。 与两个类似的回归模型(随机森林和最小绝对收缩和选择算子,LASSO)的比较表明,在这种情况下,BRT的性能优于后者。 BRT还可作为现实场景中复杂的层次建模的起点。 例如,可以使用现有模型来测试BRT的单一方法或整体方法,以改善各种数据驱动的决策和应用程序的结果。
代码片段和文件信息
相关资源
- 大数据数据分析案例
- 数据挖掘商品购物篮数据集
- Greenplum Hadoop分布式平台的大数据解决
- 国科大数值分析部分作业解答
- HIVE函数详解大全
- 西工大数据库实验报告3-2020
- 2020大数据面试题总汇
- 高分一、二号遥感数据预处理流程
- 《大数据处理技术》-实验指导书
- 深度学习之美AI时代的数据处理与最佳
- 三期视频网上买的,带课件,安装包
- ACA阿里云使用时间序列分解模型预测
- Apsara Clouder大数据技能认证:基于机器
- HCIA-bigdata题库更新时间-20200101.pdf
- 大数据安全管理指南
- 尚硅谷最新大数据培训视频
- hadoop-2.7.x.tar.gz
- 川大数据库考试试题
- 大数据_scala教程地址.txt
- 大数据报表项目建设方案
- Echarts结合百度地图实现省市区散点展
- 阿里云大数据ACA学习笔记.docx
- 大数据基础编程、实验和案例教程.
- 面向大数据挖掘的Hadoop框架K均值聚类
- 现代汉语常用汉字3000多字整理过的一
- 大数据传智播客最新视频
- 2019年大数据国赛试题
- 大数运算库gmp在vs2010环境下的配置
- 尚硅谷2018大数据全套
- 小牛大数据资源分享.txt
评论
共有 条评论