资源简介
大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark的内存模型特点,执行速度快。该文研究了Spark中的机器学习中的聚类算法KMeans,先分析了算法思想,再通过实验分析其应用的方法,然后通过实验结果分析其应用场景和不足。
代码片段和文件信息
- 上一篇:commvault备份系统基本原理.zip
- 下一篇:数字电路复习资料
相关资源
- 北京大学网络大数据管理与应用大作
- TensorFlow+on+Yarn:深度学习遇上大数据
- 麦肯锡关于大数据的预测报告
- 本科大数据课程作业 简单的知乎用户
- Spark快速大数据分析
- 大数据和深度学习
- 美团点评旅游推荐系统的演进.pdf
- 联通公司基于用户画像的大数据挖掘
- 1万个点数据的地图展示
- CDN试验床实施指南
- 大数据基本介绍ppt
- 大数据技术与经验分享
- 大数据技术基础林子雨
- Spark快速大数据分析高清带标签pdf+全
- PAAS平台问题知识库
- Spark快速大数据分析—中文版
- 重大数据挖掘往届试题
- 汽车行业大数据报告
- 《大数据技术基础》教材pdf
- Spark大数据处理 技术 应用与性能优化
- GIS三大数据模型层次,网状,关系
- CDH6离线安装 -
- 中科大数据挖掘作业 建立决策树
- 《Spark大数据处理 技术、应用与性能
- 生态链接阿里巴巴创新中心的智能硬
- 外卖行业下沉市场分析报告-极光大数
- 大数据介绍
- 先电大数据平台操作手册-XianDian-Big
- 电商数据分析平台的设计与实现-论文
- 196-信息安全技术大数据服务安全能力
评论
共有 条评论