资源简介
大数据的挖掘是当今的研究热点,也有着巨大的商业价值。新型框架Spark部署在Hadoop平台上,它的机器学习算法几乎可以完全替代传统的Mahout Map Reduce的编程模式,但由于Spark的内存模型特点,执行速度快。该文研究了Spark中的机器学习中的聚类算法KMeans,先分析了算法思想,再通过实验分析其应用的方法,然后通过实验结果分析其应用场景和不足。
代码片段和文件信息
- 上一篇:commvault备份系统基本原理.zip
- 下一篇:数字电路复习资料
相关资源
-
大数据。基于Hba
se的网站日志分析系 - 大数据中的云网络Cloud Networking for B
- 《Hadoop大数据技术》课程设计报告.
- 商业银行基于大数据的精准营销解决
- 梭子鱼负载均衡方案从容应对网络视
- 大数据在医疗行业的应用
- HP为八大行业容灾提供强大数据管理
- echarts大数据可视化新能源车联网综合
- 京东金融大数据分析平台总体架构
- 基于Greenplum Hadoop- 分布式平台的大数
- 深入理解大数据 大数据处理与编程实
- 用户网络行为画像 大数据中的用户网
- 企业级大数据平台构建:架构与实现
- 大数据的统计学基础
- 政府大数据公司设立意义及运营策略
- 国科大数据挖掘大作业2018交通拥堵预
- 赤裸裸的统计学 PDF
- 川大数据库系统(SSD6)历年考题、
- 全国耕地质量大数据平台
- 大数据的统计学基础视频教程
- 德勤Deloitte:汽车行业的大数据与分析
- 从大数据到智能制造
- 《互联网金融-大数据时代的金融革命
- hadoop技术内幕三件套
- 大数据工程师自学到精通最佳学习路
- 大数据之路:阿里巴巴大数据实践(
- 中国移动企业级省大数据平台技术规
- Presto技术内幕-高清-完整目录-2016年
- Hadoop技术内幕:深入解析YARN架构设计
- 2018第五届中国国际大数据大会演讲
评论
共有 条评论