资源简介
在hadoop集群搭建完毕之后,可以对sougou.500w.utf数据进行分析处理,用MapReduce和Hive两种操作对所需要求的管理下得到想要看到的结果,下载压缩包里有源码,截图,文档及数据要求
代码片段和文件信息
package lkp;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class Eight {
public static int sum1 = 0;
public static int sum2 = 0;
public static class MyMapper extends Mapperject Text Text Text> {
@Override
protected void map(object key Text value Mapperject Text Text Text>.Context context)
throws IOException InterruptedException {
sum2++;
String[] str = value.toString().split(“\t“);
int rank = Integer.parseInt(str[3]);
if(rank<11)
{
sum1=sum1+1;
}
}
}
public static void main(String[] args) throws IOException ClassNotFoundException InterruptedException {
Configuration conf = new Configuration();
conf.set(“fs.defaultFS“ “hdfs://192.168.51.232:9000“);
Job job = Job.getInstance(conf “eight“);
job.setMapperClass(MyMapper.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
job.setJarByClass(Eight.class);
FileInputFormat.addInputPath(job new Path(“/lkp/MR/sogou.500w.utf8.flt“));
FileOutputFormat.setOutputPath(job new Path(“/lkp/Mr/eight“));
job.waitForCompletion(true);
System.out.println(“sum1=“+sum1+“\tsum2=“+sum2);
float percentage = (float)sum1/(float)sum2;
System.out.println(“Rank在10以内的点击次数占比:“ +percentage);
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-11-30 09:37 sougou.500w.utf8数据分析\
目录 0 2017-11-30 09:37 sougou.500w.utf8数据分析\java 代码\
文件 1649 2017-06-19 15:32 sougou.500w.utf8数据分析\java 代码\Eight.java
文件 3285 2017-06-19 15:31 sougou.500w.utf8数据分析\java 代码\Five.java
文件 2429 2017-06-19 16:31 sougou.500w.utf8数据分析\java 代码\Four.java
文件 3841 2017-06-21 15:25 sougou.500w.utf8数据分析\java 代码\Hba
文件 1816 2017-06-19 15:36 sougou.500w.utf8数据分析\java 代码\Nine.java
文件 1716 2017-06-19 16:00 sougou.500w.utf8数据分析\java 代码\One.java
文件 3775 2017-06-19 15:31 sougou.500w.utf8数据分析\java 代码\Seven.java
文件 3391 2017-06-19 15:31 sougou.500w.utf8数据分析\java 代码\Six.java
文件 2706 2017-06-21 09:52 sougou.500w.utf8数据分析\java 代码\Ten.java
文件 2493 2017-06-21 10:49 sougou.500w.utf8数据分析\java 代码\Three.java
文件 2385 2017-06-19 16:26 sougou.500w.utf8数据分析\java 代码\Two.java
文件 229 2017-06-22 16:27 sougou.500w.utf8数据分析\参考文献.txt
文件 1400582 2017-06-27 14:57 sougou.500w.utf8数据分析\分布式计算应用开发课程设计.docx
目录 0 2017-11-30 09:37 sougou.500w.utf8数据分析\截图\
文件 2411 2017-06-13 16:04 sougou.500w.utf8数据分析\截图\.sh.png
文件 55341 2017-06-14 18:08 sougou.500w.utf8数据分析\截图\1.png
文件 48954 2017-06-14 19:07 sougou.500w.utf8数据分析\截图\11.png
文件 59928 2017-06-14 18:08 sougou.500w.utf8数据分析\截图\2.png
文件 56593 2017-06-14 18:48 sougou.500w.utf8数据分析\截图\2用户.png
文件 36693 2017-06-16 16:54 sougou.500w.utf8数据分析\截图\five.png
文件 47305 2017-06-14 19:09 sougou.500w.utf8数据分析\截图\gong.png
文件 73107 2017-06-15 12:08 sougou.500w.utf8数据分析\截图\hba
文件 47443 2017-06-15 12:07 sougou.500w.utf8数据分析\截图\java.png
文件 53014 2017-06-19 11:44 sougou.500w.utf8数据分析\截图\javaeight.png
文件 34655 2017-06-19 11:32 sougou.500w.utf8数据分析\截图\javafour.png
文件 62406 2017-06-19 11:48 sougou.500w.utf8数据分析\截图\javanine.png
文件 55691 2017-06-19 11:23 sougou.500w.utf8数据分析\截图\javaone.png
文件 50419 2017-06-19 11:37 sougou.500w.utf8数据分析\截图\javasix.png
文件 50305 2017-06-19 11:51 sougou.500w.utf8数据分析\截图\javaten.png
............此处省略21个文件信息
- 上一篇:myeclipse破解文件
- 下一篇:希尔伯特-黄变换 工具箱非常好用
相关资源
- Google大数据三大经典论文(包含英文
- 谷歌DFS+Mapreduce+Bigtable三大论文中英文
- Google_GFS_MapReduce_BigTable三大论文英文原
- MapReduce数据分析实战
- hadoop相关的十几篇论文
- Hadoop+MapReduce实战手册+PDF电子书+带书
- MapReduce设计模式-中文-高清版PDF
- 源代码.rar
- MapReduce处理通过采集的气象数据分析
- 基于MapReduce实现决策树算法
- 基于Hadoop的商品推荐老师版
- BigTable;MapReduce;GFS英文论文
- 分布式文件系统-mapreduce-排序
- MapReduce数据统计简单
- mapreduce实战
- MapReduce下的k-means算法实验报告广工
- MapReduce字数统计案例
- 基于Apriori算法的频繁项集Hadoop mapre
- MapReduce maven工程WordCount
- KNN mapreduce实现
- hadoop MapReduce案例运营商关于用户基站
- 大数据 hadoop mapreduce 词频统计
- Google大数据三大经典论文
- 基于MapReduce的Apriori算法代码及其使用
- 基于MapReduce的Apriori算法代码
- PageRank算法的mapreduce实现
- Hadoop MapReduce实现tfidf源码
- windows64位平台的hadoop2.5.2插件包(ha
- MapReduce求解物流配送单源最短路径研
- 用MapReduce实现KMeans算法
评论
共有 条评论