纠纷奇闻作文社交美文家庭
聚热点
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

大数据技术,mapreduce版的wordcount,对文。

8月12日 菩提门投稿
  java。io。IOE
  org。apache。hadoop。conf。C
  org。apache。hadoop。conf。C
  org。apache。hadoop。fs。FileS
  org。apache。hadoop。fs。P
  org。apache。hadoop。io。LongW
  org。apache。hadoop。io。T
  org。apache。hadoop。mapreduce。J
  org。apache。hadoop。mapreduce。M
  org。apache。hadoop。mapreduce。R
  org。apache。hadoop。mapreduce。lib。input。FileInputF
  org。apache。hadoop。mapreduce。lib。output。FileOutputF
  org。apache。hadoop。util。T
  org。apache。hadoop。util。ToolR
  WordCCTool{
  
  对文本文件进行Wordcount,文本文件的输入类型是TextInputF,它实现了createRecordReader,
  返回创建的LineRecordR实现类,这个类里就有对应的key和value的类型
  
  文本文件
  KEYIN:行字节偏移量
  VALUEIN:一行数据
  
  mapper的输入类型是由业务需求来自行确定类型,跟框架没关系,因为我们的需求是按照单词统计数量
  
  key:单词,String类型的封装类Text
  value:数值,Long类型的封装类LongWritable
  
  
  WordCountMMapper{
  ZZ
  map(),一行调用一次
  Override
  map(LongWkey,Tvalue,Ccontext)
  IOException,InterruptedE{
  Svalue。toString();
  System。out。println(map():keyIn:key。get();valueIn:value。toString());
  String〔〕line。split();
  for(S:splits){
  keyOut。set(word);
  map()输出数据,用context。write()
  context。write(keyOut,valueOut);
  System。out。println(map():keyOut:keyOut。toString();valueOut:valueOut。get());
  }
  }
  }
  
  KEYIN,VALUEIN:根据map输出的类型来确定
  KEYOUT,VALUEOUT:根据业务需求确定
  KEYOUT是单词,S类型的封装类Text
  VALUEOUT数值,Long类型的封装类LongWritable
  
  
  WordCountRReducer{
  LongWvalueOLongWritable();
  一个key调用一次
  Override
  reduce(Tkey,Ivalues,Ccontext)IOException,InterruptedE{
  StringBStringBuilder();
  sb。append(reduce():keyIn:key。toString();vlaueIn:〔);
  0;
  for(LongW:values){
  通过get(),获取LongW对象的实际值
  w。get();
  
  sb。append(num)。append(,);
  }
  sb。deleteCharAt(sb。length()1);
  sb。append(〕);
  System。out。println(sb。toString());
  valueOut。set(sum);
  context。write(key,valueOut);
  }
  }
  Override
  run(String〔〕args)E{
  创建及配置,提交任务
  CgetConf();
  创建job对象
  JJob。getInstance(conf,);
  任务运行类
  job。setJarByClass(WordCount。class);
  任务map运行类
  job。setMapperClass(WordCountMapper。class);
  任务运行类
  job。setReducerClass(WordCountReducer。class);
  任务map阶段输出的key的类型
  job。setMapOutputKeyClass(Text。class);
  任务map阶段输出的value类型
  job。setMapOutputValueClass(LongWritable。class);
  任务reduce阶段(最后阶段)输出的key的类型
  job。setOutputKeyClass(Text。class);
  任务reduce阶段(最后阶段)输出的value的类型
  job。setOutputValueClass(LongWritable。class);
  设置reduce个数
  job。setNumReduceTasks(2);
  任务的输入目录
  FileInputFormat。addInputPath(job,Path(args〔0〕));
  PoutputPPath(args〔1〕);
  任务的输出目录
  FileOutputFormat。setOutputPath(job,outputPath);
  解决自动删除输出目录
  FileSFileSystem。get(conf);
  判断文件系统下存不存在该目录,如果存在删除
  if(fs。exists(outputPath)){
  递归删除
  fs。delete(outputPath,true);
  System。out。println(dir:outputPath。toString()SUCCESS!);
  }
  提交任务
  waitForCompletion(false);false:代表不输出counter
  job。waitForCompletion(false);
  ?0:1;
  }
  main(String〔〕args)E{
  运行时将输入输出目录放到执行参数里,用main()的接收到
  tmpoutput
  System。exit(ToolRunner。run(WordCount(),args));
  }
  }
投诉 评论 转载

【阿里云系列】您的对象存储OSS预售资源包套。。。讲解对象:【阿里云系列】您的对象存储OSS预售资源包套餐OSSBAG,将在7天内到期作者:融水公子rsgz文章出处:360doc个人图书馆〔其他平台均为盗版〕nbs……在抖音上做广告有用吗?抖音上广告效果怎么。。。抖音是头条主打出品的一款短视频app,如同刷抖音已变成了老老少少的一种生涯情趣了,无比是每一次复旧都是为用户展现新的海报內容,这一点让用户的感想感觉很好。那麼,在抖音上做海报有……抖音打广告怎么收费?抖音官方广告怎么收费?抖音现在差错常火的一个APP服务平台,无所不在没人不明晰它的存有。因为,抖音是一款以歌曲为背景图,有艺术创意、有闪亮点的短视频服务平台,它占有强劲的散播度和微妙的转换率,抖音里……大数据技术,mapreduce版的wordcount,对文。java。io。IOEorg。apache。hadoop。conf。Cimpo……使用类似搭积木的低代码开发方式进行SAPAPI。。。这是Jerry2020年的第41篇文章,也是汪子熙公众号总共第224篇原创文章。Jerry之前的文章SAPAPI开发方法大全介绍的第七种SAPAPI开……这个简单的操作,能让你拥有最高级的享受。你所期待的,定会如期而至。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。哈喽,大家晚上好呀,进入今晚主题,对于电脑这个工具,很多……抖音作品数量与实际数量不符,抖音显示7个作。。。抖音是一款很流行的短视频APP,基本上很多人都在玩。但很多小伙伴说自己创作了作品数量上显示和自己看的的数量不一样,这是怎么一回事呢?还有小伙伴说自己作品上显示了7个,但自……【ai换脸系列】ai换脸的历史讲解对象:【ai换脸系列】ai换脸的历史作者:融水公子rsgz文章出处:360doc个人图书馆〔其他平台均为盗版〕提醒:建议大家电脑浏览我的网页,因……什么类型的抖音号好变现,抖音做什么领域更。。。很多小伙伴刚开始做抖音往往对于领域的选择特别的苦恼,不知道选什么比较好,觉得自己既没什么擅长的技能可以分享,对于做视频也没什么经验,就随便选择一个领域,导致后面很难涨粉和变现。……【Anaconda系列】如何安装Anaconda讲解对象:【Anaconda系列】如何安装Anaconda作者:融水公子rsgz文章出处:360doc个人图书馆〔其他平台均为盗版〕提醒:建议大家电……抖音作品数量与动态量不一样,抖音里动态比。。。抖音作品数量与动态量不一样,抖音里动态比作品多怎么回事日常生活、办公中,有时候会用到抖音,但有些小伙伴说自己的抖音动态和作品不同步?这是为什么呢?首先作品是自己发布……【Colab系列】colab可以与多个人共享作者:融水公子rsgz文章出处:360doc个人图书馆〔其他平台均为盗版〕提醒:建议大家电脑浏览我的网页,因为手机浏览网页代码会自动缩成一行,很不方便……
【linux系列】echon和echoe比较SAPAPI开发方法大全〔AHK〕报无效类字符串的问题【Colab系列】系统命令大全【Colab系列】怎么修改colab文件名称【Colab系列】使用python抖音封面怎么设置能吸引人呢?抖音增加点击量。。。第10章节:让我们来深入了解一下WMNCCALCSI。。。6000万牵手抖音,罗永浩,IP与红人成直播电。。。抖音运营有什么方法和技巧,三年实战经验运。。。抖音全攻略:抖音新手0基础打造爆款账号,轻。。。抖音干货分享,从零基础小白到网红大咖教程
焦点分析阿里女员工被侵犯,零售业何以成为性贿赂和腐败重灾区?疫情下学位论文的问题写荷花品质的小学作文笔试整理产品经理校招笔试39题书法大家《七色花》热博聚热点网 小班游戏室内教案大醉歌世界十大最强食肉动物大白鲨寿命可达年或更长重婚离婚起诉书怎么写?雍正王朝八爷树大根深,又财大气粗,为何还是败给了孤臣?英语六级听力对话两种题型应试技巧

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形