首页 > 其他分享 >九月十一日

九月十一日

时间:2024-09-29 14:34:02浏览次数:8  
标签:IntWritable Text MapReduce 九月 context new 十一日 public

3. 使用 MapReduce 实现词频统计

概述

MapReduce 是 Hadoop 用于处理大规模数据的核心编程模型。本文将通过 MapReduce 代码实现简单的词频统计任务。

内容

MapReduce 工作原理:Mapper 和 Reducer

Hadoop 项目结构

MapReduce 程序代码

代码示例

public class WordCount { public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {  private final static IntWritable one = new IntWritable(1);  private Text word = new Text();  public void map(Object key, Text value, Context context) throws IOException, InterruptedException {  StringTokenizer itr = new StringTokenizer(value.toString());    while (itr.hasMoreTokens()) {       word.set(itr.nextToken());       context.write(word, one);          }        }        } public static class IntSumReducer extends Reducer<Text, IntWritable, Text, IntWritable> {        public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {          int sum = 0; for (IntWritable val : values) { sum += val.get();        } context.write(key, new IntWritable(sum)); } } }

标签:IntWritable,Text,MapReduce,九月,context,new,十一日,public
From: https://www.cnblogs.com/binglinll/p/18439713

相关文章

  • 九月二十八
    以下代码的输出结果是什么?intX=100;intY=200;System.out.println("X+Y="+X+Y);System.out.println(X+Y+"=X+Y");为什么会有这样的输出结果?输出结果是:X+Y=100200100200=X+Y出现这样的输出结果是因为在Java中,当多个值连接在一起时,会根据操作符的优先级进行计算。在第一......
  • 九月二十六
    在计算机系统中,整数的表示通常使用原码、反码或补码这三种形式。以下是这三种码的定义和使用场景:原码:原码是最直观的表示方法,其中第一位是符号位(0表示正数,1表示负数),其余位表示数值的绝对值。例如,整数5的原码是00000101,而-5的原码是1000101。反码:反码是为了简化减法运算而设计的......
  • 九月二十五
    在上面的代码中Sizes=Size.SMALL;:声明了一个Size类型的变量s,并将其初始化为枚举Size的SMALL常量。Sizet=Size.LARGE;:声明了一个Size类型的变量t,并将其初始化为枚举Size的LARGE常量。System.out.println(st);:比较两个枚举变量s和t是否引用同一个对象。由于它们引用不同的枚举......
  • 高一上九月下旬日记
    9.21闲话详见2024CSP-S游记9.21。做题纪要luoguP6329【模板】点分树|震波luoguP4093[HEOI2016/TJOI2016]序列luoguP3345[ZJOI2015]幻想乡战略游戏luoguP3241[HNOI2015]开店......
  • 九月
    arc131C考虑奇数情况,只有一个时先手必胜,设当前异或和为\(S\),必输的情况是\(\forallS\oplusa_i\ina\),这些数是一一对应的,但一共有奇数,此时先手必胜。偶数是,若第一回合无法结束游戏则变为后手,同上。E若一个点所有边颜色相同,包含该点的环便不可能三边颜色不同,转化为对......
  • 九月补题计划
    暑假模拟赛(尤其是后半段题目难度上升)改题效率很低很低,隧导致咕了很多题没改,现在准备把暑假模拟赛的题只要是赛时没AC的再重新做一做写写题解,所以开启这个“九月补题计划”,简称“9B计划”。(共27场模拟赛)目前进度:1/27。CSP提高19.10A.start200行的大模拟,没什么看头,......
  • 高一上九月中旬日记
    9.11闲话做题纪要9.12闲话做题纪要luoguP3806【模板】点分治1若边权都为\(1\),求出直径后判断即可。点分治板子。随意选择一个点作为根节点\(rt\),则所以完全位于当前其子树内的路径以是否经过\(rt\)分为两种。而经过\(rt\)的路径\(u\tov(u,v\nert)\)......
  • 九月做题记录
    都成老年选手了,能记点就记点吧。9.10BZOJ3786星际探索不知道为啥瞥见了这题题解,所以成了个玛丽题,跑出括号序后成区间问题,平衡树维护区间移动,加法。对于移动一段区间,平衡树需要维护节点内正的贡献数量,方便区间加法,然后区间移动的变化量要算清。点击查看代码#include<bits/s......
  • 九月十号人工智能
    一.搜索引擎1.引擎分为两种第一种:目录式分类搜索引擎。过程比较复杂,不容易找到想要的信息。第二种:全文检索搜索引擎(关键词搜索)。准确率比较高,信息易于提取2.搜索指令使用filetype指令可以查询特定格式的文件,比如doc\txt\ppt\pdf,搜索格式为:关健词:空格+filetype-+文件格式使用......
  • 九月九日
    今天在课堂上主要检查了hadoop和数据库的安装,而且我的都安装好了,没有出现问题,应该说都解决了。Hadoop、‌ZooKeeper和HBase的启动与关闭顺序如下:‌‌启动顺序‌:‌‌启动Hadoop‌:‌首先启动Hadoop集群,‌包括HDFS和YARN等组件。‌这通常涉及在master节点上运行start-dfs.sh和star......