首页 > 其他分享 >hadoop中mapred.tasktracker.map.tasks.maximum的设置

hadoop中mapred.tasktracker.map.tasks.maximum的设置

时间:2023-09-20 12:05:07浏览次数:37  
标签:map tasks mapred hadoop maximum tasktracker


目前,我们邮件的一部分log已经迁移到Hadoop集群上

并由Hive来执行相关的查询

hadoop中默认的mapred.tasktracker.map.tasks.maximum设置是2

也即:每一个tasktracker同时运行的map任务数为2

照此默认设置,查询80天某用户的操作日志,耗时5mins, 45sec

经过测试,发现将mapred.tasktracker.map.tasks.maximum设置为节点的cpu cores数目或者数目减1比较合适

此时的运行效率最高,大概花费3mins, 25sec

我们现在的机器都是8核的,所以最终配置如下:

<property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>8</value>
    <description>The maximum number of map tasks that will be run
    simultaneously by a task tracker.
    </description>
</property>

而对于mapred.map.tasks(每个job的map任务数)值,hadoop默认值也为2

可以在执行hive前,通过set mapred.map.tasks=24来设定

但由于使用hive,会操作多个input文件,所以hive默认会把map的任务数设置成输入的文件数目

即使你通过set设置了数目,也不起作用…

标签:map,tasks,mapred,hadoop,maximum,tasktracker
From: https://blog.51cto.com/u_16255870/7535840

相关文章

  • 实现mapreduce多文件自定义输出
     普通maprduce中通常是有map和reduce两个阶段,在不做设置的情况下,计算结果会以part-000*输出成多个文件,并且输出的文件数量和reduce数量一样,文件内容格式也不能随心所欲。这样不利于后续结果处理。如果只是想做到输出结果的文件名可控,实现自己的LogNameMultipleTextOutputFormat类,......
  • java将map的key转为大写
    普通的stream流,toMap方法会调用merge方法,该方法如果value传值为null的时候,会报空指针异常,因此直接使用collect()方法进行规约操作publicstaticvoidmain(String[]args){Map<String,String>testMap=newHashMap<>();testMap.put("apple",null);testMap.put("......
  • 化腐朽为神奇的QueryMapping
    化腐朽为神奇的QueryMapping老车除了报废没别的方法?应用系统就像老车,经过十几二十年的使用,积累了大量里程数据,但是英雄迟暮,反应迟钝,时不时还要病休。但就这样报废,推到重来,如果没有充足的预算,实在是下不了这个决心,不知道该怎么办,让这辆老车焕发第二春。人们习惯,难以改变缓慢的......
  • 9-TaskSet测试任务集
    TaskSet官方介绍:ClassdefiningasetoftasksthataUserwillexecute.也就是一个把多个task集合起来的一个类,集合内的task的用法与在user类中的并没有多大差异,例如:fromlocustimportTaskSet,task,FastHttpUserclassMyTask1(TaskSet):@taskdeftask_001......
  • 10-SequentialTaskset有顺序的测试任务集
    SequentialTaskSet有顺序的任务集顾名思义,集合内的task是由上到下按顺序执行的,例如:fromlocustimportSequentialTaskSet,task,FastHttpUserclassMySTS(SequentialTaskSet):@taskdefstep_01(self):print(1)@taskdefstep_02(self):......
  • KdMapper扩展实现之LG(LHA.sys)
    1.背景  KdMapper是一个利用intel的驱动漏洞可以无痕的加载未经签名的驱动,本文是利用其它漏洞(参考《【转载】利用签名驱动漏洞加载未签名驱动》)做相应的修改以实现类似功能。需要大家对KdMapper的代码有一定了解。 2.驱动信息 驱动名称LHA.sys 时间戳5C255B03......
  • 位图(bitmap)原理以及实现
    大家好,我是蓝胖子,我一直相信编程是一门实践性的技术,其中算法也不例外,初学者可能往往对它可望而不可及,觉得很难,学了又忘,忘其实是由于没有真正搞懂算法的应用场景,所以我准备出一个系列,囊括我们在日常开发中常用的算法,并结合实际的应用场景,真正的感受算法的魅力。今天,我们就来学习......
  • MyBatis中 Mapper.xml 文件
     resources目录下新建文件夹mapper(个人习惯全路径与Mapper类对应) <?xmlversion="1.0"encoding="UTF-8"?><!DOCTYPEmapperPUBLIC"-//mybatis.org//DTDMapper3.0//EN""http://mybatis.org/dtd/mybatis-3-mapper.dtd......
  • map-key 排序对比
    publicstaticMap<String,List<TPricePpiBaseWeight>>sortMapByKey(Map<String,List<TPricePpiBaseWeight>>map){if(map==null||map.isEmpty()){returnnull;}Map<String,List<TPricePpi......
  • 关于一个BitMap的算法理解
      最近在看算法,想学习一下算法这玩意,虽然工作中很少用到。在《小灰的算法之旅》这本书中,有一个关于BitMap的算法。  早期接触过一点类似的,有人在数据库里面保存了一个字符串  000000000000000000,000000000001000001,这种,每一位代表一个含义,比如第一位为1表示这个用户是上......