hadoop中mapred.tasktracker.map.tasks.maximum的设置

时间：2023-09-20 12:05:07浏览次数：51

标签：map tasks mapred hadoop maximum tasktracker

目前，我们邮件的一部分log已经迁移到Hadoop集群上

并由Hive来执行相关的查询

hadoop中默认的mapred.tasktracker.map.tasks.maximum设置是2

也即：每一个tasktracker同时运行的map任务数为2

照此默认设置，查询80天某用户的操作日志，耗时5mins, 45sec

经过测试，发现将mapred.tasktracker.map.tasks.maximum设置为节点的cpu cores数目或者数目减1比较合适

此时的运行效率最高，大概花费3mins, 25sec

我们现在的机器都是8核的，所以最终配置如下：

<property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>8</value>
    <description>The maximum number of map tasks that will be run
    simultaneously by a task tracker.
    </description>
</property>

而对于mapred.map.tasks（每个job的map任务数）值，hadoop默认值也为2

可以在执行hive前，通过set mapred.map.tasks=24来设定

但由于使用hive，会操作多个input文件，所以hive默认会把map的任务数设置成输入的文件数目

即使你通过set设置了数目，也不起作用…

标签：map,tasks,mapred,hadoop,maximum,tasktracker
From： https://blog.51cto.com/u_16255870/7535840

实现mapreduce多文件自定义输出
普通maprduce中通常是有map和reduce两个阶段，在不做设置的情况下，计算结果会以part-000*输出成多个文件，并且输出的文件数量和reduce数量一样，文件内容格式也不能随心所欲。这样不利于后续结果处理。如果只是想做到输出结果的文件名可控，实现自己的LogNameMultipleTextOutputFormat类，......
java将map的key转为大写
普通的stream流，toMap方法会调用merge方法，该方法如果value传值为null的时候，会报空指针异常，因此直接使用collect()方法进行规约操作publicstaticvoidmain(String[]args){Map<String,String>testMap=newHashMap<>();testMap.put("apple",null);testMap.put("......
化腐朽为神奇的QueryMapping
化腐朽为神奇的QueryMapping老车除了报废没别的方法？应用系统就像老车，经过十几二十年的使用，积累了大量里程数据，但是英雄迟暮，反应迟钝，时不时还要病休。但就这样报废，推到重来，如果没有充足的预算，实在是下不了这个决心，不知道该怎么办，让这辆老车焕发第二春。人们习惯，难以改变缓慢的......
9-TaskSet测试任务集
TaskSet官方介绍：ClassdefiningasetoftasksthataUserwillexecute.也就是一个把多个task集合起来的一个类，集合内的task的用法与在user类中的并没有多大差异，例如：fromlocustimportTaskSet,task,FastHttpUserclassMyTask1(TaskSet):@taskdeftask_001......
10-SequentialTaskset有顺序的测试任务集
SequentialTaskSet有顺序的任务集顾名思义，集合内的task是由上到下按顺序执行的，例如：fromlocustimportSequentialTaskSet,task,FastHttpUserclassMySTS(SequentialTaskSet):@taskdefstep_01(self):print(1)@taskdefstep_02(self):......
KdMapper扩展实现之LG(LHA.sys)
1.背景 KdMapper是一个利用intel的驱动漏洞可以无痕的加载未经签名的驱动，本文是利用其它漏洞（参考《【转载】利用签名驱动漏洞加载未签名驱动》）做相应的修改以实现类似功能。需要大家对KdMapper的代码有一定了解。 2.驱动信息驱动名称LHA.sys 时间戳5C255B03......
位图(bitmap)原理以及实现
大家好，我是蓝胖子，我一直相信编程是一门实践性的技术，其中算法也不例外，初学者可能往往对它可望而不可及，觉得很难，学了又忘，忘其实是由于没有真正搞懂算法的应用场景，所以我准备出一个系列，囊括我们在日常开发中常用的算法，并结合实际的应用场景，真正的感受算法的魅力。今天，我们就来学习......
MyBatis中 Mapper.xml 文件
resources目录下新建文件夹mapper（个人习惯全路径与Mapper类对应） <?xmlversion="1.0"encoding="UTF-8"?><!DOCTYPEmapperPUBLIC"-//mybatis.org//DTDMapper3.0//EN""http://mybatis.org/dtd/mybatis-3-mapper.dtd......
map-key 排序对比
publicstaticMap<String,List<TPricePpiBaseWeight>>sortMapByKey(Map<String,List<TPricePpiBaseWeight>>map){if(map==null||map.isEmpty()){returnnull;}Map<String,List<TPricePpi......
关于一个BitMap的算法理解
最近在看算法，想学习一下算法这玩意，虽然工作中很少用到。在《小灰的算法之旅》这本书中，有一个关于BitMap的算法。早期接触过一点类似的，有人在数据库里面保存了一个字符串 000000000000000000，000000000001000001，这种，每一位代表一个含义，比如第一位为1表示这个用户是上......

hadoop中mapred.tasktracker.map.tasks.maximum的设置

相关文章

赞助商

阅读排行