消费者组原理:
Consumer Group(CG):
消费者组,由多个consumer组成。形成一个消费者组的条件,使所有消费者的groupid相同。
• 消费者组内每个消费者负责消费不同分区的数据,一个分区只能由一个组内消费者消费。
• 消费者组之间互不影响。所有的消费者都属于某个消费者组,即消费者组是逻辑上的一个订阅者
消费者组初始化流程:
消费计划的制定:
生产者把数据发送给各个分区,每个broker节点都有一个coordinator(协调器),消费者组对分区进行消费,到底哪个消费者消费哪个分区呢?首先groupId对50取模,看最后的结果是哪个分区节点,假如是1分区,那么1分区的协调器就是本次消费者组的老大,消费者纷纷向该协调器进行注册,协调器从中随机选择一个消费者作为本次消费的Leader,然后把本次消费的具体情况发送给Leader,让其制定一个消费计划(就是哪个消费者消费哪个分区),然后Leader发送给协调器,协调器再进行群发,将计划公布,各个消费者按照这个计划进行消费。
消费者组详细消费流程:
假如本次抓取的数量是500条,大小超过了50M,那以50M为主。
因此,消费者组与分区数的关系如下:
- 消费者数小于分区数:每个消费者可能会消费多个分区。
- 消费者数等于分区数:每个消费者会消费一个唯一的分区,最优的负载均衡。
- 消费者数大于分区数:部分消费者会处于空闲状态,不会进行消费。