刚才主要讲的是存储的内容,主要的index和.log两个文件。
kafka的生产者:有个分区策略:
分区的原因:
1、可以以partition为单位进行读写
2、提高集群的负载能力。生产者分区的原则:
可以在生产数据的时候,
1、指定分区号,指定将来这条消息进入到哪个分区。
2、当然,也可以不指定分区号,但是又KV键值对。是按照key的hash值再%当前主题分区的个数。和MR hash分区规则一样。
3、既没有指定要发到哪个分区,也没有指定key,key=null,那就轮询。但是第一条给谁不清楚,随机发。
所以一共有三个分区规则。