Kafka 消费者组
创始人
2024-05-31 05:20:39
0

Kafka 消费者组

  • Consumer数
  • 位移
  • 重平衡

消费者组 (Consumer Group) : 可扩展且容错性的消费者机制

  • 一个组内可能有多个消费者 (Consumer Instance) : 共享一个公共 ID (Group ID)
  • 组内的所有消费者协调消费订阅主题 (Subscribed Topics) 的所有分区 (Partition)
  • 每个分区只能由同个消费者组内的一个 Consumer 消费

Consumer Group 的特性:

  1. Consumer Group :有 n 个 Consumer。一个 Consumer 可能是进程或线程
  2. Group ID (字符串) : 标识唯一 Consumer Group
  3. Consumer Group 订阅的主题的单个分区,只能由组内的某个 Consumer 消费

两种消息引擎模型 :

  • 俩种的伸缩性 (scalability) 都差
  • 点对点模型 : 消费队列 : 消息一被消费,就从队列中删除,只能被一个 Consumer 消费
  • 发布/订阅模型 : 允许消息被多个 Consumer 消费

Consumer Group :

  • 解决伸缩性 (scalability) 差问题
  • 消息队列模型 :所有实例都属于同一个 Group
  • 发布 / 订阅模型 :所有实例分别属于不同的 Group

Consumer Group 伸缩性 :

  • Consumer Group 订阅了多个主题后,组内的每个实例不要求一定要订阅主题的所有分区,它只会消费部分分区中的消息
  • Consumer Group 之间彼此独立,互不影响,它们能够订阅相同的一组主题而互不干涉
  • Broker 端的消息留存机制,Kafka 的 Consumer Group 能规避伸缩性差的问题

Consumer数

Consumer Group 下理想 Consumer 数 :

  • Consumer 数 = 该 Group 订阅主题的分区总数

例子 :

  • 一个 Consumer Group 订阅了 3 个主题
  • A、B、C 的分区数分别是1 , 2 , 3 ,该 Group 的总分区数是 6
  • 为该 Group 设置 6 个 Consumer ,能最大限度实现高伸缩性

设置 > 或 < 6 :

  • 设 3 个 Consumer,每个 Consumer 平均消费 2 个分区 (6/3)
  • 设 8 个 Consumer,有 2 (8 – 6) 个 Consumer 无法被分配分区,处于空闲状态
  • 生产中,不推荐设 Consumer 数 > 总分区数,多余的 Consumer 会浪费资源

位移

Kafka 管理位移 :

  • 消费位置信息 : 位移 (Offset) : 消费者在消费时 ,记录消费条数
  • Offset 类似于一组 KV 对 :Key : 分区;V : Consumer 消费该分区的最新位移
  • 用 Java 类似结构 (Map) : TopicPartition : 一个分区,Long : 位移的类型

Kafka 有新旧 Consumer :

  • 新旧 Consumer 的管理位移方式不一样
  • 老 Consumer Group 把位移放在 ZK , 减少 Broker 开销
  • 新 Consumer Group 把位移放在 __consumer_offsets 主题

ZK 不适合频繁的写更新

  • Consumer Group 的位移更新是频繁操作
  • 大量写操作会拖慢 ZK 集群的性能

重平衡

Rebalance :

  • 协议规定 Group 下的所有 Consumer 怎么分配订阅 Topic 的每个分区
  • Rebalance 时,Group 下所有的 Consumer 都要一起参与

Rebalance 触发条件 :

  • 组内成员数变化 : 有新 Consumer 加入/离开组或 Consumer 异常被踢出组
  • 订阅主题数变化 : 新创的主题 , 被 Group 订阅了 , 该 Group 就会 Rebalance
  • 订阅主题的分区数变化 : 增加主题的分区数,订阅该主题的所有 Group 会 Rebalance

Rebalance 的 3 种分配策略 :

  • 都是为了公平分配 : 每个 Consumer 分配平均的分区数
  • 如 : 一个 Group 内有 10 个 Consumer,要消费 100 个分区,理想的分配策略 : 每个 Consumer 平均分配 10 个分区
  • 当有分配倾斜,就会忙死/闲死

Group 发生 Rebalance :

  • 设某个 Group 有两个 Consumer,如 : A/B
  • 当 C 加入时,会触发 Rebalance,并按照分配策略重新为 A、B 和 C 分配分区
  • Rebalance 后的公平分配 : 每个 Consumer 消费 2 个分区

在这里插入图片描述

Rebalance 对 Consumer Group 消费影响大

  • Rebalance 类似 JVM 的 STW
  • Rebalance 时,所有 Consumer 都会停止消费,等待 Rebalance 完成

相关内容

热门资讯

粉丝把范丞丞爸爸认成范丞丞,他... 粉丝把范丞丞爸爸认成范丞丞,他们长得很像吗?他们长得确实很像范丞丞,继承了他爸的大部分基因,他跟他爸...
电视剧《咱家那些事》的片头曲叫... 电视剧《咱家那些事》的片头曲叫什么名字?片头曲 《好大一个家》 从小盼着快...
打坐时如何净心 打坐时如何净心净,就是清除心中的杂念,与自然融合净心之妙法 莫若至诚持念阿弥陀佛圣号 打坐也当以念佛...
奇瑞董事长尹同跃:质比量重要,... “我们现在已经调整了(打法),不再追求销量的排名,我们认为质比量重要。”7月11日,在2025中国汽...
中粮可口可乐甘肃厂再次启动“净... 近日,甘肃陇南康县遭遇强降雨天气过程,其中碾坝镇累计降雨量达221.8毫米。强降雨引发山洪、滑坡及泥...
百合股份“回扣门”发酵:内部审... 近日,有“营养保健食品代工第一股”之称的威海百合生物技术股份有限公司(股票代码:603102.下称“...
新大唐双龙传(王晶版)总共共多... 新大唐双龙传(王晶版)总共共多少集刚播放的时候听说是四部 每部40集一共160集 到底多少集呢第一部...
美轰炸机参与美日韩空中演习 据韩国国防部消息,美日韩7月11日在韩国济州岛南部举行联合空中演习,美军战略轰炸机B-52H参与。韩...
29岁高学历女演员被曝当服务员 转自:扬子晚报近日,29岁女演员宇书田在餐厅兼职当服务员,引发关注。宇书田告诉记者,她硕士毕业于英国...
以更多诚意和远见“疏通”红海航... 本月以来,以色列对也门胡塞武装控制区的目标发动空袭,胡塞武装加大对红海水域与以色列有关商船的袭击,这...