Kafka 消费者组
创始人
2024-05-31 05:20:39
0

Kafka 消费者组

  • Consumer数
  • 位移
  • 重平衡

消费者组 (Consumer Group) : 可扩展且容错性的消费者机制

  • 一个组内可能有多个消费者 (Consumer Instance) : 共享一个公共 ID (Group ID)
  • 组内的所有消费者协调消费订阅主题 (Subscribed Topics) 的所有分区 (Partition)
  • 每个分区只能由同个消费者组内的一个 Consumer 消费

Consumer Group 的特性:

  1. Consumer Group :有 n 个 Consumer。一个 Consumer 可能是进程或线程
  2. Group ID (字符串) : 标识唯一 Consumer Group
  3. Consumer Group 订阅的主题的单个分区,只能由组内的某个 Consumer 消费

两种消息引擎模型 :

  • 俩种的伸缩性 (scalability) 都差
  • 点对点模型 : 消费队列 : 消息一被消费,就从队列中删除,只能被一个 Consumer 消费
  • 发布/订阅模型 : 允许消息被多个 Consumer 消费

Consumer Group :

  • 解决伸缩性 (scalability) 差问题
  • 消息队列模型 :所有实例都属于同一个 Group
  • 发布 / 订阅模型 :所有实例分别属于不同的 Group

Consumer Group 伸缩性 :

  • Consumer Group 订阅了多个主题后,组内的每个实例不要求一定要订阅主题的所有分区,它只会消费部分分区中的消息
  • Consumer Group 之间彼此独立,互不影响,它们能够订阅相同的一组主题而互不干涉
  • Broker 端的消息留存机制,Kafka 的 Consumer Group 能规避伸缩性差的问题

Consumer数

Consumer Group 下理想 Consumer 数 :

  • Consumer 数 = 该 Group 订阅主题的分区总数

例子 :

  • 一个 Consumer Group 订阅了 3 个主题
  • A、B、C 的分区数分别是1 , 2 , 3 ,该 Group 的总分区数是 6
  • 为该 Group 设置 6 个 Consumer ,能最大限度实现高伸缩性

设置 > 或 < 6 :

  • 设 3 个 Consumer,每个 Consumer 平均消费 2 个分区 (6/3)
  • 设 8 个 Consumer,有 2 (8 – 6) 个 Consumer 无法被分配分区,处于空闲状态
  • 生产中,不推荐设 Consumer 数 > 总分区数,多余的 Consumer 会浪费资源

位移

Kafka 管理位移 :

  • 消费位置信息 : 位移 (Offset) : 消费者在消费时 ,记录消费条数
  • Offset 类似于一组 KV 对 :Key : 分区;V : Consumer 消费该分区的最新位移
  • 用 Java 类似结构 (Map) : TopicPartition : 一个分区,Long : 位移的类型

Kafka 有新旧 Consumer :

  • 新旧 Consumer 的管理位移方式不一样
  • 老 Consumer Group 把位移放在 ZK , 减少 Broker 开销
  • 新 Consumer Group 把位移放在 __consumer_offsets 主题

ZK 不适合频繁的写更新

  • Consumer Group 的位移更新是频繁操作
  • 大量写操作会拖慢 ZK 集群的性能

重平衡

Rebalance :

  • 协议规定 Group 下的所有 Consumer 怎么分配订阅 Topic 的每个分区
  • Rebalance 时,Group 下所有的 Consumer 都要一起参与

Rebalance 触发条件 :

  • 组内成员数变化 : 有新 Consumer 加入/离开组或 Consumer 异常被踢出组
  • 订阅主题数变化 : 新创的主题 , 被 Group 订阅了 , 该 Group 就会 Rebalance
  • 订阅主题的分区数变化 : 增加主题的分区数,订阅该主题的所有 Group 会 Rebalance

Rebalance 的 3 种分配策略 :

  • 都是为了公平分配 : 每个 Consumer 分配平均的分区数
  • 如 : 一个 Group 内有 10 个 Consumer,要消费 100 个分区,理想的分配策略 : 每个 Consumer 平均分配 10 个分区
  • 当有分配倾斜,就会忙死/闲死

Group 发生 Rebalance :

  • 设某个 Group 有两个 Consumer,如 : A/B
  • 当 C 加入时,会触发 Rebalance,并按照分配策略重新为 A、B 和 C 分配分区
  • Rebalance 后的公平分配 : 每个 Consumer 消费 2 个分区

在这里插入图片描述

Rebalance 对 Consumer Group 消费影响大

  • Rebalance 类似 JVM 的 STW
  • Rebalance 时,所有 Consumer 都会停止消费,等待 Rebalance 完成

相关内容

热门资讯

官方通报疑医生暴力接生致婴儿残... 转自:北京时间 【#官方通报疑医生暴力接生致婴儿残疾#】...
华泰人寿高层大“换血” 记者丨林汉垚编辑丨肖嘉7月10日,华泰人寿保险股份有限公司(以下简称“华泰人寿”)任命牛增亮为公司总...
三地三代科研人接力种出新滋味   7月的河北沽源,千亩生菜迎来采收高峰,从田间直供全国肯德基餐厅。与此同时,一筐筐新鲜蔬菜在鲜切菜...
巨轮智能涨2.41%,成交额5... 7月11日,巨轮智能盘中上涨2.41%,截至13:46,报8.08元/股,成交5.26亿元,换手率3...
井松智能涨2.14%,成交额2... 7月11日,井松智能盘中上涨2.14%,截至13:46,报18.58元/股,成交2674.65万元,...
灿瑞科技涨2.02%,成交额2... 7月11日,灿瑞科技盘中上涨2.02%,截至13:47,报32.36元/股,成交2404.54万元,...
寻蓟城觅燕都   ▌谭烈飞 著  北京什么时候从中国北方的军事重镇发展成为都城的呢?公元前的周武王时期,北京地区的...
以太坊基金会发文阐述以太坊全面... 吴说获悉,以太坊基金会博客发布文章,阐述以太坊全面采用零知识证明(ZK),首步为部署 L1 zkEV...
佰维存储涨2.04%,成交额3... 7月11日,佰维存储盘中上涨2.04%,截至13:49,报67.05元/股,成交3.90亿元,换手率...
“杨少华剪彩饭店暂停营业”?平... 来源:中国青年报微信公号7月9日,相声演员杨少华去世,享年94岁。噩耗传出后,多位网友都在社交平台发...