Kafka 如何避免重复消费？_老汪软件技巧-棋牌游戏开发

作者：老汪软件技巧
发表时间：2024-09-23 10:01
浏览量：

嗨，你好呀，我是猿java

在 Apache Kafka 中，避免重复消费是一个常见的问题，尤其是在处理消息时需要确保每条消息只被处理一次。那么，有什么方式可以避免重复消费？这篇文章，我们来聊一聊。

通常来说，避免重复消费的方式有 7种：

1. 使用消费者组

Kafka的消费者组（Consumer Group）机制可以确保每个分区的消息只被一个消费者实例消费。通过合理的分区和消费者组设计，可以避免同一消息被多个消费者重复消费。

优点：

缺点：

2. 使用幂等生产者

Kafka 0.11.0版本引入了幂等生产者（Idempotent Producer），可以确保相同的消息在网络或其他错误导致重试时不会被重复写入Kafka。启用幂等生产者只需要在生产者配置中设置enable.idempotence=true。幂等生产者确保消息在网络或其他错误导致重试时不会被重复写入 Kafka，通过为每个消息分配唯一的序列号来实现幂等性。

配置修改如下：

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("enable.idempotence", "true");
KafkaProducer producer = new KafkaProducer<>(props);

优点：

缺点：

3. 使用事务性生产者和消费者

Kafka支持事务性消息，允许生产者和消费者在一个事务中一起工作。生产者可以将一组消息作为一个事务写入Kafka，消费者也可以在一个事务中读取和处理消息。这样可以确保消息处理的原子性和一致性。要使用事务性生产者，需要配置transactional.id。

配置修改如下：

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("transactional.id", "my-transactional-id");
KafkaProducer producer = new KafkaProducer<>(props);
producer.initTransactions();

优点：

缺点：

4. 手动提交偏移量

默认情况下，Kafka消费者会自动提交偏移量（auto commit），为了更好地控制消息处理和偏移量提交，可以关闭自动提交（mit=false），并在确保消息处理成功后手动提交偏移量。这可以通过commitSync()或commitAsync()方法来实现。

_如何解决重复消费_重复消费什么意思

配置修改如下：

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("enable.auto.commit", "false");
KafkaConsumer consumer = new KafkaConsumer<>(props);
while (true) {
    ConsumerRecords records = consumer.poll(Duration.ofMillis(100));
    for (ConsumerRecord record : records) {
        // 处理消息
    }
    consumer.commitSync();
}

优点：

缺点：

5. 使用外部存储来管理偏移量

在某些场景下，可以将偏移量存储在外部存储（如数据库）中，而不是依赖 Kafka的内部偏移量管理。这样可以在消息处理和偏移量提交之间建立更强的关联，确保只有当消息处理成功后才更新偏移量。

优点：

缺点：

6. 去重逻辑

在消息处理逻辑中引入去重机制。例如，可以使用消息的唯一标识符（如消息ID）在处理前检查是否已经处理过该消息，从而避免重复处理。

优点：

缺点：

7. 幂等的消息处理逻辑

设计消息处理逻辑时，尽量使其成为幂等操作，即相同的消息即使被处理多次也不会产生副作用。

例如，在数据库操作时，可以使用UPSERT操作（更新插入）来确保数据的一致性。

优点：

缺点：

总结

本文分析了在 Kafka 中，避免重复消费的 7种常见方式，对于大多数场景，结合使用消费者组、手动提交偏移量和幂等处理逻辑可以有效避免重复消费，而在需要更严格一致性的场景下，可以考虑使用幂等生产者和事务性消息。具体选择哪种方法取决于具体的应用场景和需求。

交流学习

最后，把猿哥的座右铭送给你：投资自己才是最大的财富。如果你觉得文章有帮助，请帮忙转发给更多的好友，或关注公众号：猿java，持续输出硬核文章。

上一条查看详情 +前端大文件上传是面试的一道常考题，我也是最近才弄懂，特地来记录一下，加深印象

下一条查看详情 +Web性能优化的未来：从前端到边缘计算的深度探索