,如何获取kafka某一topic中最新的offset?

用户投稿 63 0

关于“kafka_php_client”的问题,小编就整理了【4】个相关介绍“kafka_php_client”的解答:

如何获取kafka某一topic中最新的offset?

如果你在0.9版本以上,可以用最新的Consumer client 客户端,有consumer.seekToEnd() / consumer.position() 可以用于得到当前最新的offset: ${log.dirs}/replication-offset-checkpoint

kafka优化攻略?

1)Producer :消息生产者,就是向 kafka broker 发消息的客户端;

2)Consumer :消息消费者,向 kafka broker 取消息的客户端;

3)Consumer Group (CG):消费者组,由多个 consumer 组成。消费者组内每个消费者负责消费不同分区的数据,一个分区只能由一个组内消费者消费;消费者组之间互不影响。所有的消费者都属于某个消费者组,即消费者组是逻辑上的一个订阅者。

4)Broker :一台 kafka 服务器就是一个 broker。一个集群由多个 broker 组成。一个 broker可以容纳多个 topic。

5)Topic :可以理解为一个队列,生产者和消费者面向的都是一个 topic;

6)Partition:为了实现扩展性,一个非常大的 topic 可以分布到多个 broker(即服务器)上,一个 topic 可以分为多个 partition,每个 partition 是一个有序的队列;

7)Replica:副本,为保证集群中的某个节点发生故障时,该节点上的 partition 数据不丢失,且 kafka 仍然能够继续工作,kafka 提供了副本机制,一个 topic 的每个分区都有若干个副本,一个 leader 和若干个 follower。

kafka设置队列优先级?

将优先级统一设定为高、中、低三个级别。具体操作方案如下:

1. 对某个优先级根据 task (单次推送任务)维度,存入不同的 Topic,一个 task 只写入一个 Topic,一个 Topic 可存多个 task;

2. 消费模块根据优先级配额(如 6:3:1),获取不同优先级的消息数,同一优先级轮询获取消息;这样既保证了高优先级用户可以更快地发送消息,又避免了低优先级用户出现没有下发的情况。

kafka消费有几种模式?

kafka消费有三种模式,如下所述:

at most onece模式

基本思想是保证每一条消息commit成功之后,再进行消费处理;

设置自动提交为false,接收到消息之后,首先commit,然后再进行消费

at least onece模式

基本思想是保证每一条消息处理成功之后,再进行commit;

设置自动提交为false;消息处理成功之后,手动进行commit;

采用这种模式时,最好保证消费操作的“幂等性”,防止重复消费;

exactly onece模式

核心思想是将offset作为唯一id与消息同时处理,并且保证处理的原子性;

设置自动提交为false;消息处理成功之后再提交;

比如对于关系型数据库来说,可以将id设置为消息处理结果的唯一索引,再次处理时,如果发现该索引已经存在,那么就不处理;

到此,以上就是小编对于“kafka_php_client”的问题就介绍到这了,希望介绍关于“kafka_php_client”的【4】点解答对大家有用。

抱歉,评论功能暂时关闭!