10 道 Kafka 基础面试，不看答案你会几道题

写在前面

这次给大家分享的是Kafka的10道面试题，就难度我觉得是比较基础的，但考的知识点还比较全面，可以用来考察自己掌握Kafka基础的程度。

1. Kafka是什么？

Kafka起初是一个多分区、多副本且基于ZooKeeper协调的分布式消息系统，现已被定位为一个分布式流式处理平台。

2. Kafka的架构了解吗？

建议按以下顺序讲述：

Kafka是基于发布/订阅的消息系统（引出Producer、Consumer和Broker），所以存在三个角色 Producer（生产消息）、 Broker（Kafka实例）和 Consumer（消费消息）。
生产者会将消息推送到Kafka的某个 Topic上，以此 区分消息。
为了高可用性，通过在集群上部署多个Broker，一个Topic将以 多副本的形式分布在多个Broker上，基于ZK选出一个Leader副本，而其他Follower副本则负责同步Leader副本，避免单点问题。
为了高吞吐量，再将Topic划分成多个分区，可让Topic的吞吐量不受单机限制。
为了高吞吐量，对于多个分区，单个消费者也可变成多个，形成 消费组，一个分区由一个消费者负责。

最后可画出下图，如想看逐步的画图过程，可看下《图解Kafka中的基本概念》。

10 道 Kafka 基础面试，不看答案你会几道题

3. 了解其他MQ吗？有什么不同？

有了解RadbbitMQ，RabbitMQ由于有消息确认机制，所以数据丢失的可能性更小，适合严格的金融场景。

而Kafka的优势则在于其吞吐量更大，适合处理活跃的流式数据。

4. 如何保证消息的有序性？

Kafka只能保证局部有序，即只能保证一个分区里的消息有序。而其具体实现是通过生产者为每个分区的消息维护一个发送队列，我们需要将保证顺序的消息都发送到同一个分区中。并且由于Kafka会同时发送多个消息，所以还需指定max.in.flight.requests.per.connection为1，保证前一个消息发送成功，后一个消息才开始发送。

max.in.flight＞1 时能保证有序性吗？

可以，设置幂等能保证。不过max.in.flight不能大于5。这是因为Broker端只会缓存最近5个Batch的SequenceNumber，例如我们发送1到6的报文，其中1发送失败，2-5发送成功，Broker缓存下来，当1重试时，Broker检查到1小于缓存中的最小序号，会抛出异常，而Producer将重试发送1超过最多次数或超时，影响性能。

幂等如何保证有序性？

通过引入ProduceID(PID)和SequenceNumber的概念，每个Producer在初始化时被分配唯一的PID，而<Topic,Partition>的每条有一个从0单调递增的SequenceNumber。在发送消息时，由以下三点保证：

验证序号连续：Broker会验证Batch的SequenceNumber是否连续，若不连续，抛出异常；
重试时，batch放置正确位置：Producer请求重试时，会根据SequenceNumber将Batch放在队列中的合适位置；
重试时，max.in.flight调为1：当请求重试时，会把max.in.flight动态调整为1，保证请求序号小的先发送成功。

5. 如何保证幂等？

Kafka具有幂等机制，但默认不开启，需要设置enable.idempotence为true开启。但只能实现单会话、单分区上的幂等。

为什么只能实现单会话上的幂等？

在Producer初始化时，Kafka会为其重新分配一个新的PID，而Broker端在维护SequenceNumber时是以<ProducerID, Topic, Partition>作为维度，因此当PID变化时Broker将无法获得之前的状态信息，无法做到单会话上的不丢不冲。

如何实现跨会话幂等？

事务机制，通过引入TransactionID和Epoch。不同于PID是由内部进行分配，TrasactionID是由用户提供。而TransactionID与PID会一一对应，这样当Producer宕机时，集群启动一个新的Producer，在初始化时可以通过TransactionID获得PID，便能继续工作。同时会被分配一个单调递增的Epoch，来保证当旧Producer恢复后可能生产出重复消息，Broker段会拒绝旧Epoch的消息。