在 Apache Kafka 中消息的消费和传递通过消费者与 Kafka 的分布式系统协作完成

myrgd • 2024年12月9日下午8:14 • 开源技术, 服务器

在 Apache Kafka 中，消息的消费和传递是通过消费者（Consumer）与 Kafka 的分布式系统协作完成的。以下是消息传递的主要流程：

目录表

1. Producer 生产消息到 Kafka

消息写入：Producer 将消息发送到指定的主题（Topic）。每个主题会分成多个分区（Partition）。
分区分配：消息会根据某种分区策略（如轮询或基于 key 的哈希）写入特定的分区。

2. Consumer 消费消息

Kafka 中消费者的消息消费流程如下：

2.1 订阅主题

消费者通过 Kafka 客户端订阅一个或多个主题。它可以：

直接订阅特定主题。
使用正则表达式动态订阅匹配的主题。

2.2 消费者组 (Consumer Group)

消费者组的概念：消费者可以加入一个消费者组，消费者组中的每个消费者负责消费部分分区的数据。
分区分配：
- 分区独占性：同一消费者组内的每个分区只能被一个消费者消费。
- 分配策略：Kafka 使用分区分配策略（如 Range、RoundRobin 或 StickyAssignor）将分区分配给组内消费者。

2.3 拉取消息

Pull 模式：Kafka 的消费者是以拉取模式（Pull）从 Broker 读取消息。
偏移量控制：消费者从分区中读取消息的起始点由分区的偏移量（Offset）决定。
- 默认情况下，消费者会从上次提交的偏移量开始消费。
- 可以配置从最新或最早的消息开始消费。

2.4 消息处理

消息反序列化：消费者将从 Kafka 中拉取的字节数据反序列化为应用程序可以处理的对象。
业务逻辑：消费者应用程序根据业务需求处理这些消息。

2.5 提交偏移量

自动提交：消费者定期自动将当前处理的消息偏移量提交到 Kafka。
手动提交：应用程序可以选择手动提交偏移量以实现更精确的消费控制。
- 手动提交适用于需要严格处理确保消息不丢失或重复的场景。

3. Broker 与消费者的交互

消费者与 Kafka 集群中的 Broker 通过网络通信进行消息消费：

消费者协调器（Consumer Coordinator）：每个 Broker 维护消费者组状态和分区分配信息。
组再平衡（Rebalance）：当消费者组成员发生变化（新增、减少或故障）时，Kafka 会触发重新分区分配。

4. 消费模型

Kafka 的消费模式具有以下特点：

横向扩展：消费者组可以增加消费者以实现高吞吐量处理。
可靠性：消费者通过手动提交偏移量可确保消息不丢失。
灵活性：消费者可以随时重新消费历史数据（通过指定偏移量）。

这种设计使得 Kafka 消费者具备高吞吐量、可扩展性以及灵活性，适合处理分布式环境中的大规模实时流数据。

发布者：myrgd，转载请注明出处：https://www.object-c.cn/5146

Like (0)

0 0

关于作者

myrgd

207 文章

0 评论

14 问题

0 粉丝

这个人很懒，什么都没有留下～

微信小程序中，通过Node.js连接本地 MySQL 实现数据的增删改查

Previous 2024年12月9日下午2:43

修复 Elementor 网站上出现的 HTTPS 400 错误请求（服务器错误）

Next 2024年12月9日下午8:18

人工智能

AI视觉领域优秀的开源项目和框架

AI视觉领域有很多优秀的开源项目和框架，可以满足不同的需求，从计算机视觉任务（如目标检测、图像分类）到复杂的视觉应用（如生成对抗网络、视频分析等）。以下是一些流行的开源框架、工具库和平台： 1. 通用计算机视觉框架 1.1 OpenCV 1.2 PyTorch Vision (TorchVision) 1.3 MMDetection 2. 图像分割与生成 2…

myrgd
2024年11月24日
000
服务器

在 CANoe 的 Test Module 中进行压力测试和鲁棒性测试

在 CANoe 的 Test Module 中进行压力测试和鲁棒性测试，可以通过以下步骤快速构建并执行相关测试： 1. 定义测试目标首先明确测试的具体内容，例如：具体的目标可以包括： 2. 配置 CANoe 环境确保 CANoe 配置已准备好，包含： 3. 创建压力测试脚本在 Test Module 中使用 CAPL 或 Test Case Edit…

myrgd
2024年12月5日
000
后端开发

在github上提交PR(Pull Request) + 多个pr同时提交、互不干扰的方法

在 GitHub 上提交 PR（Pull Request）是一种将代码变更合并到主分支或其他目标分支的常见方式。在同时处理多个 PR 时，需要使用独立的分支来避免相互干扰。以下是详细教程：步骤一：单个 PR 的提交流程Fork 仓库如果没有直接访问权限，先 fork 原仓库到自己的 GitHub 帐号。在 fork 的仓库上操作自己的代码。克隆仓库到本地 …

myrgd
2024年11月26日
000
后端开发

通过 PHP 读取微软邮箱（Outlook/Office 365 邮箱）

通过 PHP 读取微软邮箱（Outlook/Office 365 邮箱）邮件，通常需要使用 Microsoft Graph API，因为微软逐步淘汰了基于用户名和密码的 IMAP/SMTP 方式。Microsoft Graph API 支持 OAuth2.0 认证，可以安全地访问和管理用户邮件。以下是实现读取微软邮箱邮件的完整示例。实现步骤 1. 准备工…

myrgd
2024年11月25日
000
服务器

ubuntu服务器安装cuda11.0、cuDNN入门教程

在 Ubuntu 服务器上安装 CUDA 11.0 和 cuDNN 的详细教程如下。本教程涵盖了从环境准备到安装和验证的完整流程，适用于初学者。一、环境准备 1. 系统要求 2. 卸载旧版本（如有）清理可能存在的旧版本 CUDA 和 NVIDIA 驱动：二、安装 NVIDIA 驱动 1. 检查 GPU 支持情况使用 lspci 或 nvidia-sm…

myrgd
2024年11月22日
000
小程序

在 Android 中 Matrix 实现图像的缩放和裁剪将 Glide 图像从 fitCenter 转换为 centerCrop

在 Android 中，Matrix 可以用来实现图像的缩放和裁剪逻辑。要将 Glide 图像从 fitCenter 转换为 centerCrop，需要通过 Matrix 计算变换逻辑。以下是使用 Kotlin 实现的方法：实现步骤计算目标变换矩阵：根据目标宽高比，判断是否需要横向或纵向裁剪。设置 Matrix：使用 Matrix 执行缩放和平移操作。应用到…

myrgd
2024年12月3日
000
开源技术

Git 报错 fatal: unable to access ‘https://github.com/…/.git’: Recv failure: Connection was reset，问题排查方法

Git 报错 fatal: unable to access ‘https://github.com/…/.git’: Recv failure: Connection was reset，通常是由于网络连接问题导致的。以下是一些常见原因及解决方法： 1. 检查网络连接确保网络能够正常访问 GitHub。在浏览器中访问 https://github.co…

myrgd
2024年11月26日
000
在 Ubuntu 16.04 上使用 GitLab CI 设置持续集成 (CI) 流水线步骤

在 Ubuntu 16.04 上使用 GitLab CI 设置持续集成 (CI) 流水线需要完成以下步骤。GitLab CI/CD 是一个强大的工具，可以自动化代码测试、构建和部署。步骤 1：安装 GitLab RunnerGitLab Runner 是用于执行 GitLab CI 流水线任务的工具。安装必要的软件包添加 GitLab Runner 的官…

myrgd
操作系统 2024年12月2日
001
python

PHM技术：一维信号时序全特征分析（统计域/频域/时域）信号处理

PHM（Prognostics and Health Management，预测与健康管理）技术中的一维信号时序特征分析，旨在从信号中提取与设备健康状态相关的多种特征。以下是针对统计域、频域和时域特征分析的详细介绍和常见方法。 1. 时域特征分析时域特征直接从原始信号提取，描述信号的统计特性或时间行为。这些特征反映信号的幅值、变化趋势和波形形状。1.1 常用…

myrgd
2024年11月28日
000
开源技术

使用 VS Code 管理 Git 仓库详细使用指南

使用 VS Code 管理 Git 仓库，可以通过其直观的图形界面和终端功能完成常见的版本控制操作，如克隆、提交、分支管理等。以下是一个详细的使用指南，帮助你高效地使用 VS Code 和 Git。 1. 环境准备安装必要工具安装 Git：从 Git 官网下载并安装。安装 VS Code：从 VS Code 官网下载并安装。安装 Git 插件（可选）：在…

myrgd
2024年11月30日
000
操作系统

远程访问 VMware ESXi 主机的方法

远程访问 VMware ESXi 主机可以通过以下几种方式实现。具体方法取决于你的网络环境和目标需求，例如是否有公网 IP，是否需要加密传输等。以下是详细教程： 1. 基于公网 IP 的直接访问 1.1 适用场景 1.2 操作步骤 2. 使用 VPN 隧道访问 2.1 适用场景 2.2 操作步骤 3. 配置跳板机访问 3.1 适用场景 3.2 操作步骤远程…

myrgd
2024年11月24日
000
服务器

Apache DolphinScheduler 一款分布式大数据工作流调度系统

Apache DolphinScheduler 是一款分布式大数据工作流调度系统。Task 是其核心组件之一，用于定义和调度具体的任务。以下是基于 Apache DolphinScheduler 3.1.9 的 Task 处理流程的解析： 1. Task 提交在 DolphinScheduler 中，Task 的生命周期通常由用户提交一个具体的任务定义开始…

myrgd
2024年12月7日
000
服务器

在安装Docker时，执行yum install -y yum-utils 报错的解决方法

在安装 Docker 时，如果执行 yum install -y yum-utils 报错，可能是由于以下原因之一：解决方法1. 检查 Yum 源配置确保您的系统配置了可用的 Yum 源。使用以下命令检查：如果列表为空或不可用，重新配置一个有效的源（例如阿里云、腾讯云）。替换为阿里云源（以 CentOS 7 为例）： 2. 安装 EPEL 仓库yum-…

myrgd
2024年11月27日
000
开源技术

不同版本ffmpeg压缩比差距很大的问题（使用videotoolbox硬编码）

不同版本的 FFmpeg 在使用 videotoolbox 硬件编码时，压缩比差距较大的问题，通常与以下几个因素相关：1. FFmpeg 硬件编码支持的变化：FFmpeg 集成了多种硬件加速技术（例如在 macOS 上使用 videotoolbox），而随着版本的更新，FFmpeg 可能对硬件编码进行了修复、改进或修改，这些变化可能会导致不同版本之间的压缩效…

myrgd
2024年11月27日
000
开源技术

多方面的优化包括启动时间、React Native 速度提升 550% 运行时性能以及渲染效率的提升

React Native 速度提升 550% 可能涉及多方面的优化，包括启动时间、运行时性能以及渲染效率的提升。这通常是通过框架改进、代码优化和工程实践的结合来实现的。以下是实现 React Native 性能大幅提升的一些关键方法和策略： 1. 启动时间优化 1.1 减少 JS Bundle 大小 1.2 预加载资源 1.3 使用优化的原生模块 2. 渲染…

myrgd
2024年12月7日
000