Apache Pulsar 使用教程
2026-01-21 04:57:20作者:裘晴惠Vivianne
1. 项目介绍
Apache Pulsar 是一个开源的分布式发布-订阅消息系统,具有灵活的消息模型和直观的客户端 API。Pulsar 旨在作为一个托管服务进行部署,支持多租户、认证、授权和配额等功能。它具有水平扩展性,能够处理数百万个独立主题和每秒数百万条消息。Pulsar 还提供了强有力的顺序和一致性保证,以及低延迟的持久存储。
主要特性
- 水平扩展性:支持数百万个独立主题和每秒数百万条消息。
- 强顺序和一致性保证。
- 低延迟持久存储。
- 多租户支持:支持多租户、认证、授权和配额。
- REST API:提供 REST API 用于管理、监控和统计。
- 地理复制:支持跨地域的数据复制。
2. 项目快速启动
环境准备
- JDK 17(推荐)
- Maven 3.6.1+
编译和安装
# 克隆项目
git clone https://github.com/apache/pulsar.git
cd pulsar
# 编译和安装
mvn install -DskipTests
启动 Pulsar 服务
# 启动单机模式的 Pulsar 服务
bin/pulsar standalone
发送和接收消息
# 发送消息
bin/pulsar-client produce my-topic --messages "Hello Pulsar"
# 接收消息
bin/pulsar-client consume my-topic -s my-subscription -p Earliest
3. 应用案例和最佳实践
应用案例
- 实时数据处理:Pulsar 被广泛用于实时数据处理场景,如金融交易、实时监控和日志分析。
- 消息队列:Pulsar 可以用作高吞吐量的消息队列,支持大规模的并发消费。
- 流式计算:Pulsar 与 Apache Flink 和 Apache Spark 等流式计算框架集成,支持复杂的流式计算任务。
最佳实践
- 多租户管理:使用 Pulsar 的多租户功能,为不同的业务部门或客户分配独立的命名空间和主题。
- 地理复制:在多个数据中心之间配置地理复制,确保数据的可靠性和高可用性。
- 监控和报警:使用 Pulsar 提供的 REST API 和 Prometheus 集成,进行实时监控和报警。
4. 典型生态项目
Pulsar 生态系统
- Pulsar Functions:轻量级的无服务器计算框架,支持 Java、Python 和 Go 语言。
- Pulsar IO:提供与外部系统的连接器,如 MySQL、Elasticsearch 和 Cassandra。
- Pulsar SQL:基于 Presto 的 SQL 查询引擎,支持对 Pulsar 中的流数据进行 SQL 查询。
- Pulsar Manager:用于管理和监控 Pulsar 集群的 Web 界面。
客户端库
- Java 客户端
- Python 客户端
- Go 客户端
- C++ 客户端
- Node.js 客户端
- C# 客户端
通过以上模块的介绍,您可以快速了解 Apache Pulsar 的基本概念、快速启动方法、应用案例和生态系统。希望这篇教程能帮助您更好地使用和集成 Apache Pulsar。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0212
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0135
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
热门内容推荐
最新内容推荐
项目优选
收起
deepin linux kernel
C
32
16
暂无描述
Dockerfile
774
5.07 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
872
2.01 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
468
461
Ascend Extension for PyTorch
Python
756
959
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
696
1.39 K
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.1 K
1.14 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.03 K
271
昇腾LLM分布式训练框架
Python
183
230
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
1.03 K
645