Apache DolphinScheduler 使用教程
项目介绍
Apache DolphinScheduler 是一个现代的数据编排平台,旨在通过低代码方式创建高性能的工作流。它提供了一个强大的用户界面,专注于解决数据管道中的复杂任务依赖,并提供了多种即插即用的作业类型。DolphinScheduler 的关键特性包括易于部署、易于使用、高可靠性、高可用性和高性能。
项目快速启动
环境准备
- Java 8 或更高版本
- Maven 3.6.x
- Git
克隆项目
git clone https://github.com/apache/dolphinscheduler.git
cd dolphinscheduler
构建项目
mvn clean install -DskipTests
启动服务
cd dolphinscheduler-standalone-server
sh bin/start.sh
访问界面
打开浏览器,访问 http://localhost:12345,使用默认用户名和密码(admin/dolphinscheduler123)登录。
应用案例和最佳实践
数据管道自动化
DolphinScheduler 可以用于自动化复杂的数据管道,例如从多个数据源收集数据,进行数据清洗和转换,最后加载到数据仓库中。通过定义工作流和任务依赖,可以确保数据处理的顺序和一致性。
定时任务调度
使用 DolphinScheduler 可以轻松创建和管理定时任务。例如,可以设置每天固定时间执行数据备份任务,或者每周执行一次数据分析任务。
多租户管理
DolphinScheduler 支持多租户管理,可以为不同的用户或团队创建独立的工作空间,确保数据和任务的隔离。
典型生态项目
Apache Flink
DolphinScheduler 可以与 Apache Flink 集成,用于调度 Flink 作业。通过 DolphinScheduler 的界面,可以轻松创建和管理 Flink 任务,并监控任务的执行状态。
Apache Kafka
DolphinScheduler 可以与 Apache Kafka 集成,用于调度 Kafka 消费者和生产者任务。通过 DolphinScheduler 的界面,可以轻松创建和管理 Kafka 任务,并监控任务的执行状态。
Apache Hive
DolphinScheduler 可以与 Apache Hive 集成,用于调度 Hive 查询任务。通过 DolphinScheduler 的界面,可以轻松创建和管理 Hive 任务,并监控任务的执行状态。
通过以上内容,您可以快速了解和使用 Apache DolphinScheduler,并探索其在实际应用中的最佳实践和生态项目集成。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
ruoyi-plus-soybeanRuoYi-Plus-Soybean 是一个现代化的企业级多租户管理系统,它结合了 RuoYi-Vue-Plus 的强大后端功能和 Soybean Admin 的现代化前端特性,为开发者提供了完整的企业管理解决方案。Vue06- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00