Kamal 部署 Solid Queue 独立工作节点的实践指南
背景介绍
在现代 Rails 应用开发中,后台任务处理是一个常见需求。Solid Queue 作为 Rails 7.1 引入的默认后台任务解决方案,相比传统的 Active Job 适配器提供了更高效的性能。本文将详细介绍如何通过 Kamal 部署工具来独立部署 Solid Queue 工作节点,而不需要同时运行 Web 应用。
核心挑战
许多开发者在使用 Kamal 部署 Solid Queue 时遇到一个典型问题:Kamal 默认会对部署的容器进行健康检查,这通常需要一个 Web 服务来响应 HTTP 请求。但对于纯后台工作节点来说,运行一个 Web 服务既浪费资源又增加了复杂性。
解决方案
1. 创建专用部署配置
首先,我们需要为工作节点创建独立的部署配置文件 deploy-worker.yml。关键配置如下:
service: app-worker
image: your-registry/app_worker
servers:
web:
hosts:
- your.server.ip
proxy: false # 关键配置,禁用代理和健康检查
builder:
dockerfile: Dockerfile.worker
2. 定制 Dockerfile
为工作节点创建专用的 Dockerfile (Dockerfile.worker):
FROM ruby:3.3.4-slim AS base
WORKDIR /rails
RUN apt-get update -qq && \
apt-get install --no-install-recommends -y build-essential libpq-dev
ENV RAILS_ENV="production" \
BUNDLE_DEPLOYMENT="1"
COPY Gemfile Gemfile.lock ./
RUN bundle install
COPY . .
USER 1000:1000
CMD ["bin/jobs"] # 直接运行工作进程
3. 优化启动命令
在 bin/jobs 脚本中,我们可以直接启动 Solid Queue 的各个组件:
#!/usr/bin/env ruby
require "solid_queue"
SolidQueue::Manager.start(
dispatchers: { default: { polling_interval: 1 } },
workers: { default: { processes: 2, queues: "*" } }
)
技术原理
Kamal 的健康检查机制默认会验证容器是否能够响应 HTTP 请求。通过将 proxy: false 设置在 web 配置下(而非根级别),我们告诉 Kamal 这个角色不需要进行健康检查。这允许纯后台工作节点顺利部署而不需要运行 Web 服务。
常见问题解决
如果遇到 "target failed to become healthy" 错误,请检查:
- 确保
proxy: false正确设置在web配置段下 - 确认没有其他配置意外启用了健康检查
- 检查工作进程是否能在合理时间内启动完成
性能优化建议
- 资源隔离:将工作节点与 Web 节点部署在不同主机上,避免资源竞争
- 垂直扩展:根据任务负载调整工作进程数量
- 日志管理:配置合理的日志轮转策略,避免磁盘空间耗尽
总结
通过合理配置 Kamal,我们可以实现 Solid Queue 工作节点的独立部署,既简化了架构又提高了资源利用率。这种部署方式特别适合任务密集型应用,能够在不影响 Web 服务的情况下灵活扩展后台处理能力。
对于需要同时部署 Web 和 Worker 的场景,建议采用分离的部署配置和镜像,以获得最佳的运维灵活性和资源利用率。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00