Immich项目搜索功能导致Docker容器崩溃问题分析与解决方案

2025-04-29 00:02:53作者：郜逊炳

问题现象

在Immich项目的实际部署中，部分用户反馈当使用搜索功能时（在网页端或移动端输入搜索文本并回车），会导致Immich服务器（Docker容器）完全崩溃。具体表现为：

Docker LXC容器的CPU使用率瞬间达到100%
服务器完全无响应，无法获取日志
必须重启整个Docker LXC才能恢复服务
其他功能（如浏览、上传等）均能正常工作

环境背景

典型的问题环境配置：

操作系统：Debian GNU/Linux 12（基于Proxmox VE虚拟化环境）
Immich版本：v1.131.3
硬件资源：4核CPU，内存使用率约41%但SWAP使用率达100%
数据规模：约19,000张照片和250个视频

根本原因分析

经过深入排查，发现问题的核心在于系统资源管理机制：

SWAP空间配置不当：
- 虽然物理内存使用率仅41%，但SWAP空间已完全耗尽
- Linux内核的swappiness参数设置过高，导致系统过早使用SWAP空间
搜索操作的高资源需求：
- Immich的搜索功能涉及大规模向量计算（通过pgvecto-rs扩展）
- 当执行搜索时，PostgreSQL会加载大量索引数据到内存
- 内存交换操作导致I/O瓶颈，最终引发系统死锁
容器化环境限制：
- Docker LXC容器的资源隔离机制使得问题更加突出
- 其他容器（如Minecraft服务器）也在竞争SWAP资源

解决方案

短期应急措施

增加SWAP空间容量：

sudo fallocate -l 4G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile

调整swappiness参数（推荐值为10-30）：

echo "vm.swappiness=20" >> /etc/sysctl.conf
sysctl -p

长期优化建议

资源监控与告警：
- 部署监控系统（如Prometheus+Grafana）实时跟踪：
  - 内存/SWAP使用率
  - PostgreSQL的活跃连接数
  - 向量索引加载状态

数据库优化：

# 在docker-compose.yml中增加PostgreSQL配置
command:
  - 'postgres'
  - '-c'
  - 'shared_buffers=1GB'  # 根据总内存调整
  - '-c'
  - 'work_mem=64MB'
  - '-c'
  - 'maintenance_work_mem=256MB'