Dawarich项目数据库性能优化实践：处理700万数据点的配置调整

2025-06-13 07:13:15作者：贡沫苏Truman

Google Location History (Google Maps Timeline) self-hosted alternative.

项目地址：https://gitcode.com/GitHub_Trending/da/dawarich

背景介绍

Dawarich作为一个数据密集型应用，在处理大规模数据集时可能会遇到性能瓶颈。本文记录了一位开发者在处理700万数据点时，通过调整PostgreSQL数据库配置显著提升系统性能的经验。

问题发现

在使用Dawarich 0.19.6版本时，开发者发现数据库无法正常执行VACUUM操作，主要原因是内存不足。VACUUM是PostgreSQL的重要维护操作，用于回收已删除行占用的空间并更新统计信息，对查询性能至关重要。

解决方案

Docker配置调整

在docker-compose文件中增加了shm_size: 1g参数，将共享内存大小设置为1GB。这为PostgreSQL提供了足够的内存空间来执行维护操作。

PostgreSQL配置优化

开发者创建了一个自定义的postgres.conf配置文件，包含以下关键优化项：

内存配置：
- shared_buffers = 512MB：增加共享缓冲区大小
- work_mem = 128MB和maintenance_work_mem = 128MB：提升工作内存
自动清理设置：
- autovacuum_vacuum_scale_factor = 0.05
- autovacuum_analyze_scale_factor = 0.05 这些设置使自动清理在表大小5%时就触发，而不是默认的20%
WAL日志配置：
- max_wal_size = 2GB
- min_wal_size = 80MB 优化了预写式日志的大小设置
并行查询：
- max_parallel_workers_per_gather = 4 允许更多并行工作进程
本地化设置：统一设置为en_US.utf8，避免可能的字符集转换开销

效果验证

配置调整后，系统性能得到显著提升：

成功处理了7,016,231条数据点记录
查询响应时间从无法显示一个月数据改善到几秒内完成
数据库维护操作能够正常执行

实施建议

对于类似规模的数据集，建议：

根据服务器实际内存情况调整内存参数
监控autovacuum的执行频率和效果
定期检查查询性能，必要时进一步调整work_mem等参数
考虑为大型表设置单独的autovacuum参数

这些优化措施特别适合数据量在百万级别以上的Dawarich部署环境，能够显著改善用户体验和系统稳定性。

Google Location History (Google Maps Timeline) self-hosted alternative.

项目地址：https://gitcode.com/GitHub_Trending/da/dawarich

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。