Biliup项目中文件名写入数据库不一致问题的分析与解决

2025-06-15 15:37:57作者：何举烈Damon

问题背景

在Biliup项目（一个视频录制与上传工具）的使用过程中，发现了一个关于文件名处理的bug。该问题表现为：当系统进行视频分段录制时，偶尔会出现写入数据库的文件名与实际磁盘上保存的文件名不一致的情况，导致后续处理流程失败。

问题现象

具体表现为：

数据库记录的文件名与实际磁盘文件名相差1秒
磁盘上的文件未能正确完成重命名，仍然保留".part"后缀
由于文件名不匹配，导致后处理流程无法找到对应文件而失败
该问题出现频率不固定，有时100多个文件中出现1次，有时30多个文件中就可能出现3-4次

技术分析

根本原因

经过分析，该问题主要源于时间戳精度过高导致的时间竞争条件。当前系统在生成文件名时使用了精确到秒的时间戳，在高频率分段录制场景下，可能出现以下情况：

系统在时间点T生成文件名并写入数据库
在极短时间内（毫秒级），系统时间跳转到T+1秒
实际文件保存时使用了新的时间戳T+1
导致数据库记录与磁盘文件出现1秒差异

影响范围

该问题主要影响：

文件完整性检查
后续处理流程（如转码、上传等）
系统可靠性（部分文件可能无法被正确处理）

解决方案

修复方案

针对该问题，开发团队提出了以下解决方案：

降低时间戳精度：将文件名中的时间戳从精确到秒改为精确到分钟，从根本上避免1秒差异问题
增加文件状态检查：在写入数据库前进行二次验证，确保记录与实际文件一致
完善错误处理机制：当检测到不一致时，能够自动进行修正或重试

实现细节

具体实现上，主要修改了文件命名策略：

旧方案：前缀_YYYYMMDD_HHMMSS.ext
新方案：前缀_YYYYMMDD_HHMM.ext

同时加强了文件状态同步机制，确保数据库记录与实际文件状态保持一致。

用户建议

对于遇到类似问题的用户，可以采取以下临时解决方案：

缩短分段时长，增加问题复现几率以便排查
手动检查.part文件，必要时进行重命名
等待官方修复版本发布

总结

文件名不一致问题虽然看似简单，但反映了在高并发、高精度时间戳场景下的潜在风险。通过降低时间戳精度这一巧妙方案，不仅解决了当前问题，还提高了系统的整体稳定性。这也提醒开发者在设计文件命名规则时，需要在唯一性和实用性之间找到平衡点。

该修复已合并到主分支，用户可以通过更新到最新版本来获得修复。对于依赖精确时间戳功能的用户，建议通过其他方式（如序列号）来保证文件唯一性。

biliup

自动直播录制、投稿、twitch、ytb频道搬运工具。命令行投稿(B站)和视频下载工具，提供多种登录方式，支持多p。

项目地址：https://gitcode.com/gh_mirrors/bi/biliup

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

457

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

254