cppformat库文件写入异常分析与修复

2025-05-09 20:16:35作者：段琳惟

问题背景

在使用cppformat(fmt)库进行文件写入操作时，开发人员发现了一个异常现象：当使用fmt::print向文件写入大量数据时，在某些操作系统环境下(如Ubuntu 14.04)，文件末尾的部分数据会丢失。具体表现为写入20000行数据时，实际只写入了19600行，最后的400行数据未被正确刷新到文件中。

问题复现

通过简化测试用例可以清晰地复现该问题：

#include <cassert>
#include <fcntl.h>
#include <fmt/core.h>

int main() {
    FILE* file = fopen("/tmp/some_file", "w");
    assert(file);
    
    // 模拟文件操作初始化缓冲区但不设置IO_PUTTING标志
    fseek(file, 0, SEEK_SET);
    
    for (int i = 0; i < 20001; ++i) {
        fmt::print(file, "{}\n", i);  // 会出现数据丢失
        // fmt::println(file, "{}", i); // 可正常工作
    }
    
    fclose(file);
    // 文件末尾数据缺失
}

根本原因分析

经过深入调查，发现问题根源在于fmt库与glibc标准I/O库的交互方式上。具体来说：

缓冲区初始化问题：fmt库在初始化文件缓冲区时，会先检查_IO_write_ptr指针，如果已初始化则跳过后续操作。这种优化实际上破坏了glibc的标准行为。
IO_PUTTING标志缺失：glibc的标准I/O实现中，fclose函数只有在文件设置了_IO_CURRENTLY_PUTTING标志时才会执行刷新操作。这个标志通常由putc_unlocked操作设置。
条件判断不一致：fmt库的条件判断(_IO_write_ptr >= _IO_write_end)与glibc内部实现(_IO_putc_unlocked)的条件不完全一致，导致在某些情况下缓冲区虽已初始化但未设置必要的标志位。

技术细节

在glibc的实现中：

putc_unlocked是_IO_putc_unlocked的包装器
_IO_putc_unlocked在缓冲区满时会调用__overflow函数
__overflow函数负责设置关键的_IO_CURRENTLY_PUTTING标志

fmt库原有的优化逻辑跳过了这一关键步骤，导致后续的fclose操作无法正确刷新缓冲区。

解决方案

修复方案相当直接：移除fmt库中不必要的优化检查，完全依赖glibc的标准行为。具体修改为：

 void init_buffer() {
-  if (this->file_->_IO_write_ptr) return;
   // 通过放置和移除字符强制初始化缓冲区
-  assume(this->file_->_IO_write_ptr >= this->file_->_IO_write_end);
   putc_unlocked(0, this->file_);
   --this->file_->_IO_write_ptr;
 }

这一修改确保了：