Miri项目中Tree Borrows与整数指针转换的潜在问题分析

2025-06-09 19:35:36作者：苗圣禹Peter

概述

在Rust的Miri项目中，Tree Borrows模型在处理整数到指针转换(int2ptr)时可能出现意外的行为。本文通过一个实际案例，分析Tree Borrows模型下整数指针转换可能带来的问题，并提供解决方案。

问题现象

在测试代码中，当使用Vec::extend方法从自定义数据结构中读取数据时，Tree Borrows模型会报告"ptr_offset_from_unsigned called on pointers into different allocations"错误。然而，如果改用手动遍历并逐个push的方式，则不会出现此问题。

核心代码分析

问题代码的关键部分是一个自定义的Data结构，它通过整数存储指针信息：

pub struct Data {
    len: usize,
    ptr: usize,  // 存储指针的整数值
}

impl Data {
    pub fn allocate(data: &[u8]) -> Self {
        let mut data = ManuallyDrop::new(data.to_owned().into_boxed_slice());
        Self {
            len: data.len(),
            ptr: data.as_mut_ptr() as usize,  // 指针转换为整数
        }
    }
    
    pub fn read(&self) -> &[u8] {
        unsafe {
            slice::from_raw_parts(self.ptr as *mut u8, self.len)  // 整数转换回指针
        }
    }
}

问题根源

整数指针转换的限制：Tree Borrows模型目前不完全支持整数到指针的转换。当指针信息通过整数存储并转换回来时，可能会丢失或破坏原有的借用跟踪信息。
迭代器实现的特殊性：Vec::extend内部使用迭代器实现，而迭代器的某些操作(如ptr_offset_from_unsigned)对指针来源特别敏感。当指针经过整数转换后，Tree Borrows可能无法正确追踪其来源。
手动遍历与自动扩展的区别：手动遍历并push之所以能工作，是因为它不涉及迭代器内部复杂的指针运算，对指针来源的要求较低。

解决方案

避免整数指针转换：直接存储指针而非其整数值是最可靠的解决方案：

pub struct Data {
    len: usize,
    ptr: *mut u8,  // 直接存储指针
}

impl Data {
    pub fn allocate(data: &[u8]) -> Self {
        let mut data = ManuallyDrop::new(data.to_owned().into_boxed_slice());
        Self {
            len: data.len(),
            ptr: data.as_mut_ptr(),  // 直接存储指针
        }
    }
    
    pub fn read(&self) -> &[u8] {
        unsafe {
            slice::from_raw_parts(self.ptr, self.len)  // 直接使用指针
        }
    }
}