MIR编译器项目中指针运算与类型转换的代码生成问题分析

2025-07-01 16:51:20作者：柯茵沙

A lightweight JIT compiler based on MIR (Medium Internal Representation) and C11 JIT compiler and interpreter based on MIR

项目地址：https://gitcode.com/gh_mirrors/mi/mir

问题背景

在MIR编译器项目中，开发者发现了一个与指针运算和类型转换相关的代码生成问题。该问题表现为当程序中使用unsigned long类型进行指针差值运算并除以sizeof(char)（或其等效形式）时，编译器会在代码生成阶段触发断言错误。

问题现象

具体表现为以下代码会导致编译器断言失败：

#include <stdio.h>

struct string { char* begin; char* end; };

unsigned long size(struct string a) {
    return (a.end - a.begin) / sizeof(char);
}

struct string2 {
    char* begin;
    unsigned long size;
};

struct string2 convert(struct string a) {
    return (struct string2) {a.begin, size(a)};
}

void main(void) {
    char c[3] = "foo";
    struct string s = {c, c + 3};
    printf("%lu\n", size(s));
}

编译器会报错：c2m: mir-gen.c:4600: get_uptodate_def_insn: Assertion !gen_ctx->selection_ctx->hreg_refs_addr[hr].del_p' failed.`

问题分析

经过深入分析，这个问题实际上源于编译器代码选择阶段的一个bug。关键点在于：

当使用unsigned long类型作为除数时（无论是通过sizeof(char)还是直接使用1uLL），都会触发这个错误
如果改用unsigned类型则不会出现问题
问题与结构体转换和特定成员的存在有关，说明问题涉及复杂的类型转换和寄存器分配

本质上，这是编译器在处理特定类型的指针运算和类型转换组合时，在寄存器分配和代码选择阶段出现的逻辑错误。

解决方案

项目维护者已经提交了修复该问题的commit（b79c0ee2e919bea54ac0f877b5aba5a6cf68b69e），修正了代码选择阶段的处理逻辑。修复后，上述代码能够正常编译执行，输出预期的结果3。

技术启示

这个问题揭示了编译器开发中的几个重要方面：

类型系统处理：不同大小的整数类型在代码生成阶段可能需要特殊处理
指针运算转换：指针差值到整数的转换需要谨慎处理
寄存器分配：复杂表达式中的临时值管理容易出现问题
断言保护：编译器的内部一致性检查有助于快速定位问题

对于编译器开发者而言，这类问题提醒我们需要特别注意：

类型提升和转换规则的边界情况
复杂表达式中的中间结果管理
跨阶段的寄存器分配一致性

该问题的修复增强了MIR编译器处理复杂类型转换和指针运算的能力，提高了编译器的稳定性。

A lightweight JIT compiler based on MIR (Medium Internal Representation) and C11 JIT compiler and interpreter based on MIR

项目地址：https://gitcode.com/gh_mirrors/mi/mir

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

昇腾LLM分布式训练框架

flutter_flutter

deepin linux kernel

Oohos_react_native

React Native鸿蒙化仓库

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统