Nuitka编译工具中关于init.so文件处理的回归问题分析

2025-05-18 22:19:24作者：吴年前Myrtle

Nuitka is a Python compiler written in Python. It's fully compatible with Python 2.6, 2.7, 3.4-3.13. You feed it your Python app, it does a lot of clever things, and spits out an executable or extension module.

项目地址：https://gitcode.com/gh_mirrors/nu/Nuitka

问题背景

Nuitka作为Python代码编译工具，在2.3.4版本后出现了一个重要的回归问题。用户报告在使用Nuitka编译包含pydantic库(特别是1.9.2版本)的项目时，会出现"ImportError: attempted relative import with no known parent package"错误。这个问题在2.3.3版本中不存在，但在2.3.4及后续版本中重现。

问题重现

通过一个简单的测试用例可以重现该问题：

创建一个hello.py文件，内容为：

import pydantic.tools
print("hello world")

使用Nuitka 2.3.7版本编译：

python3 -m nuitka --follow-imports --onefile hello.py

运行编译后的程序会抛出导入错误

问题根源

经过开发团队分析，问题的根源在于Nuitka对__init__.so文件处理方式的变更。具体来说：

在2.3.3版本中，Nuitka会优先查找__init__.py文件
在2.3.4版本中，代码修改为优先查找__init__.so文件
当同时存在__init__.py和__init__.so时，新版本会错误地选择__init__.so文件
这种选择导致了Python包结构识别出现问题，进而引发相对导入失败

技术细节

问题的核心在于nuitka/utils/Importing.py文件中的修改。在2.3.4版本中，文件查找顺序从原来的优先.py文件变为了优先共享库文件(如.so)。这个变更原本是为了更好地支持扩展模块，但在实现时没有考虑到所有场景。

对于pydantic 1.9.2这样的旧版本库，这种变更会导致包结构识别错误，因为：

旧版本的包可能不完全兼容新的加载机制
相对导入依赖于正确的父包识别
当__init__.so被优先加载时，Python的包机制可能无法正确建立

解决方案

开发团队提供了两种解决方案：

临时解决方案：使用--prefer-source-code选项强制Nuitka优先使用Python源代码而非编译后的扩展模块
永久修复：在factory分支(开发版本)中，团队改进了.pyi解析器，使其能够正确处理这种情况。具体包括：
- 增强解析器对非标准Python语法的容错能力
- 优化依赖关系分析
- 确保包结构识别的正确性