OpenCompass项目运行BBH数据集时的错误分析与解决方案

2025-06-08 10:23:00作者：柯茵沙

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

项目地址：https://gitcode.com/gh_mirrors/op/opencompass

问题背景

在使用OpenCompass评估框架运行Big-Bench Hard(BBH)数据集时，用户遇到了一个与配置文件解析相关的运行时错误。该错误发生在MMEngine尝试加载包含os.path.join操作的配置文件时，抛出了RuntimeError异常。这个问题影响了多个MMEngine版本(0.9.0和0.10.2)，表明它可能是一个更深层次的设计问题而非简单的版本兼容性问题。

错误现象

当配置文件尝试使用os.path.join构建文件路径时，系统会抛出以下错误栈：

RuntimeError
File "configs/datasets/bbh/bbh_gen_5b92b0.py", line 44
with open(os.path.join(os.path.dirname(__file__), 'lib_prompt', f'{_name}.txt'), 'r') as f:
...
raise RuntimeError()

根本原因分析

这个问题源于MMEngine的延迟加载(Lazy Loading)机制。在MMEngine的配置系统中，为了支持更灵活的配置方式，使用了LazyAttr装饰器来包装标准库函数。当配置文件被解析时，os.path.join等函数实际上被包装成了LazyAttr对象，而不是直接执行的标准库函数。

在MMEngine的lazy.py实现中，LazyAttr类重写了__call__方法，当直接调用被包装的函数时，如果没有先调用.build()方法，就会抛出RuntimeError异常。这是一种设计上的保护机制，确保配置项能够正确地按需构建。

解决方案

针对这个问题，社区提供了明确的解决方案：在使用os.path.join等被包装的函数时，需要显式调用.build()方法。具体修改如下：

将原来的代码：

os.path.join(os.path.dirname(__file__), 'lib_prompt', f'{_name}.txt')

修改为：

os.path.join.build()(os.path.dirname.build()(__file__), 'lib_prompt', f'{_name}.txt')

这种修改确保了被包装的函数能够正确地被构建和执行。需要注意的是，不仅os.path.join需要这样处理，其他被LazyAttr包装的函数(如os.path.dirname)也需要同样的处理方式。

技术深度解析

MMEngine采用这种延迟加载机制的主要目的是为了支持配置项的按需构建和动态解析。这种设计带来了几个优势：

配置灵活性：允许在配置文件中使用复杂的Python表达式和函数调用
性能优化：避免在配置加载阶段执行不必要的计算
依赖管理：更好地处理配置项之间的依赖关系

然而，这种设计也带来了一定的使用复杂性，开发者需要了解这种机制才能正确使用被包装的函数。在实际开发中，如果遇到类似的RuntimeError，检查是否有函数需要调用.build()方法是一个有效的调试方向。

最佳实践建议

在使用OpenCompass或其他基于MMEngine的项目时，注意查看相关文档中关于配置编写的特殊要求
当在配置文件中使用标准库函数时，如果遇到RuntimeError，尝试添加.build()调用
保持MMEngine和OpenCompass版本的最新状态，以获得最佳兼容性
在编写复杂配置时，可以先在简单的测试用例中验证配置语法的正确性

总结

OpenCompass作为基于MMEngine的评估框架，继承了其强大的配置系统功能。理解MMEngine的延迟加载机制对于正确使用OpenCompass至关重要。通过本文的分析和解决方案，开发者可以更好地处理类似问题，并充分利用OpenCompass提供的强大功能进行模型评估工作。

opencompass

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

项目地址：https://gitcode.com/gh_mirrors/op/opencompass

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

271