OpenCompass评估配置中KeyError问题的分析与解决

2025-06-08 05:08:12作者：何举烈Damon

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

项目地址：https://gitcode.com/gh_mirrors/op/opencompass

问题背景

在使用OpenCompass大模型评估工具时，部分用户在执行标准评估流程时遇到了KeyError异常。具体表现为当用户按照官方文档教程运行python run.py configs/eval_demo.py -w outputs/demo --debug命令时，系统抛出KeyError: 'opt125m'错误，导致评估流程无法正常执行。

问题现象

该问题主要表现出以下特征：

直接使用命令行参数指定模型和数据集的方式可以正常运行
使用配置文件方式执行时出现KeyError
错误信息指向配置系统中无法找到'opt125m'这个键值
该问题在某次代码更新后出现，之前版本工作正常

技术分析

经过深入分析，这个问题源于OpenCompass配置系统的变更。在较新版本中，配置系统对模型名称的引用方式进行了调整，但示例配置文件eval_demo.py未能及时同步更新。

具体技术细节：

配置系统使用Python的ast模块解析配置文件
在解析过程中，系统尝试从基础字典中查找'opt125m'键值
由于模型命名规范变更，该键值已不存在于基础字典中
导致Config类的__missing__方法抛出KeyError异常

解决方案

开发团队已通过代码合并修复了该问题，主要修改包括：

更新示例配置文件中的模型引用方式
确保配置系统能够正确解析新的模型命名规范
保持向后兼容性，避免影响现有用户的配置

用户应对措施

对于遇到此问题的用户，可以采取以下解决方案：

更新到最新版本的OpenCompass代码
检查并更新本地配置文件中的模型引用方式
如果暂时无法更新，可以使用命令行参数方式指定模型和数据集

经验总结

这个案例提醒我们：

在开源项目迭代过程中，配置系统的变更需要特别关注兼容性
示例文档和配置文件应与核心代码同步更新
完善的错误处理机制可以帮助用户更快定位问题
保持项目依赖项和子模块的同步更新非常重要

通过这次问题的分析和解决，OpenCompass的配置系统变得更加健壮，能够更好地支持各种评估场景。

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

项目地址：https://gitcode.com/gh_mirrors/op/opencompass

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

deepin linux kernel

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

flutter_flutter

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统