HighwayEnv项目中状态数据结构解析与KeyError问题解决

2025-06-28 09:27:56作者：俞予舒Fleming

A minimalist environment for decision-making in autonomous driving

项目地址：https://gitcode.com/gh_mirrors/hi/HighwayEnv

在强化学习项目HighwayEnv的开发过程中，状态(state)数据结构的设计和使用是一个关键环节。本文将从技术角度深入分析该环境中的状态结构，并针对常见的KeyError问题提供解决方案。

状态数据结构解析

HighwayEnv环境中的状态对象采用了一种复合数据结构设计，主要由两个部分组成：

观测部分：包含三个核心元素
- observation：当前环境的观测值（6维数组）
- achieved_goal：已实现的目标状态
- desired_goal：期望达到的目标状态
信息部分：包含环境运行的元信息
- speed：当前速度
- crashed：是否发生碰撞
- action：最近执行的动作
- is_success：是否成功完成任务

这种设计借鉴了GoalEnv的思想，将目标条件强化学习(GCRL)的要素融入到了传统的观测空间中。

典型问题分析

开发者在使用过程中常会遇到KeyError: 0的错误，这通常源于对状态数据结构的误解。错误通常出现在以下场景：

action = agent.select_action(state[0]["observation"])

这种错误的本质原因是将整个状态对象当作字典处理，而实际上状态是一个包含两个元素的元组(tuple)：

state[0]：观测部分（OrderedDict）
state[1]：信息部分（字典）

正确使用方法

方法一：元组解包

observation_dict, info = state
observation = observation_dict["observation"]
desired_goal = observation_dict["desired_goal"]

方法二：直接访问

# 获取观测值
observation = state[0]["observation"]

# 获取环境信息
speed = state[1]["speed"]

方法三：重置环境时直接解包

obs_dict, info = env.reset()

最佳实践建议

类型检查：在处理状态前，建议使用type()或isinstance()检查对象类型
结构打印：开发时先打印print(state)查看完整结构
文档参考：仔细阅读环境的observation_space和action_space定义
错误处理：添加try-catch块捕获可能的KeyError

深入理解设计思想

HighwayEnv采用这种复合状态设计有几个优势：

目标条件强化学习支持：通过分离achieved_goal和desired_goal，便于实现基于目标的策略
信息分离：将核心观测与辅助信息分开，保持观测空间的纯净
扩展性：可以方便地添加新的观测或信息字段而不影响已有代码

理解这种设计模式有助于开发者更好地利用HighwayEnv进行强化学习算法的开发和测试。

总结

正确处理HighwayEnv中的状态数据结构是开发可靠强化学习系统的第一步。通过本文的分析，开发者应该能够：

清晰理解状态对象的两层结构
避免常见的KeyError访问错误
采用更优雅的代码方式访问状态内容
深入理解环境设计者的意图

这些知识将为后续的算法实现和环境扩展打下坚实基础。

A minimalist environment for decision-making in autonomous driving

项目地址：https://gitcode.com/gh_mirrors/hi/HighwayEnv

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。