ACT++项目中动作维度差异的技术解析

2025-06-25 01:08:23作者：虞亚竹Luna

项目地址：https://gitcode.com/gh_mirrors/ac/act-plus-plus

背景介绍

在机器人学习领域，ACT(Adaptive Computation Time)算法因其在时序任务中的优异表现而备受关注。ACT++项目是基于ACT算法的一个实现，专注于机器人控制任务。在实际应用中，开发者经常需要将该算法适配到不同类型的机械臂上，这就需要对算法中的动作维度有清晰的理解。

动作维度差异现象

在ACT++项目的实际应用中，开发者发现了一个值得关注的现象：通过record_sim_episodes.py脚本生成的数据集中，动作维度为14维；而在通过imitate_episode.py脚本加载数据时，动作维度却变成了16维。这种维度差异可能会影响算法的训练效果和最终性能。

技术原因分析

经过深入代码分析，发现这一差异源于EpisodicDataset类的数据处理方式。具体来说：

原始数据：record_sim_episodes.py记录的动作数据确实是14维的，这对应于机械臂的基本控制参数。
数据处理：在通过load_data和get_norm_stats()函数加载数据时，系统会自动在动作数据后添加两个零值(dummy_base_action)，从而将维度扩展到16维。
设计意图：这种设计是为了适配移动式双手动机器人的控制需求。除了14维的手臂位置参数外，移动基座的位置控制还需要额外的2维参数。即使某些机械臂不需要基座控制，系统也保留了这两个维度以确保架构的统一性。

对算法适配的影响

对于希望将ACT++应用到其他机械臂的开发者，需要注意以下几点：

维度匹配：新机械臂的控制系统需要与16维的动作空间兼容。如果实际只需要14维，可以在最后两维填充零值。
归一化处理：由于get_norm_stats()会计算所有16维的统计量，开发者需要确保额外的维度不会影响实际控制维度的归一化效果。
网络架构：ACT算法的网络输出层需要设置为16维，即使部分维度可能不被使用。

最佳实践建议

对于固定基座的机械臂，可以保持最后两个动作维度为零，不影响实际控制。
如果需要完全移除基座控制维度，可以修改EpisodicDataset类，但要注意保持整个数据处理流程的一致性。
在训练新机械臂时，建议先检查动作维度的匹配情况，确保不会因为维度不匹配导致训练异常。

总结

ACT++项目中的这种维度设计体现了对多种机器人平台的兼容性考虑。理解这一设计原理有助于开发者更好地将算法适配到不同的机械臂系统上。在实际应用中，开发者可以根据目标机械臂的具体需求，灵活处理这些额外的动作维度，以获得最佳的控制效果。

项目地址：https://gitcode.com/gh_mirrors/ac/act-plus-plus

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统