HIMLoco全流程上手指南：从环境搭建到策略部署

2026-03-08 05:19:38作者：盛欣凯Ernestine

面向机器人仿真开发者的零门槛实践教程

【环境准备】系统部署与依赖配置

1.1 代码仓库获取

准备工作：确保本地已安装Git工具执行命令：

git clone https://gitcode.com/gh_mirrors/hi/HIMLoco
cd HIMLoco

验证结果：检查目录下是否存在legged_gym/和rsl_rl/核心文件夹

1.2 依赖环境配置

三步配置法：

创建虚拟环境（推荐Python 3.8+）

python -m venv venv
source venv/bin/activate  # Linux/Mac
venv\Scripts\activate     # Windows

安装核心依赖

pip3 install -r requirements.txt

版本兼容性说明：

PyTorch 1.10.0+cu113：兼容CUDA 11.3-11.6版本
torchvision 0.11.1+cu113：需与PyTorch版本严格匹配
额外系统依赖：libgl1-mesa-glx（Linux）、Isaac Gym（需单独申请）

常见问题：训练启动失败可能原因

CUDA版本不匹配：使用nvidia-smi确认驱动支持的CUDA版本

Isaac Gym未安装：需从NVIDIA官网获取并安装对应版本

【核心模块解析】系统架构与功能演进

2.1 模块关系总览

图1：HIMLoco混合内模控制系统架构

2.2 核心目录功能解析

2.2.1 `legged_gym/`：腿式机器人仿真环境

功能演进时间线：

v1.0：基础仿真环境，支持A1和Aliengo机器人模型
v2.0：增加地形生成模块，支持随机障碍物环境
v3.0：集成力控传感器模拟，提升物理交互精度

核心组件：

envs/：包含各机器人模型配置（A1、Aliengo、Go1）
scripts/：训练与策略部署脚本
utils/：仿真辅助工具（地形生成、运动学计算）

2.2.2 `rsl_rl/`：强化学习算法实现

从基础RL到混合内模控制的算法迭代：

基础PPO（Proximal Policy Optimization）实现
引入混合内模（Hybrid Internal Model）机制
集成H∞鲁棒控制框架，提升抗干扰能力

关键算法模块：

algorithms/him_ppo.py：混合内模PPO实现
modules/him_actor_critic.py：强化学习智能体架构
runners/him_on_policy_runner.py：训练流程控制器

图2：H∞鲁棒控制框架示意图

2.2.3 `projects/`：项目应用实例

功能演进：

v1.0：仅包含基础行走控制器
v2.0：增加H∞控制项目（h_infinity/）
v3.0：完善混合内模控制项目（himloco/）

【实战操作】训练与部署流程

3.1 模型训练

三段式操作：

准备工作：

确认Isaac Gym环境变量已配置
选择目标机器人模型配置（默认A1）

执行命令：

python ./legged_gym/legged_gym/scripts/train.py \
  --config a1_config \
  --num_envs 4096 \
  --max_iterations 10000

参数说明：

--config：指定配置文件路径（位于对应机器人目录下）
--num_envs：并行环境数量（根据GPU内存调整）
--max_iterations：训练迭代次数

验证结果：

检查logs/目录下是否生成训练记录
观察终端输出的奖励值是否稳定上升

常见问题：训练过程中GPU内存溢出

解决方案：减少--num_envs参数值

推荐配置：12GB显存至少设置为2048

3.2 策略部署与测试

准备工作：

训练完成后，在logs/目录下获取最新模型权重

执行命令：

python ./legged_gym/legged_gym/scripts/play.py \
  --experiment_name a1_walk \
  --load_model latest \
  --export_policy True

参数说明：

--experiment_name：训练实验名称
--load_model：加载模型版本（latest或具体数字）
--export_policy：是否导出ONNX格式模型

验证结果：

仿真窗口自动打开，机器人开始执行行走策略
exported/目录下生成ONNX模型文件

图3：HIMLoco在多种地形环境下的行走测试

【扩展配置】高级环境设置

4.1 环境变量配置模板

# Isaac Gym环境变量
export ISAAC_GYM_PATH="/path/to/isaacgym"
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$ISAAC_GYM_PATH/python/

# 项目配置
export HIMLOCO_ROOT=$(pwd)
export PYTHONPATH=$PYTHONPATH:$HIMLOCO_ROOT/legged_gym:$HIMLOCO_ROOT/rsl_rl

4.2 机器人模型配置扩展

自定义机器人参数：

复制legged_gym/legged_gym/envs/a1/a1_config.py
修改关节限制、质量分布等物理参数
在训练命令中指定新配置文件：--config custom_config

4.3 进阶学习路径

算法原理：projects/h_infinity/README.md
控制理论：rsl_rl/modules/him_estimator.py源码解析
仿真优化：legged_gym/utils/terrain.py地形生成算法

总结

本指南从环境搭建到策略部署，系统介绍了HIMLoco项目的核心功能与使用流程。通过混合内模控制与H∞鲁棒控制的结合，该项目为腿式机器人提供了高效的运动控制解决方案。开发者可基于此框架进一步探索复杂地形下的机器人运动控制算法。

HIMLoco

Learning-based locomotion control from OpenRobotLab, including Hybrid Internal Model & H-Infinity Locomotion Control

项目地址：https://gitcode.com/gh_mirrors/hi/HIMLoco

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

394

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989

HIMLoco全流程上手指南：从环境搭建到策略部署

【环境准备】系统部署与依赖配置

1.1 代码仓库获取

1.2 依赖环境配置

【核心模块解析】系统架构与功能演进

2.1 模块关系总览

2.2 核心目录功能解析

2.2.1 legged_gym/：腿式机器人仿真环境

2.2.2 rsl_rl/：强化学习算法实现

2.2.3 projects/：项目应用实例

【实战操作】训练与部署流程

3.1 模型训练

3.2 策略部署与测试

【扩展配置】高级环境设置

4.1 环境变量配置模板

4.2 机器人模型配置扩展

4.3 进阶学习路径

总结

项目优选

2.2.1 `legged_gym/`：腿式机器人仿真环境

2.2.2 `rsl_rl/`：强化学习算法实现

2.2.3 `projects/`：项目应用实例