探索混合智能：结合深度强化学习与约束编程的组合优化解决方案

2024-06-04 05:17:36作者：谭伦延

在日常生活中和各个行业中，组合优化问题无处不在，从航空调度到物流规划，再到金融市场投资决策。解决这类问题的关键在于找到最优解，然而随着问题规模的增长，可能的解决方案数量呈指数级增长，使得计算变得极其复杂。

近年来，深度强化学习（DRL）在设计解决NP难组合优化问题的高效启发式算法方面展现出巨大潜力。尽管如此，现有的方法通常专注于标准旅行商问题，并难以扩展到其他问题，且只能提供近似解，缺乏系统性提高或证明最优性的手段。

另一方面，约束编程（CP）是一种强大的通用工具，能够为组合优化问题提供完整的搜索策略。尽管CP保证能找到最优解，但如何有效指导搜索空间的探索（即分支决策）使其在实际应用中仍具挑战性。

为此，我们引荐一个创新的开源项目，它融合了DRL和CP的优势，为解决组合优化问题提供了全新的视角。项目的核心是动态规划（DP）的表述，作为连接两种技术的桥梁，旨在打破现有的局限。

在这个项目中，我们实验性地展示了该框架在解决两个极具挑战性的问题上的优越性能：带时间窗口的旅行商问题（TSPTW）和包含均值、偏差、偏度和峰度的四阶矩投资组合优化问题。实验证明，我们的求解器不仅优于单独的DRL和CP方案，而且可以与业界领先的商业求解器相媲美。

项目结构清晰，包括问题定义的DP模型、DQN和PPO强化学习环境与模型、预先训练好的模型以及多种利用学习模型的CP求解策略。此外，还有随机实例生成器用于模型训练和求解器评估。

安装过程简单，只需通过Git克隆仓库，设置conda虚拟环境，编译Gecode，然后编译项目即可。提供的脚本可方便进行模型训练和问题求解。

项目特点：

这个项目不仅是研究者和开发者探索智能算法应用于组合优化的理想平台，也为业界专业人士提供了潜在的优化工具。无论是学术研究还是实际应用，这都是一个值得尝试的优秀项目。现在就加入，开启您的混合智能之旅吧！

登录后查看全文