MidScene v0.11.0 发布：Web内容提取优化与UI-TARS模型缓存能力增强

2025-06-07 02:38:28作者：农烁颖Land

MidScene 是一个专注于Web自动化测试和交互的开源项目，它提供了强大的工具链来进行用户操作、提取网页内容以及进行智能化的UI测试。该项目通过整合多种技术栈，为开发者提供了高效、可靠的Web自动化解决方案。

Web内容树形提取功能

在v0.11.0版本中，MidScene引入了一项重要的新特性——Web内容树形提取能力。这项功能彻底改变了传统平面化的内容提取方式，将网页内容组织为结构化的树形表示。

传统的Web内容提取往往将页面元素扁平化处理，丢失了DOM原有的层级关系。MidScene的新方法通过以下方式实现了更智能的提取：

这种树形表示不仅更接近人类对网页的认知方式，也为后续的自动化操作提供了更丰富的上下文信息。

性能优化是v0.11.0版本的另一个重点。新引入的UI-TARS模型缓存能力显著提升了测试执行效率。

UI-TARS（UI Testing and Recording System）模型的缓存机制通过以下方式工作：

实际测试表明，启用缓存后，典型测试场景的执行时间从1分16秒大幅降低到23秒，性能提升约70%。这种优化对于大型测试套件和持续集成环境尤为重要。

新版本改进了标注系统的视觉效果：

改进了waitForNetworkIdle方法的实现：

解决了Page Up/Page Down等键盘事件的处理问题：

v0.11.0版本还包含多项提升开发者体验的改进：

这些改进使得MidScene在保持强大功能的同时，更加易用和可靠。

MidScene v0.11.0通过引入Web内容树形提取和UI-TARS模型缓存两大核心功能，显著提升了Web自动化测试的能力和效率。这些改进不仅解决了实际开发中的痛点，也为更复杂的测试场景奠定了基础。对于需要进行大规模Web自动化测试的团队来说，这个版本值得重点关注和升级。

登录后查看全文