MidScene v0.12.4版本发布：UI自动化测试与YAML缓存新特性解析

2025-06-07 17:52:58作者：瞿蔚英Wynne

MidScene是一个专注于Web界面自动化测试与交互的开源项目，它通过智能化的方式帮助开发者完成Web应用的UI测试、表单填写、页面操作等任务。该项目采用了先进的AI技术来自动化处理Web界面交互，大大提升了测试效率和准确性。

核心功能升级

UI-Tars模型新增断言与等待功能

本次版本在UI-Tars模型中引入了两个重要方法：aiAssert()和aiWaitFor。这两个方法为自动化测试脚本提供了更强大的验证能力：

aiAssert()方法允许开发者在测试过程中对页面元素状态进行智能断言，不再需要手动编写复杂的验证逻辑
aiWaitFor功能则解决了异步加载场景下的等待问题，能够智能判断页面元素的就绪状态

这两个功能的加入使得UI自动化测试更加健壮和可靠，特别是在处理动态加载内容的现代Web应用时表现尤为突出。

性能与稳定性优化

YAML文件缓存机制

新版本引入了一个重要的性能优化特性——YAML文件缓存支持。这一改进带来了以下优势：

执行速度提升：通过文件级别的缓存机制，重复执行的YAML脚本可以跳过解析阶段
稳定性增强：缓存减少了文件IO操作，降低了因文件系统问题导致的执行失败概率
自动缓存管理：缓存ID默认使用YAML文件名，开发者无需额外配置

这一特性特别适合在持续集成环境中运行大量测试用例的场景，能够显著减少整体执行时间。

大语言模型适配优化

针对Qwen等大语言模型的使用场景，本次更新进行了多项优化：

输入长度警告：当输入内容超过模型处理能力时，系统会给出明确警告
提示词优化：针对Qwen模型的特点调整了系统提示词，提高了指令理解的准确性
表单处理改进：修复了在包含表单的页面中可能出现的过度规划问题

这些改进使得MidScene在使用不同大语言模型作为后端时都能保持稳定的表现。

开发者体验提升

Chrome DevTools桥接增强

开发者工具桥接功能现在支持更长时间的连接，这对于调试复杂的自动化流程非常有帮助。开发者可以：

保持更长时间的调试会话
在复杂场景下进行更深入的问题排查
减少因连接中断导致的重复工作

文档与示例完善

本次更新包含了多项文档改进：

Agent API文档重构，更清晰地展示了接口功能和使用方法
Bridge API结构调整，使开发者更容易找到所需信息
快速体验指南的内容修正，确保新手能够顺利入门
桥接模式使用说明更新，反映了最新的最佳实践

安全性与代码质量

项目团队持续关注代码质量与安全性：

修复了敏感信息明文记录的安全隐患
优化了代码静态检查发现的各类问题
进行了核心包的重命名，使项目结构更加清晰

这些改进虽然对终端用户不可见，但为项目的长期健康发展奠定了基础。

总结

MidScene v0.12.4版本在功能丰富性、性能优化和开发者体验三个方面都取得了显著进步。新加入的UI断言与等待功能为自动化测试提供了更强大的工具，YAML缓存机制则大幅提升了执行效率。同时，对大语言模型的适配优化使得系统在不同AI后端上都能稳定工作。这些改进共同推动MidScene向着更成熟、更易用的方向发展，为Web自动化测试领域带来了新的可能性。

midscene

Let AI be your browser operator.

项目地址：https://gitcode.com/GitHub_Trending/mid/midscene

登录后查看全文