MDN浏览器兼容性数据项目v5.7.0版本发布分析
MDN浏览器兼容性数据项目是一个为Web开发者提供全面浏览器支持信息的开源数据库。该项目通过结构化数据形式记录了各种Web技术在不同浏览器版本中的兼容性情况,帮助开发者快速判断某项功能是否可以在目标浏览器中使用。
本次发布的v5.7.0版本主要围绕WebDriver双向通信协议(BiDi)的支持进行了重大更新,同时对Canvas 2D上下文、图像数据处理等Web API功能进行了补充和完善。作为Web自动化测试领域的重大进步,WebDriver BiDi协议的加入将为开发者提供更强大的浏览器自动化控制能力。
WebDriver双向通信协议支持
v5.7.0版本最重要的更新是全面引入了WebDriver BiDi协议的兼容性数据。WebDriver BiDi是下一代浏览器自动化协议,相比传统的WebDriver Classic协议,它提供了双向通信能力,允许浏览器主动向测试脚本推送事件通知。
新版本在数据结构上进行了清晰划分:
- 传统WebDriver命令被迁移到
webdriver.classic.*命名空间下 - 新增的BiDi协议数据则放置在
webdriver.bidi.*命名空间下
BiDi协议的支持范围非常广泛,包含了浏览器控制、页面导航、网络请求拦截、脚本执行、权限管理等多个核心模块。例如:
- 浏览器上下文管理:支持创建和删除用户上下文
- 页面控制:提供截图、打印、视口设置等功能
- 网络拦截:可以在请求发送前后进行干预
- 脚本执行:支持预加载脚本和函数调用
这些功能的加入使得自动化测试脚本能够更精细地控制浏览器行为,实现更复杂的测试场景。
Canvas与图像处理增强
本次更新还完善了Canvas 2D渲染上下文和图像数据处理相关的兼容性信息:
-
新增了CanvasRenderingContext2D和OffscreenCanvasRenderingContext2D的lang属性支持数据,这个属性允许开发者指定画布内容的语言,对于国际化应用和辅助技术具有重要意义。
-
ImageData构造函数现在支持settings参数,特别是加入了colorSpace选项的兼容性数据,这使得开发者可以在不同色彩空间下创建图像数据,满足专业图像处理需求。
窗口通信与CSS渐变改进
Window.postMessage方法新增了options参数的delegate特性支持数据。这个特性允许消息发送方指定是否将消息委托给其他窗口处理,为跨窗口通信提供了更灵活的控制方式。
在CSS方面,本次更新完善了各种渐变函数对单色停止点(single color stop)的支持情况。现在开发者可以更准确地了解conic-gradient、linear-gradient和radial-gradient等渐变函数在不同浏览器中对简化语法的支持程度。
浏览器版本更新
随着各主流浏览器发布新版本,兼容性数据库也同步更新至:
- Chrome/Chrome Android/WebView Android 137
- Firefox/Firefox Android 139
这些版本数据的加入确保了开发者能够获取最新的浏览器兼容性信息。
总结
MDN浏览器兼容性数据项目v5.7.0版本通过引入WebDriver BiDi协议支持,为Web自动化测试领域带来了重要更新。同时,对Canvas、图像处理、窗口通信等Web API的完善,进一步提升了数据库的全面性和实用性。这些更新将帮助开发者更准确地评估技术方案的可行性,构建兼容性更好的Web应用。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00