BotFramework-WebChat项目中视频字幕支持的技术解析

2025-07-09 12:30:58作者：苗圣禹Peter

BotFramework-WebChat

A highly-customizable web-based client for Azure Bot Services.

项目地址：https://gitcode.com/gh_mirrors/bo/BotFramework-WebChat

背景介绍

在BotFramework-WebChat项目中，用户报告了一个关于视频内容可访问性的重要问题：当使用"Card Productvideo"功能时，预录制的视频内容缺乏字幕支持。这对听力障碍用户造成了访问障碍，违反了网络内容可访问性指南(WCAG)的相关标准。

技术原因分析

经过深入调查，发现这一问题的根源在于项目所依赖的Adaptive Cards版本限制。当前Web Chat实现使用的是Adaptive Cards 1.3版本，而该版本在设计上存在以下技术限制：

媒体元素支持不完整：1.3版本仅支持基本的视频和音频媒体源(mimeType和url)，但未提供添加字幕轨道(captionSources)的功能接口。
API设计局限：在1.3版本的媒体元素JSON结构中，只有简单的sources数组用于指定媒体源，缺乏专门的字幕轨道定义区域。
向后兼容考虑：作为开源项目，Web Chat需要保持对广泛环境的兼容性，这限制了其升级到新版Adaptive Cards的能力。

解决方案演进

在Adaptive Cards的后续版本中，这一问题已得到解决：

1.6版本的改进：新版Adaptive Cards引入了captionSources属性，允许开发者通过JSON配置直接为视频添加字幕轨道。
现代Web Chat的替代方案：最新版的Web Chat提供了更灵活的HTML标签直接嵌入功能，开发者可以绕过Adaptive Cards限制，直接使用标准的HTML5 video元素及其字幕支持功能。

技术实现对比

旧版实现(1.3)的JSON结构示例

{
  "type": "Media",
  "sources": [
    {
      "mimeType": "video/mp4",
      "url": "video-source.mp4"
    }
  ]
}

新版实现(1.6)的JSON结构示例

{
  "type": "Media",
  "sources": [
    {
      "mimeType": "video/mp4",
      "url": "video-source.mp4"
    }
  ],
  "captionSources": [
    {
      "mimeType": "captions",
      "url": "captions.vtt",
      "label": "English"
    }
  ]
}

对开发者的建议

短期解决方案：对于必须使用当前版本的项目，建议考虑在视频内容之外提供文字转录，或使用辅助性的文字说明来弥补字幕缺失。
长期规划：建议评估升级到支持新版Adaptive Cards或现代Web Chat的可能性，以获得完整的字幕支持功能。
可访问性测试：无论采用何种方案，都应进行全面的可访问性测试，确保所有用户都能平等地获取视频内容中的信息。

总结

视频内容的可访问性是现代Web应用不可忽视的重要方面。BotFramework-WebChat项目中的这一案例展示了技术债务和向后兼容需求如何影响功能实现，也体现了开源生态系统中各组件版本协调的重要性。开发者应当充分了解所依赖组件的功能边界，并在设计初期就将可访问性需求纳入考虑范围。

BotFramework-WebChat

A highly-customizable web-based client for Azure Bot Services.

项目地址：https://gitcode.com/gh_mirrors/bo/BotFramework-WebChat

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统