Thorium阅读器中的屏幕阅读器标注功能可访问性分析

2025-07-04 20:08:07作者：曹令琨Iris

A cross platform desktop reading app, based on the Readium Desktop toolkit

项目地址：https://gitcode.com/gh_mirrors/th/thorium-reader

功能背景

Thorium阅读器作为一款开源的电子书阅读软件，提供了文本标注功能以增强用户的阅读体验。该功能允许用户在电子书文本上添加注释和标记，类似于传统纸质书中的批注功能。对于视障用户而言，通过屏幕阅读器访问这一功能尤为重要。

当前技术现状

在最新版本的Thorium阅读器中，标注功能的实现依赖于用户首先在HTML文档中进行文本选择。对于普通用户而言，可以通过鼠标轻松完成文本选择操作。然而，对于使用NVDA等屏幕阅读器的视障用户，目前存在以下技术限制：

文本选择机制差异：NVDA在Chromium内核浏览器中缺乏完善的DOM文本选择支持，这是由于Chromium的IAccessibleTextSelectionContainer接口实现存在偏移量计算问题，导致无法准确建立原生文本选择。
快捷键操作：Thorium提供了SHIFT+CONTROL+ALT+A的组合键来触发标注编辑器，但由于GUI组件库的更新（Thorium v3版本），该功能的屏幕阅读器兼容性尚未完全成熟。

技术挑战解析

屏幕阅读器在Chromium内核中实现文本选择面临的核心问题是：

底层可访问性API的实现不完整
文本偏移量计算不准确
选择范围映射错误

这些问题导致屏幕阅读器无法像在Firefox中那样可靠地创建文本选择范围，进而影响了标注功能的可访问性。

替代方案探讨

针对当前的技术限制，可以考虑以下改进方向：

辅助输入方式：提供专门的标注输入框，允许用户手动输入或粘贴需要标注的文本内容，绕过直接的DOM选择需求。
书签功能增强：将书签功能扩展为支持多行文本输入的注释功能，作为标注功能的替代方案。
屏幕阅读器适配优化：改进Thorium的可访问性树实现，提供更可靠的文本选择接口供屏幕阅读器使用。

用户体验建议

对于当前版本的用户，可以尝试以下操作流程：

使用屏幕阅读器的浏览模式定位到目标文本
尝试通过键盘命令创建选择范围
使用系统提供的快捷键调用标注功能
如遇困难，考虑使用替代的书签功能记录阅读笔记

未来展望

随着Thorium v3的持续开发，预期将在以下方面改进标注功能的可访问性：

优化GUI组件库的屏幕阅读器兼容性
提供更可靠的选择范围检测机制
增加对多种屏幕阅读器操作模式的支持

开发团队欢迎用户反馈使用体验，以便持续改进产品的无障碍访问特性。对于视障用户而言，完整可用的标注功能将大大提升电子书阅读的交互性和便利性。

A cross platform desktop reading app, based on the Readium Desktop toolkit

项目地址：https://gitcode.com/gh_mirrors/th/thorium-reader

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统