Rime-ice 输入法方案中自定义拼写代数规则的方法

2025-05-21 10:54:19作者：羿妍玫Ivan

背景介绍

Rime-ice 是一款基于 Rime 输入法引擎的优秀输入方案，它提供了丰富的拼写代数（speller algebra）规则来自动纠正用户的拼音输入。这些规则能够智能地处理常见的拼音输入错误或模糊音情况，提升输入体验。

问题分析

在默认的 rime_ice.schema.yaml 文件中，包含了一条特定的拼写代数规则：

derive/([zcs])h([aeiu])$/$1$2h/  # zih → zhi

这条规则的设计初衷是将类似 "zih" 这样的输入自动纠正为 "zhi"，解决用户在输入翘舌音时可能出现的错误。然而，当用户启用了 z 和 zh 的模糊音功能后，这条规则会导致输入 "zhuh" 时只能显示 "zhu"（翘舌）相关的候选词，而无法显示用户可能期望的 "祝好"、"祝贺" 等词语。

解决方案

要解决这个问题，我们需要在 rime_ice.custom.yaml 文件中自定义拼写代数规则。以下是两种可行的解决方案：

方法一：完全覆盖拼写代数规则

将原始方案中的整个 speller/algebra 部分复制到 custom 文件中
删除或注释掉不需要的规则
注意不要保留最后的 + 号

示例代码：

patch:
  speller/algebra:
    - a
    - b
    - c
    - d
    # - derive/([zcs])h([aeiu])$/$1$2h/  # 注释掉不需要的规则
    ...(其他需要的规则)

方法二：选择性禁用特定规则

如果只需要禁用特定的规则而不影响其他拼写代数功能，可以采用以下方式：

在 custom 文件中使用减法操作符
精确指定要移除的规则

示例代码：

patch:
  speller/algebra/-:
    - derive/([zcs])h([aeiu])$/$1$2h/

技术原理

Rime 输入法的拼写代数系统是一个强大的字符串转换引擎，它通过一系列正则表达式规则来处理用户的输入。每条 derive 规则都包含两个部分：匹配模式和替换模式。当用户输入匹配左侧模式时，系统会自动将其转换为右侧的模式。

在本文讨论的案例中，([zcs])h([aeiu])$ 会匹配以 z、c 或 s 开头，后接 h 和 a/e/i/u 结尾的拼音，然后将其转换为第一个字母直接连接韵母再加 h 的形式。这种转换在某些情况下很有用，但在模糊音场景下可能会产生不理想的效果。

最佳实践建议

在修改拼写代数规则前，建议先备份原始配置文件
每次只修改一条规则，测试效果后再进行其他调整
对于复杂的拼写需求，可以考虑编写多条互补的规则
注意规则的顺序，因为 Rime 会按顺序应用这些规则

通过合理定制拼写代数规则，用户可以打造出完全符合个人输入习惯的输入方案，在保持输入效率的同时获得最佳的候选词排序体验。

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

454

436

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。