Espanso 文本扩展工具中的按键延迟问题解析

2025-05-21 22:57:33作者：申梦珏Efrain

问题背景

在Windows表单填写场景中，用户通常使用Tab键在不同文本框间切换。然而，当使用Espanso这类文本扩展工具时，直接使用A\tB\tC这样的表达式会导致所有内容都输入到第一个获得焦点的文本框中，而无法实现预期的Tab切换效果。

技术原理分析

这种现象的根本原因在于Windows表单处理输入事件的速度与Espanso发送按键事件的速度不匹配。当Espanso快速连续发送按键事件时，表单控件可能没有足够的时间处理前一个事件并转移焦点，导致后续内容仍然输入到当前焦点所在的控件中。

现有解决方案评估

1. 使用PowerShell脚本方案

通过PowerShell的System.Windows.Forms.SendKeys类可以实现带延迟的按键发送：

Add-Type -AssemblyName System.Windows.Forms
[System.Windows.Forms.SendKeys]::SendWait("A")
Start-Sleep -Milliseconds 50
[System.Windows.Forms.SendKeys]::SendWait("{TAB}")
Start-Sleep -Milliseconds 50
[System.Windows.Forms.SendKeys]::SendWait("B")

这种方案的优势是精确控制每个按键之间的延迟时间，确保表单有足够时间处理焦点切换。但缺点是需要依赖外部脚本，配置相对复杂。

2. 使用xdotool方案（Linux环境）

Linux用户可以使用xdotool工具实现类似功能：

xdotool key BackSpace BackSpace BackSpace
xdotool type "Some text"
xdotool key KP_Enter
sleep 1.5
xdotool type "Some more text"

3. Python脚本方案

利用Python的pynput库可以构建更灵活的按键模拟方案：

from pynput.keyboard import Controller
import time

keyboard = Controller()

def type_with_delay(text, delay=0.05):
    for char in text:
        keyboard.press(char)
        keyboard.release(char)
        time.sleep(delay)

技术实现改进

在Mac平台上，Espanso的底层实现需要特别注意字符发送的分块处理。由于CGEventKeyboardSetUnicodeString方法的限制，超过20个字符的字符串会被截断，因此需要分块发送：

int i = 0;
while (i < buffer.size()) {
    int chunk_size = 20;
    if ((i+chunk_size) > buffer.size()) {
        chunk_size = buffer.size() - i;
    }
    
    UniChar * offset_buffer = buffer.data() + i;
    CGEventRef e = CGEventCreateKeyboardEvent(NULL, 0x31, true);
    CGEventSetLocation(e, ESPANSO_POINT_MARKER);
    CGEventKeyboardSetUnicodeString(e, chunk_size, offset_buffer);
    CGEventPost(kCGHIDEventTap, e);
    CFRelease(e);
    
    usleep(udelay);
    
    // 发送释放事件
    CGEventRef e2 = CGEventCreateKeyboardEvent(NULL, 0x31, false);
    CGEventSetLocation(e2, ESPANSO_POINT_MARKER);
    CGEventPost(kCGHIDEventTap, e2);
    CFRelease(e2);
    
    usleep(udelay);
    i += chunk_size;
}