Ant Design 输入框中 emoji 字符长度计算问题的解决方案

2025-04-29 23:29:08作者：魏侃纯Zoe

在 Ant Design 组件库的实际开发中，我们经常会遇到一个看似简单但实则复杂的问题：当在 Input 输入框组件中设置 maxLength 属性限制输入长度时，对于 emoji 表情符号的长度计算会出现偏差。这个问题的本质在于 JavaScript 对 Unicode 字符的处理机制。

问题现象

当开发者在 Ant Design 的 Input 组件中设置 maxLength=3 时：

输入普通 ASCII 字符如 "aaa" 可以正常输入三个字符
但输入一个 emoji 表情如 "🤣" 后，输入框就认为已经达到了最大长度限制

这种不一致的行为会导致用户体验问题，特别是对于需要输入多种字符类型的应用场景。

技术背景

这个问题的根源在于 JavaScript 的字符串长度计算机制。在 JavaScript 中：

普通 ASCII 字符使用 1 个代码单元表示
而许多 emoji 表情使用 2 个代码单元（代理对）表示
更复杂的 emoji 序列（如肤色变化、性别变化等）可能使用更多代码单元

String.prototype.length 属性返回的是字符串中 UTF-16 代码单元的数量，而不是用户感知的字符数量。这就是为什么一个 emoji 表情会被计算为 2 个长度单位。

解决方案

方案一：使用自定义长度计算函数

开发者可以通过组合使用 normalize() 方法和迭代器来准确计算可见字符数量：

function getVisibleLength(str) {
  return [...str.normalize()].length;
}

这种方法会将字符串规范化为 NFC 形式，然后使用扩展运算符将字符串拆分为字素簇，最后计算数组长度。

方案二：使用 Intl.Segmenter API（现代浏览器）

较新的浏览器支持 Intl.Segmenter API，可以更准确地分割文本：

function getGraphemeCount(str) {
  const segmenter = new Intl.Segmenter('en', {granularity: 'grapheme'});
  return [...segmenter.segment(str)].length;
}

方案三：Ant Design 高级用法

Ant Design 提供了 showCount 属性，允许开发者自定义计数逻辑：

<Input
  maxLength={100}
  showCount={{
    formatter: ({ value, count, maxLength }) => {
      const visibleLength = [...value.normalize()].length;
      return `${visibleLength} / ${maxLength}`;
    }
  }}
/>