Remeda库中groupBy功能的扩展需求分析

2025-06-10 02:24:24作者：侯霆垣

背景介绍

Remeda是一个实用的TypeScript工具库，提供了许多函数式编程风格的实用工具。其中groupBy函数是一个常用的数据分组工具，但当前实现有一个显著限制：它只能基于字符串或可转换为字符串的值(如数字)进行分组。然而在实际开发中，我们经常需要基于更复杂的键类型(如对象)进行分组操作。

当前限制分析

现有的groupBy函数存在以下主要限制：

键类型受限：只能使用字符串或可转换为字符串的值作为分组键
相等性比较不足：对于对象类型的键，无法进行深度值比较
输出结构固定：返回结果是一个对象，键为字符串，值为分组后的数组

这些限制在需要基于复杂条件分组的场景下显得尤为突出，例如：

按照复合条件(多个字段组合)分组
按照对象引用或对象值分组
需要精确控制相等性比较逻辑的情况

解决方案设计

针对上述问题，可以设计一个新的groupInto函数，具有以下特性：

函数签名设计

type Group<K, V> = [key: K, items: V[]];
type Comparator<T> = (a: T, b: T) => (boolean | number);

function groupInto(items: T[], keyFn: (item: T) => K): Group<K, T>[];
function groupInto(items: T[], keyFn: (item: T) => K, comparator: Comparator<T>): Group<K, T>[];

核心特性

灵活的键类型：支持任意类型作为分组键，包括对象
可定制的比较器：允许传入自定义比较函数处理键的相等性判断
清晰的返回结构：返回键值对数组，便于后续转换为Map或其他结构

实现考虑

实现时需要考虑几个关键点：

性能优化：对于大型数据集，需要高效的键比较机制
类型安全：保持TypeScript的强类型特性
API一致性：与Remeda现有API风格保持一致

使用场景示例

假设我们有一组用户数据，需要按照地址对象进行分组：

const users = [
  {id: 1, name: 'Alice', address: {city: 'NY', zip: '10001'}},
  {id: 2, name: 'Bob', address: {city: 'NY', zip: '10001'}},
  {id: 3, name: 'Charlie', address: {city: 'SF', zip: '94105'}}
];

// 使用groupInto按地址分组
const grouped = groupInto(
  users,
  user => user.address,
  (a, b) => a.city === b.city && a.zip === b.zip
);

// 结果示例：
// [
//   [{city: 'NY', zip: '10001'}, [{id: 1...}, {id: 2...}]],
//   [{city: 'SF', zip: '94105'}, [{id: 3...}]]
// ]