SQL.js 实现自定义排序规则的技术探索

2025-05-17 18:45:56作者：管翌锬

SQL.js 作为 SQLite 的 JavaScript 实现版本，为开发者提供了在浏览器环境中使用 SQLite 数据库的能力。然而，在处理国际化文本（如带有变音符号的字符）时，标准的排序规则可能无法满足特定需求。本文将深入探讨如何在 SQL.js 中实现自定义排序规则的技术方案。

自定义排序规则的需求背景

在处理多语言文本数据时，特别是包含变音符号（如重音符号、分音符等）的文本时，标准的排序规则往往无法准确反映语言特定的排序需求。例如，在法语中，"é"应该排在"e"之后但在"f"之前，而标准ASCII排序可能无法正确处理这种情况。

SQLite 原生支持

SQLite 原生提供了 sqlite3_create_collation 函数，允许开发者注册自定义的排序规则。这个函数接受一个回调函数，该回调函数负责比较两个字符串并返回它们的相对顺序。

SQL.js 的实现方案

在 SQL.js 中实现自定义排序规则需要扩展其 API。核心实现包括以下几个部分：

C 函数绑定：通过 Emscripten 的 cwrap 方法绑定原生的 sqlite3_create_collation 函数
JavaScript 包装器：创建一个 JavaScript 函数作为原生 C 函数的接口
回调处理：实现一个包装函数来处理 JavaScript 回调与 C 函数之间的数据转换

关键代码实现

// 绑定原生函数
var sqlite3_create_collation = cwrap(
    "sqlite3_create_collation",
    "number",
    ["number", "string", "number", "number", "number"]
);

// 实现自定义排序规则API
Database.prototype.create_collation = function(name, func) {
    function wrapped_func(cx, argc, argv) {
        var args = parseFunctionArguments(argc, argv);
        var result;
        try {
            result = func.apply(null, args);
        } catch (error) {
            sqlite3_result_error(cx, error, -1);
            return;
        }
        setFunctionResult(cx, result);
    }
    
    // 清理已存在的同名函数
    if (Object.prototype.hasOwnProperty.call(this.functions, name)) {
        removeFunction(this.functions[name]);
        delete this.functions[name];
    }
    
    // 注册新函数
    var func_ptr = addFunction(wrapped_func, "iiiiii");
    this.functions[name] = func_ptr;
    this.handleError(sqlite3_create_collation(
        this.db,
        name,
        SQLITE_UTF8,
        0,
        func_ptr
    ));
    return this;
};