Peewee项目中使用JSONField实现自定义查询操作符

2025-05-20 20:12:48作者：郜逊炳

在Peewee ORM框架中，SQLite数据库的JSONField扩展提供了基本的JSON数据存储和查询功能。然而，当我们需要实现更复杂的JSON字段查询逻辑时，特别是需要部分匹配JSON对象中的键值对时，就需要自定义查询操作符。

问题背景

假设我们有一个KV模型，其中包含一个JSONField类型的opt字段。我们需要实现这样的查询逻辑：当查询条件中的JSON对象是目标JSON对象的子集时，就认为匹配成功。例如：

当查询条件为{'k1': 0, 'k2': 1}时，只匹配完全相同的JSON对象
当查询条件为{'k1': 1}时，匹配所有包含'k1': 1的JSON对象，无论是否包含其他键值对

SQLite的JSON功能限制

SQLite本身不提供原生的json_contains()类型函数来实现这种部分匹配功能。Peewee虽然为SQLite扩展提供了基本的JSON支持，但默认的json_contains()实现要求所有指定的键值对都必须存在于目标JSON对象中，这与我们的需求不完全吻合。

解决方案：自定义JSON比较函数

要实现我们需要的查询逻辑，可以创建一个自定义的SQLite用户定义函数(UDF)。这个函数应该：

解析查询条件中的JSON对象
检查目标JSON对象是否包含查询条件中的所有键值对
忽略目标JSON对象中存在的额外键值对

Peewee的SqliteExtDatabase支持注册自定义函数。我们可以基于现有的json_contains()实现进行修改，调整其比较逻辑。

实现示例

以下是一个改进后的json_contains()实现思路：

def json_contains_improved(data, query):
    """改进的json_contains函数，支持部分匹配"""
    try:
        data_obj = json.loads(data) if isinstance(data, str) else data
        query_obj = json.loads(query) if isinstance(query, str) else query
        
        # 检查查询对象中的所有键值对是否都存在于数据对象中
        for key, value in query_obj.items():
            if key not in data_obj or data_obj[key] != value:
                return False
        return True
    except (ValueError, TypeError):
        return False

在Peewee中使用自定义函数

注册并使用这个自定义函数：

from peewee import *
from playhouse.sqlite_ext import SqliteExtDatabase

# 创建数据库并注册自定义函数
db = SqliteExtDatabase(':memory:')
db.register_function(json_contains_improved, 'json_contains_improved')

class KV(Model):
    name = TextField()
    opt = JSONField()
    value = FloatField()
    
    class Meta:
        database = db

# 创建表
KV.create_table()

# 示例查询：查找所有opt中包含'k1': 1的记录
query = KV.select().where(fn.json_contains_improved(KV.opt, '{"k1": 1}'))
for row in query:
    print(row.value)