AgentPress项目中的JSON双重转义问题分析与解决方案

2025-06-11 19:39:51作者：滑思眉Philip

背景介绍

在AgentPress项目中，开发团队发现了一个关于消息存储的严重问题——消息内容在数据库中被错误地进行了双重JSON转义。这个问题不仅导致数据库中的JSON数据格式无效，还会影响流式传输和API返回的数据质量。

问题分析

当系统处理消息内容时，原本应该只进行一次JSON转义的字符串被错误地进行了两次转义操作。这种双重转义会导致以下问题：

数据库存储的JSON格式无效，无法直接解析
API返回的数据格式不符合预期
前端解析数据时可能出现错误
系统间的数据交换可能失败

技术影响

双重转义问题在技术层面表现为：

字符串被错误地序列化为JSON字符串两次
数据库字段中存储的是转义后的JSON字符串，而不是原始JSON对象
前端需要额外的处理逻辑来解析这些异常数据

解决方案

后端修复

在后端代码中，主要修改位于thread_manager.py文件的add_message方法。修复的核心是确保消息内容只进行一次正确的JSON序列化，避免重复转义。

数据库迁移

对于已经存储在数据库中的错误数据，需要执行数据迁移脚本来修复：

UPDATE messages
SET 
    content = 
        CASE 
            WHEN jsonb_typeof(content) = 'string' AND content::text LIKE '{%}' THEN
                content::text::jsonb
            WHEN content ? 'content' AND jsonb_typeof(content->'content') = 'string' AND 
                 (content->'content')::text LIKE '{%}' THEN
                jsonb_set(content, '{content}', (content->'content')::text::jsonb)
            ELSE content
        END,
    metadata = 
        CASE 
            WHEN jsonb_typeof(metadata) = 'string' AND metadata::text LIKE '{%}' THEN
                metadata::text::jsonb
            WHEN metadata ? 'metadata' AND jsonb_typeof(metadata->'metadata') = 'string' AND 
                 (metadata->'metadata')::text LIKE '{%}' THEN
                jsonb_set(metadata, '{metadata}', (metadata->'metadata')::text::jsonb)
            ELSE metadata
        END