TranslationPlugin中微软翻译API解析异常问题分析

2025-05-20 00:39:27作者：沈韬淼Beryl

问题背景

在YiiGuxing开发的TranslationPlugin翻译插件中，用户在使用微软翻译服务时遇到了一个JSON解析异常。该问题发生在插件版本3.5.6上，运行于IntelliJ IDEA 2023.2.6环境中。

异常详情

当用户尝试将"end.getTime()"从自动检测语言翻译为简体中文时，插件抛出了JsonSyntaxException异常。核心错误信息显示："Expected a string but was BEGIN_OBJECT at line 1 column 72 path $[0].sourceText"，表明插件期望在JSON响应中获取字符串值，但实际遇到了一个对象。

技术分析

1. 问题根源

从异常堆栈和提供的翻译响应来看，微软翻译API返回的JSON结构与插件预期的结构不匹配。具体表现为：

插件期望sourceText字段是一个字符串
实际API返回的sourceText是一个包含text字段的对象

2. 响应数据对比

预期结构：

{
  "detectedLanguage": {...},
  "sourceText": "string_value",
  "translations": [...]
}

实际返回结构：

{
  "detectedLanguage": {...},
  "sourceText": {
    "text": "எண்டு.கெட்டிம்()"
  },
  "translations": [...]
}

3. 解析流程分析

插件使用Gson库进行JSON解析，解析流程如下：

插件调用微软翻译API获取翻译结果
使用Gson将响应体反序列化为Java对象
在反序列化过程中，Gson发现类型不匹配而抛出异常

4. 影响范围

此问题会影响所有使用微软翻译服务且遇到类似API响应的用户。特别是当API检测到某些特定语言时，可能会返回这种嵌套结构的响应。

解决方案

1. 数据模型调整

需要修改插件的翻译结果数据模型，使其能够兼容两种可能的sourceText格式：

直接字符串形式
包含text字段的对象形式

2. 自定义Gson解析器

可以编写自定义的Gson TypeAdapter来处理这种多态情况，例如：

public class SourceTextAdapter extends TypeAdapter<Object> {
    @Override
    public void write(JsonWriter out, Object value) {
        // 序列化逻辑
    }

    @Override
    public Object read(JsonReader in) throws IOException {
        if (in.peek() == JsonToken.BEGIN_OBJECT) {
            // 处理对象情况
            in.beginObject();
            String text = null;
            while (in.hasNext()) {
                if (in.nextName().equals("text")) {
                    text = in.nextString();
                } else {
                    in.skipValue();
                }
            }
            in.endObject();
            return text;
        } else {
            // 处理字符串情况
            return in.nextString();
        }
    }
}