Midjourney API 用户输入过滤机制深度解析与解决方案

2025-07-08 06:05:56作者：牧宁李

MidJourney client. Unofficial Node.js client

项目地址：https://gitcode.com/gh_mirrors/mi/midjourney-api

在基于Midjourney API开发应用时，开发者常面临用户输入内容安全管控的挑战。本文将从技术角度剖析这一问题的本质，并提供多维度解决方案。

问题背景分析

Midjourney平台对用户生成内容有严格的社区准则，当检测到违规提示词时，会触发以下处理流程：

初级过滤：AI自动审核系统拦截明显违规内容
人工复审：对反复违规行为进行账户封禁

典型违规场景包括但不限于：

低俗内容（如"dessine moi du caca"等暗示性语言）
仇恨言论
暴力内容
其他违反社区准则的提示词

现有解决方案对比

1. 关键词黑名单过滤

优点：实现简单，响应快速
局限：无法应对变体表达、多语言场景和语义理解

2. OpenAI Moderation API

检测率：约31.5%（基于200个测试样本）
特点：提供多维度风险评估（仇恨、暴力、色情等）
适用场景：初级内容过滤

3. 大语言模型改写方案

实现流程：

用户输入 → LLM净化处理 → Midjourney API

技术要点：

使用GPT-3.5等模型进行语义级净化
提示词工程示例： "请重写以下提示词，移除所有违规内容，保持原意的艺术性表达：[原始提示]"

4. Google Gemini 安全评估

特性：内置安全评级系统（HARM_CATEGORY体系）

输出示例：

{
  "safetyRatings": [
    {
      "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
      "probability": "HIGH" 
    }
  ]
}

混合解决方案建议

分层过滤架构
- 第一层：本地关键词过滤（快速拦截已知违规词）
- 第二层：Moderation API（中等粒度检测）
- 第三层：LLM语义净化（精细处理）
成本优化策略
- 对高频词建立本地缓存
- 使用gpt-3.5-turbo等经济型模型
- 实现请求批处理
异常处理机制
- 设置请求频率限制
- 建立用户信用体系
- 实现自动熔断保护

实施建议

对于初创项目：
- 优先采用OpenAI Moderation + 基础关键词过滤
- 预算：约$0.002/千次请求（Moderation API）
对于成熟产品：
- 部署多模型协同过滤
- 建立用户行为分析系统
- 实现动态规则更新

技术展望

未来可探索的方向包括：

建立领域特定的微调模型
开发多模态内容检测（结合生成结果分析）
实现实时自适应过滤策略

通过系统化的内容安全体系建设，开发者可以在保证创作自由度的同时，有效降低平台风险，实现可持续发展。

MidJourney client. Unofficial Node.js client

项目地址：https://gitcode.com/gh_mirrors/mi/midjourney-api

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。