Jeecg-Boot项目中实现AI图片识别功能的技术方案

2025-05-02 10:31:41作者：秋阔奎Evelyn

JeecgBoot是一款创新的低代码开发平台，旨在革命性地提升软件开发速度与效率。该平台基于SpringBoot/SpringCloud微服务架构，融合前沿技术如Vue3、TypeScript与Ant Design Vue，支持快速构建企业级应用。JeecgBoot的核心亮点在于其强大的代码生成器与丰富的低代码模块，涵盖在线表单、报表设计、流程配置，使得开发者仅需简单的配置就能生成复杂的前后端代码，将开发效率提升70%，显著减少成本。无论是大型企业系统还是SAAS项目，JeecgBoot都能提供从基础的用户管理到高级的流程设计全方位解决方案。其兼容多数据库、支持国产化环境、搭载全面的安全框架与监控系统，确保应用的灵活性、安全性与稳定性。选择JeecgBoot，意味着拥抱高效、智能且高度定制化的现代软件开发体验。

项目地址：https://gitcode.com/gh_mirrors/jee/jeecg-boot

背景介绍

Jeecg-Boot作为一款基于Spring Boot的低代码开发平台，在3.8.0版本中已经集成了AI应用管理功能。但在实际使用中，开发者发现平台默认的智谱华章模型只支持glm-4-flash语音模型，无法实现图片识别功能，这限制了AI在图像处理领域的应用场景。

问题分析

通过分析源码发现，当前版本的AiModelFactory类中固定使用了glm-4-flash模型，这是导致无法使用图片识别功能的主要原因。智谱华章实际上提供了支持多模态的glm-4v-flash模型，该模型具备图像识别能力，但平台尚未提供对应的集成方案。

技术解决方案

方案一：使用OpenAI协议兼容方案

原理说明：虽然平台默认集成了特定模型，但OpenAI协议已成为行业通用标准，许多AI服务提供商都兼容该协议。
实现步骤：
- 在AI应用管理界面选择OpenAI作为基础协议
- 配置支持图片识别的第三方模型端点
- 通过API密钥进行身份验证
优势：
- 无需修改平台源码
- 可灵活切换不同支持图片识别的模型
- 兼容性广泛，支持多种AI服务提供商

方案二：扩展AiModelFactory类

代码修改建议：

public class AiModelFactory {
    public static BaseModel createModel(String modelType) {
        switch(modelType) {
            case "glm-4-flash":
                return new GLM4FlashModel();
            case "glm-4v-flash":
                return new GLM4VFlashModel(); // 新增支持图片识别的模型
            default:
                return new DefaultModel();
        }
    }
}