CodeGeeX4本地模型部署与插件适配实践

2025-07-06 03:18:57作者：齐添朝

CodeGeeX4-ALL-9B, a versatile model for all AI software development scenarios, including code completion, code interpreter, web search, function calling, repository-level Q&A and much more.

项目地址：https://gitcode.com/gh_mirrors/co/CodeGeeX4

本地API支持现状

CodeGeeX4项目近期在VS Code插件中实现了对本地部署模型的支持，用户可通过配置兼容API地址直接连接本地推理服务。从开发者讨论来看，该功能已在最新版VS Code插件中验证可用，但JetBrains系列IDE的适配版本因审核流程较严格仍在等待发布。

配置要点解析

要实现本地模型连接，用户需要在插件设置中配置两个核心参数：

API地址：指向本地服务的URL端点（如http://localhost:11434/v1/chat/completions）
模型名称：指定调用的具体模型版本（如codegeex4）

值得注意的是，当使用Ollama作为服务后端时，必须设置环境变量OLLAMA_ORIGINS="*"以允许跨域请求。部分用户反馈的403错误往往与此配置缺失有关。

技术实现细节

从错误日志分析，当前插件采用Axios库进行HTTP通信，默认会添加标准请求头：

Content-Type: application/json
Accept: application/json

对于Ollama服务，开发者需要注意其0.2.x版本提供了两种API端点：

原生接口（/api/generate）
兼容接口（/v1/chat/completions）

测试表明，虽然文档示例展示的是兼容风格API，但实际部署时可能需要根据服务端版本调整接口路径。

替代方案探讨

在等待官方插件完全适配期间，开发者可以采用以下替代方案：

Continue插件：支持兼容API，在VS Code中表现稳定
直接调用API：通过curl或自定义脚本与本地模型交互

需要特别指出的是，不同IDE平台的插件稳定性存在差异。例如Continue插件在JetBrains系列IDE中可能出现崩溃问题，这也是CodeGeeX官方插件值得期待的原因。

未来优化方向

基于用户反馈，建议后续改进：

增强错误处理机制，明确区分网络错误和API不兼容情况
提供预设配置模板，支持主流推理框架（Ollama、vLLM等）
实现功能对等，使本地模式也能使用在线版本的全部特性
完善文档说明，特别是针对不同服务后端的配置示例

本地化部署是大模型应用的重要趋势，CodeGeeX4在这一方向的探索值得持续关注。随着插件生态的完善，开发者将能更便捷地在离线环境中体验代码生成能力。

CodeGeeX4

CodeGeeX4-ALL-9B, a versatile model for all AI software development scenarios, including code completion, code interpreter, web search, function calling, repository-level Q&A and much more.

项目地址：https://gitcode.com/gh_mirrors/co/CodeGeeX4

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统