CodeGeeX4 使用与启动教程

2026-01-30 05:09:35作者：殷蕙予

CodeGeeX4-ALL-9B, a versatile model for all AI software development scenarios, including code completion, code interpreter, web search, function calling, repository-level Q&A and much more.

项目地址：https://gitcode.com/gh_mirrors/co/CodeGeeX4

1. 项目介绍

CodeGeeX4 是一个开源的多语言代码生成模型，基于 GLM-4-9B 持续训练，具备代码补全、代码解释、网页搜索、函数调用、仓库级别的代码问答等多种功能。它在公开的基准测试中表现优异，例如 BigCodeBench 和 NaturalCodeBench，是目前参数少于 10B 的最强代码生成模型。

2. 项目快速启动

以下是快速启动 CodeGeeX4 的步骤：

首先，确保您的环境中已安装了必要的依赖项。以下是一个示例的安装命令：

pip install torch transformers vllm

接下来，可以使用以下代码启动 CodeGeeX4：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# 检查是否有可用的CUDA环境
device = "cuda" if torch.cuda.is_available() else "cpu"

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained("THUDM/codegeex4-all-9b", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("THUDM/codegeex4-all-9b", torch_dtype=torch.bfloat16, low_cpu_mem_usage=True, trust_remote_code=True).to(device).eval()

# 编写代码补全的提示
prompt = [{"role": "user", "content": "快速排序算法的实现"}]

# 转换提示为模型所需的格式
inputs = tokenizer.apply_chat_template(prompt, add_generation_prompt=True, return_tensors="pt", return_dict=True).to(device)

# 生成代码
with torch.no_grad():
    outputs = model.generate(**inputs)
    # 输出解码后的代码
    print(tokenizer.decode(outputs[0], skip_special_tokens=True))

确保在执行上述代码前，您的环境中有正确版本的 transformers 库。

3. 应用案例和最佳实践

以下是使用 CodeGeeX4 的几个应用案例：

代码补全：自动完成代码片段，提高编码效率。
代码解释：解释现有的代码段，帮助开发者理解复杂的逻辑。
函数调用：自动生成函数调用代码，减少手动查找和输入的工作量。
仓库级代码问答：在代码库中直接提问，快速定位问题和解决方案。

最佳实践：在使用 CodeGeeX4 时，建议为模型提供尽可能详细的上下文信息，以便模型能够更准确地生成代码。

4. 典型生态项目

CodeGeeX4 可以与多种开发工具和平台集成，例如：

Visual Studio Code：通过扩展支持本地代码生成。
JetBrains：通过插件提供代码生成功能。
其他开发工具：CodeGeeX4 也支持与其他开发工具的集成，例如通过 REST API。

通过上述集成，CodeGeeX4 可以成为开发者日常工作中不可或缺的辅助工具。

CodeGeeX4-ALL-9B, a versatile model for all AI software development scenarios, including code completion, code interpreter, web search, function calling, repository-level Q&A and much more.

项目地址：https://gitcode.com/gh_mirrors/co/CodeGeeX4

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统