【亲测免费】 LiveCodeBench 技术文档

2026-01-25 04:21:02作者：牧宁李

1. 安装指南

1.1 克隆仓库

首先，您需要克隆 LiveCodeBench 的 GitHub 仓库到本地：

git clone https://github.com/LiveCodeBench/LiveCodeBench.git
cd LiveCodeBench

1.2 安装依赖

我们推荐使用 poetry 来管理项目的依赖。您可以通过以下命令安装 poetry 并安装项目的依赖：

pip install poetry
poetry install

默认情况下，vllm 不会被安装。如果您需要安装 vllm，可以使用以下命令：

poetry install --with with-gpu

2. 项目使用说明

2.1 代码生成

LiveCodeBench 提供了代码生成的功能。您可以使用 vllm 进行推理，默认情况下，我们使用 tensor_parallel_size=${num_gpus} 来并行化推理。您可以通过 --tensor_parallel_size 标志来配置并行化的 GPU 数量。

运行代码生成的命令如下：

python -m lcb_runner.runner.main --model {model_name} --scenario codegeneration

您还可以使用 --use_cache 标志来缓存生成的输出，使用 --continue_existing 标志来使用现有的转储结果。如果您希望使用本地路径中的模型，可以额外提供 --local_model_path 标志，并指定模型的路径。

2.2 评估

我们计算 pass@1 和 pass@5 指标来评估模型。您可以通过添加 --evaluate 标志来运行评估：

python -m lcb_runner.runner.main --model {model_name} --scenario codegeneration --evaluate

2.3 自修复

运行自修复时，您需要提供额外的 --codegen_n 标志，该标志映射到代码生成期间生成的代码数量。此外，--temperature 标志用于解析旧的代码生成评估文件，该文件必须存在于 output 目录中。

python -m lcb_runner.runner.main --model {model_name} --scenario selfrepair --codegen_n {num_codes_codegen} --n 1

2.4 测试输出预测

运行测试输出预测场景时，您可以简单地运行：

python -m lcb_runner.runner.main --model {model_name} --scenario testoutputprediction --evaluate

2.5 代码执行

运行代码执行场景时，您可以简单地运行：

python -m lcb_runner.runner.main --model {model_name} --scenario codeexecution --evaluate

我们还支持 COT 设置：

python -m lcb_runner.runner.main --model {model_name} --scenario codeexecution --cot_code_execution --evaluate

3. 项目API使用文档

3.1 自定义评估

您可以使用 lcb_runner/runner/custom_evaluator.py 直接评估自定义文件中的模型生成。文件应包含按基准问题顺序排列的模型输出列表。

python -m lcb_runner.runner.custom_evaluator --custom_output_file {path_to_custom_outputs}

输出格式如下：

[
    {"question_id": "id1", "code_list": ["code1", "code2"]},
    {"question_id": "id2", "code_list": ["code1", "code2"]}
]

3.2 添加新模型支持

要添加对新模型的支持，您可以在 lcb_runner/lm_styles.py 文件中添加新模型，并在 lcb_runner/prompts/generation.py 文件中为模型添加新的提示。

4. 项目安装方式

4.1 使用 Poetry 安装

我们推荐使用 poetry 来管理项目的依赖。您可以通过以下命令安装 poetry 并安装项目的依赖：

pip install poetry
poetry install

4.2 安装 vllm

默认情况下，vllm 不会被安装。如果您需要安装 vllm，可以使用以下命令：

poetry install --with with-gpu

通过以上步骤，您可以顺利安装并使用 LiveCodeBench 项目。

LiveCodeBench

Official repository for the paper "LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code"

项目地址：https://gitcode.com/gh_mirrors/li/LiveCodeBench

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781

【亲测免费】 LiveCodeBench 技术文档

1. 安装指南

1.1 克隆仓库

1.2 安装依赖

2. 项目使用说明

2.1 代码生成

2.2 评估

2.3 自修复

2.4 测试输出预测

2.5 代码执行

3. 项目API使用文档

3.1 自定义评估

3.2 添加新模型支持

4. 项目安装方式

4.1 使用 Poetry 安装

4.2 安装 vllm

热门内容推荐

最新内容推荐

项目优选

【亲测免费】 LiveCodeBench 技术文档

1. 安装指南

1.1 克隆仓库

1.2 安装依赖

2. 项目使用说明

2.1 代码生成

2.2 评估

2.3 自修复

2.4 测试输出预测

2.5 代码执行

3. 项目API使用文档

3.1 自定义评估

3.2 添加新模型支持

4. 项目安装方式

4.1 使用 Poetry 安装

4.2 安装 vllm

相关内容推荐

热门内容推荐

最新内容推荐

项目优选