LLMCompiler项目现已支持vLLM框架下的开源模型运行

2025-07-09 05:01:56作者：翟萌耘Ralph

LLMCompiler项目近期迎来了一项重要更新——正式支持在vLLM框架下运行开源大语言模型。这一功能扩展为开发者提供了更灵活的选择，使他们能够利用各种开源模型进行编译优化实验。

vLLM是一个高效的大语言模型推理和服务框架，以其出色的性能和易用性而闻名。LLMCompiler项目团队通过集成vLLM框架，使得用户现在可以方便地使用各类开源模型进行实验和测试。

要使用这一新功能，开发者只需在运行命令中指定相关参数。核心命令格式如下：

python run_llm_compiler.py --model_type vllm --benchmark {基准测试名称} --store {存储路径} --model_name {vllm模型名称} --vllm_port {vllm端口} [--logging]

其中，--model_type vllm参数明确指定使用vLLM框架，--model_name则用于指定具体的开源模型名称。这种设计保持了LLMCompiler项目一贯的简洁风格，同时提供了足够的灵活性。

这一更新对于研究社区具有重要意义。首先，它降低了使用门槛，使更多开发者能够利用自己熟悉或偏好的开源模型进行实验。其次，通过vLLM框架的高效推理能力，可以显著提升实验效率，这对于需要大量迭代的研究工作尤为重要。

项目团队建议用户参考项目文档中的详细说明来获取最新使用指南。随着这一功能的推出，LLMCompiler项目在支持多样化模型方面又迈出了重要一步，为编译优化领域的研究提供了更强大的工具支持。

对于想要尝试不同开源模型效果的研究者来说，这一更新无疑提供了更多可能性。开发者现在可以更自由地探索不同模型在编译优化任务中的表现，从而推动相关技术的进一步发展。

LLMCompiler

LLMCompiler: An LLM Compiler for Parallel Function Calling

项目地址：https://gitcode.com/gh_mirrors/ll/LLMCompiler

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.21 K

660

LLMCompiler项目现已支持vLLM框架下的开源模型运行

相关内容推荐

最新内容推荐

项目优选