VLLM项目中如何优化API服务日志输出

2025-06-23 23:56:53作者：廉皓灿Ida

在VLLM项目的实际部署中，开发者可能会遇到API服务日志被大量/metrics请求刷屏的问题。这种情况通常发生在Kubernetes环境下，当Prometheus监控系统频繁采集指标时，会导致日志系统产生大量冗余信息，影响关键日志的可读性。

问题现象分析

当VLLM的OpenAI API服务运行时，控制台会持续输出类似以下内容：

INFO:     xxx:47294 - "GET /metrics HTTP/1.1" 200 OK
INFO:     xxx:46402 - "GET /metrics HTTP/1.1" 200 OK
...

这些日志是Uvicorn服务器默认记录的HTTP访问日志，对于监控系统的健康检查请求来说，这些日志并不具备实际价值，反而会淹没真正需要关注的业务日志。

解决方案

通过调整Uvicorn的日志级别可以有效解决这个问题。在启动vllm.entrypoints.openai.api_server时，添加以下参数：

--uvicorn-log-level warning

这个参数会将Uvicorn的日志级别设置为WARNING，从而过滤掉INFO级别的访问日志，同时保留重要的警告和错误信息。

技术原理

Uvicorn作为ASGI服务器，默认使用INFO级别记录所有HTTP请求。在Kubernetes环境中，当配置了以下监控相关注解时：

prometheus.io/scrape: "true"

监控系统会定期通过/metrics端点采集指标数据。通过调整日志级别，我们可以在保持监控功能正常工作的同时，优化日志输出。

最佳实践建议

生产环境中建议始终设置适当的日志级别
对于监控系统的健康检查请求，可以考虑使用专门的日志通道
重要业务日志应当使用比INFO更高的级别记录
在资源受限环境中，减少不必要的日志输出可以降低I/O压力

这种日志优化方法不仅适用于VLLM项目，对于其他基于Uvicorn的ASGI应用同样有效，是Python Web服务部署时的通用优化手段之一。

aibrix

项目地址：https://gitcode.com/GitHub_Trending/ai/aibrix

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

VLLM项目中如何优化API服务日志输出

问题现象分析

解决方案

技术原理

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

VLLM项目中如何优化API服务日志输出

问题现象分析

解决方案

技术原理

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选