Langfuse v3.40.0 版本发布：数据集运行名称展示与评分删除功能增强

2025-06-04 11:32:34作者：范靓好Udolf

🪢 Open source AI engineering platform: LLM evals, observability, metrics, prompt management, playground, datasets. Integrates with OpenTelemetry, LangChain, OpenAI SDK, LiteLLM, and more. 🍊YC W23

项目地址：https://gitcode.com/GitHub_Trending/la/langfuse

Langfuse 是一个开源的 LLM（大语言模型）应用监控与分析平台，它帮助开发者跟踪、分析和优化基于大语言模型构建的应用程序。通过提供细粒度的监控、评估和调试工具，Langfuse 使团队能够更好地理解模型行为并持续改进应用性能。

核心功能更新

数据集运行名称可视化

在本次 v3.40.0 版本中，Langfuse 增强了数据集功能，现在可以在运行项表格中直接查看运行名称。这一改进使得开发者在处理多个实验运行或不同配置的模型输出时，能够更直观地区分和识别各个运行实例。对于进行 A/B 测试或多版本对比的场景尤为重要，用户无需额外操作即可快速定位特定运行的数据。

评分删除功能

评分系统是 Langfuse 中用于量化评估模型输出的重要组件。新版本在用户界面中增加了评分删除功能，允许用户直接通过 UI 移除不再需要的评分记录。这一功能优化了数据管理流程，特别是在需要清理测试数据或修正错误评分时，为用户提供了更便捷的操作方式。

技术优化与修复

评估状态显示修复

开发团队修复了评估详情页面的状态显示问题。评估状态是判断模型输出质量的关键指标，正确的状态显示确保了用户能够准确理解当前评估的进展情况和结果有效性。

列定义优化

为了提高系统稳定性和性能，新版本对列定义使用了只读属性。这一技术调整防止了意外的数据修改，同时优化了大型数据集的处理效率。

评分删除队列重构

在后台架构方面，团队将评分删除操作重构为异步队列处理。这种架构改进带来了两个主要优势：首先，它提高了大规模删除操作的系统稳定性；其次，通过异步处理，用户界面响应更加迅速，不会因为后台操作而阻塞。

文档与监控改进

API 文档增强

针对公共 API 的游标规则文档进行了两项重要补充：一是优化了游标使用说明，使开发者能更准确地实现分页功能；二是增加了 Zod 类型严格校验的指导，帮助开发者构建更健壮的 API 集成代码。

数据隐私保护

在云服务监控方面，团队进一步加强了 Posthog 的数据掩码处理。这一措施更好地保护了用户隐私，确保敏感信息在分析过程中得到适当保护。

总结

Langfuse v3.40.0 版本通过多项功能增强和优化，进一步提升了平台的实用性和稳定性。数据集运行名称的直观展示和评分删除功能的加入，直接解决了用户在实际操作中的痛点。同时，后台架构的改进为系统处理大规模数据提供了更好的基础。这些更新共同使 Langfuse 成为 LLM 应用开发和监控的更强大工具。

langfuse

项目地址：https://gitcode.com/GitHub_Trending/la/langfuse

登录后查看全文