Comet-LLM 1.3.4版本发布：增强TypeScript支持与自动化评分规则

2025-06-07 16:15:13作者：柏廷章Berta

Debug, evaluate, and monitor your LLM applications, RAG systems, and agentic workflows with comprehensive tracing, automated evaluations, and production-ready dashboards.

项目地址：https://gitcode.com/GitHub_Trending/co/comet-llm

Comet-LLM是一个专注于大型语言模型(LLM)实验跟踪和管理的开源平台。它提供了完整的生命周期管理能力，从提示工程到模型评估，帮助团队高效地开发和优化LLM应用。

TypeScript SDK支持

本次1.3.4版本最重要的更新之一是引入了对TypeScript SDK的初步支持。开发团队通过Fern框架实现了这一功能，为前端开发者提供了更友好的接口访问方式。TypeScript SDK的加入意味着：

前端应用现在可以直接通过类型安全的接口与Comet-LLM后端交互
开发者可以获得更好的代码提示和类型检查
减少了手动处理API请求和响应的工作量

自动化评分规则功能

另一个关键改进是新增了在线评分自动化规则端点。这一功能允许用户：

定义自动化的评分规则，用于评估模型输出
根据预定义的规则自动为实验项目打分
实现持续的质量监控和评估

多模型支持与Anthropic集成

1.3.4版本还扩展了对多种模型的支持，特别是增加了对Anthropic模型的实现。这使得用户能够：

在同一个平台上管理不同供应商的模型实验
方便地比较不同模型的性能
统一不同模型的使用接口和评估标准

数据完整性与错误处理改进

在数据管理方面，本次更新包含多项改进：

修复了实验项目流式传输端点，现在会返回完整的实验项目内容
改进了工作空间和项目ID不匹配时的错误处理，返回更合适的409状态码
解决了反馈评分测试中的问题，确保评分系统可靠性

开发者体验优化

针对开发者体验的改进包括：

解决了JSON编码器中的循环引用问题
为Python包添加了py.typed标记，改进类型提示支持
更新了LlamaIndex文档，提供更准确的使用指南
实现了文档代码块的自动化测试，确保示例代码的正确性

后端稳定性增强

后端系统也获得了多项稳定性改进：

更新了Redisson客户端版本
改进了锁定服务的日志记录
修复了项目查找中的空指针异常问题
应用了Spotless代码格式化工具，保持代码风格一致

Comet-LLM 1.3.4版本的这些改进显著提升了平台的稳定性、功能丰富度和开发者友好性，特别是对TypeScript开发者和需要多模型支持的用户来说，这些更新将大大改善他们的使用体验。

comet-llm

Debug, evaluate, and monitor your LLM applications, RAG systems, and agentic workflows with comprehensive tracing, automated evaluations, and production-ready dashboards.

项目地址：https://gitcode.com/GitHub_Trending/co/comet-llm

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

456

438

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Comet-LLM 1.3.4版本发布：增强TypeScript支持与自动化评分规则

TypeScript SDK支持

自动化评分规则功能

多模型支持与Anthropic集成

数据完整性与错误处理改进

开发者体验优化

后端稳定性增强

热门内容推荐

最新内容推荐

项目优选

Comet-LLM 1.3.4版本发布：增强TypeScript支持与自动化评分规则

TypeScript SDK支持

自动化评分规则功能

多模型支持与Anthropic集成

数据完整性与错误处理改进

开发者体验优化

后端稳定性增强

相关内容推荐

热门内容推荐

最新内容推荐

项目优选