CVAT v2.36.0版本发布:3D标注增强与性能优化深度解析
项目概述
CVAT(Computer Vision Annotation Tool)是一个开源的计算机视觉标注工具,由Intel旗下的OpenVINO团队开发和维护。作为当前最流行的图像和视频标注平台之一,CVAT为机器学习项目提供了强大的数据标注功能,支持多种标注类型和自动化标注流程。
版本核心更新
3D标注功能增强
本次v2.36.0版本在3D工作空间中引入了立方体(cuboid)尺寸控制功能,这是对3D标注能力的重要提升。立方体标注在自动驾驶、三维重建等场景中尤为关键,新加入的尺寸控制功能允许标注人员更精确地调整立方体的长宽高参数,显著提升了3D物体标注的精度和效率。
数据分析与导出优化
-
原始事件导出功能:在分析页面新增了导出原始资源事件的UI按钮,这一改进使得管理员和数据分析师能够更方便地获取系统活动日志,用于审计或分析工作流程。
-
智能事件导出逻辑:优化了事件导出的默认行为,当未指定时间范围时,现在会导出目标资源的所有事件,这简化了批量数据导出的操作流程。
-
表格导出增强:CSV表格导出功能现在会考虑当前应用的筛选条件,确保导出的数据与用户当前视图保持一致,避免了数据不一致的问题。
性能优化亮点
后端性能提升
-
API响应优化:对多个关键API端点进行了性能调优,包括任务列表、质量冲突和云存储相关的接口,显著减少了大型项目的加载时间。
-
权限检查优化:重构了服务器权限检查的数据库查询逻辑,减少了不必要的数据库访问,提升了系统整体响应速度。
-
Webhooks性能改进:专门优化了Webhooks接口的查询性能,这对于集成自动化工作流的企业用户尤为重要。
追踪功能修复
修复了AI模型追踪功能在重新启用后无法自动启动的问题,确保了自动化标注流程的连续性。这一修复对于依赖AI辅助标注的用户至关重要,避免了手动干预的需求。
开发者体验改进
CLI工具增强
-
默认配置调整:CLI工具现在默认使用
http://localhost作为服务器主机地址,简化了本地开发环境的配置。 -
参数验证优化:改进了命令行参数验证逻辑,无效参数或帮助请求不再要求输入服务器密码,提升了开发体验。
-
URL方案明确化:弃用了自动检测服务器URL方案的功能,要求开发者明确指定
http://或https://前缀,这一变化提高了配置的明确性,避免了潜在的连接问题。
技术架构调整
Helm Chart修复
修复了Helm Chart中的selectorLabels模板问题,确保Kubernetes部署时标签匹配的正确性。这一改进提升了在容器化环境中部署CVAT的可靠性。
错误处理优化
改进了API方法不允许访问时的错误响应,现在会正确返回500状态码而非其他错误代码,使得错误处理更加规范和一致。
总结
CVAT v2.36.0版本在3D标注功能、系统性能和开发者体验三个方面都做出了显著改进。特别是3D立方体标注的增强和多项性能优化,使得这个开源标注工具在专业性和易用性上更进一步。对于计算机视觉项目团队而言,这些改进将直接提升数据标注的效率和质量,加速机器学习项目的开发周期。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00