YTsaurus Strawberry Controller 0.0.13版本发布：增强Jupyter与集群管理能力

2025-06-24 08:13:21作者：齐冠琰

YTsaurus是一个分布式计算和存储系统，其Strawberry Controller组件作为核心控制器，负责管理和协调各类计算任务。最新发布的0.0.13版本带来了多项重要改进，特别是在Jupyter集成、集群管理以及CHYT/SPYT组件支持方面。

Jupyter支持全面升级

本次更新显著提升了Jupyter在YTsaurus生态系统中的集成度。开发团队新增了GPU支持功能，使得数据科学家和工程师能够在Jupyter操作中直接利用GPU加速计算任务。这一特性特别适用于深度学习、大规模数值计算等高性能计算场景。

另一个关键改进是引入了作业缩放器(job scaler)接口，该功能可以智能地暂停不活跃的Jupyter操作，有效节约集群资源。当用户长时间未与Jupyter交互时，系统会自动暂停相关操作，而在用户重新访问时又能快速恢复，既保证了资源利用率又不影响用户体验。

集群管理与操作控制增强

在集群管理方面，0.0.13版本新增了多项实用功能：

重启命令：现在可以直接通过控制器执行重启操作，简化了系统维护流程。
基于位置的配置覆盖：支持根据节点位置动态覆盖strawberry配置，使得多地域部署更加灵活。
操作创建者权限：新增配置选项可自动授予操作创建者管理权限，便于权限管理。
列表过滤：list命令新增了过滤参数，用户可以更精确地查找所需操作。

此外，开发团队还修复了集群不可用时初始化可能导致的panic问题，提高了系统的稳定性。

CHYT与SPYT组件优化

对于CHYT(ClickHouse on YTsaurus)组件，新版本增加了运行时数据导出的控制选项，管理员现在可以禁用这些数据的导出，或者设置明确的过期超时，更好地控制数据保留策略。同时优化了AttributeCache的默认read_from选项，提升了缓存效率。

SPYT(Spark on YTsaurus)方面则引入了对Livy的Squashfs支持，这是一种高效的文件系统压缩格式，能够减少容器镜像的体积，加快启动速度。同时明确了Livy操作的yt token规范，增强了安全性。

总结

YTsaurus Strawberry Controller 0.0.13版本通过多项功能增强和问题修复，进一步提升了系统的稳定性、灵活性和易用性。特别是对Jupyter的深度集成和GPU支持，使得这个分布式计算平台更加适合现代数据科学工作流。集群管理功能的完善也为大规模部署提供了更多便利。这些改进共同推动YTsaurus向更成熟的企业级解决方案迈进。

登录后查看全文

YTsaurus Strawberry Controller 0.0.13版本发布：增强Jupyter与集群管理能力

Jupyter支持全面升级

集群管理与操作控制增强

CHYT与SPYT组件优化

总结

项目优选