Rerun 0.23.0发布:支持多标量日志与向后兼容的.rrd格式
Rerun是一个面向多模态和时序数据的可视化分析工具,它提供了简单易用的数据库和可视化功能。通过Rerun,开发者可以轻松记录、存储和可视化各种类型的数据,特别适合处理包含时间维度的复杂数据流。
核心功能升级
多标量日志支持
在0.23.0版本中,Rerun引入了对同一实体路径下多标量信号的支持。这一改进使得开发者能够将逻辑上相关的数据(如LeRobot数据集中的动作值或陀螺仪测量值)记录在同一个实体路径下。
以前,开发者需要为每个分量创建单独的实体路径:
rr.log("gyroscope/x", rr.Scalar(measurement[0]))
rr.log("gyroscope/y", rr.Scalar(measurement[1]))
rr.log("gyroscope/z", rr.Scalar(measurement[2]))
现在可以简化为:
rr.log("gyroscope", rr.Scalars(measurement))
这一改进不仅简化了代码,还使得数据组织更加直观。同时,SeriesLine和SeriesPoints原型现在包含visible_series组件,允许开发者控制哪些系列出现在可视化中,而隐藏的系列仍会显示在图例中。
向后兼容的.rrd格式
0.23.0版本对Rerun的文件格式进行了重大改进,迁移到了基于protobuf的新格式。这一变化虽然带来了短暂的兼容性中断(旧版本的.rrd文件将无法加载),但为未来的版本提供了更好的向后兼容性保证。
新格式的设计考虑了长期的数据兼容性需求,确保未来的Rerun版本能够读取当前版本创建的文件。对于需要长期存储分析数据的用户来说,这是一个重要的改进。
新增功能特性
回调API
Rerun 0.23.0为Jupyter Notebook和JavaScript环境添加了回调API支持。这一功能使得开发者能够轻松构建简单的标注工具,响应视图中的选择变化和时间线变化事件。
虽然目前这一API还仅限于Notebook和JavaScript环境,但它为交互式数据分析开辟了新的可能性。开发者可以利用这一功能构建自定义的用户界面和交互逻辑。
记录属性
新版本引入了"记录属性"的概念,允许开发者向记录添加元数据。例如,可以使用.send_recording_name("我的记录")为记录命名,这个名字将显示在查看器的记录面板中。
此外,开发者还可以通过通用的.send_property()方法记录任意数据。这些属性作为静态数据记录,也会出现在时间线中。当选择记录时,侧边面板会显示属性的概览。
实验性表格支持
Rerun正在改进对表格和数据框的支持。0.23.0版本引入了实验性的send_tableAPI,允许通过Python SDK和Notebook发送任意的Arrow记录批次。
虽然这一功能目前还处于早期阶段,但它为未来更强大的表格分析功能奠定了基础。开发者可以期待未来版本中加入的过滤、汇总统计等高级分析功能。
技术细节与改进
通信协议升级
Rerun现在主要依赖gRPC进行SDK与查看器之间的通信。这一变化带来了更高效的网络传输和更可靠的连接,但也意味着连接URL现在需要rerun://(TLS)或rerun+http://(未加密)前缀。
时间处理改进
新版本对时间处理进行了多项改进:
- 引入了
rr.IndexColumn和rr.set_indexAPI - 统一了时间单位名称
- 改进了时间轴控制和时间上下文菜单
开发者体验
- 更新了最低支持的Rust版本(MSRV)到1.84
- 对Python SDK进行了多项清理和改进
- 增加了更多的类型检查和lint规则
- 移除了多个已弃用的API
可视化与用户体验
Rerun 0.23.0在可视化方面也有多项改进:
- 支持从LeRobot数据集加载深度图像
- 改进了绘图高亮的一致性
- 添加了复制实体路径到剪贴板的功能
- 改进了时间序列显示范围的处理
- 增加了对JPEG/TIFF图像EXIF数据的显示
总结
Rerun 0.23.0是一个重要的里程碑版本,它通过引入多标量日志支持和改进文件格式,为未来的功能扩展奠定了坚实基础。虽然这些变化带来了短暂的兼容性中断,但它们为长期的数据兼容性和功能扩展提供了更好的支持。
对于现有用户,建议参考官方迁移指南进行升级。新用户可以借助改进的API和文档更轻松地上手这一强大的数据可视化工具。随着表格支持和回调API等新功能的逐步成熟,Rerun正在成长为一个更加全面和强大的数据分析平台。
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
unified-cache-managementUnified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。Python02
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00