GreptimeDB 0.15.0 夜间版本发布:性能优化与功能增强
GreptimeDB 是一款开源的分布式时序数据库,专注于处理大规模时序数据场景。它结合了时序数据库的高效存储和查询能力,同时提供了分布式系统的水平扩展性。本次发布的 0.15.0 夜间版本带来了多项性能优化和新功能,进一步提升了系统的稳定性和查询效率。
核心改进与优化
查询性能显著提升
本次版本在查询性能方面做了多项优化。首先实现了 Prometheus 相关查询计划的交换律规则,使得查询优化器能够更智能地重组查询计划,减少不必要的计算。其次新增了 SlowQueryRecorder 组件,能够自动记录执行时间超过阈值的慢查询到系统表中,帮助开发者分析和优化查询性能。默认的慢查询阈值也从 5 秒调整为更合理的 30 秒。
批量写入功能增强
批量写入功能得到了显著增强,现在支持同时写入多个时间分区,大幅提高了大批量数据导入的效率。同时针对单区域批量插入场景实现了快速路径优化,减少了不必要的处理开销。在原子写入方面也做了改进,现在会保留原子写入目录而不是隐藏它,并在写入失败时自动清理临时文件,提高了写入的可靠性。
分布式系统稳定性提升
在分布式系统层面,改进了流节点选择机制,现在会避免随机选择前端节点,同时优化了锁的使用策略,防止锁饥饿问题。元数据服务增加了推送器注销信号到邮箱接收器的功能,提高了节点间通信的可靠性。当自动主题创建被禁用时,现在会追加无操作条目,保持系统行为的可预测性。
新功能亮点
新型扫描器 SeriesScan
引入了全新的 SeriesScan 扫描器,专门为按系列查询指标数据而设计。这种扫描方式能够更高效地组织数据扫描过程,特别适合需要按时间线聚合的查询场景。配合新增的 PlainBatch 数据结构,为时序数据处理提供了更灵活的基础设施。
导出功能增强
数据导出到 S3 的功能得到了扩展,增加了更多配置选项,为用户提供了更细粒度的控制能力。这使得将 GreptimeDB 中的数据导出到对象存储进行长期归档或进一步分析变得更加灵活方便。
问题修复与细节改进
本次发布还修复了多个问题,包括表元数据收集的准确性、PromQL 正则表达式锚点行为、以及各种拼写错误等。在构建系统方面,更新了 Nix 构建链接器,提高了跨平台构建的兼容性。
总结
GreptimeDB 0.15.0 夜间版本通过一系列性能优化和新功能增强,进一步巩固了其作为高性能时序数据库的地位。从查询优化到批量写入改进,再到分布式系统稳定性的提升,这些变化都体现了开发团队对产品性能和可靠性的持续关注。对于需要处理大规模时序数据的用户来说,这个版本值得关注和试用。
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C0131
let_datasetLET数据集 基于全尺寸人形机器人 Kuavo 4 Pro 采集,涵盖多场景、多类型操作的真实世界多任务数据。面向机器人操作、移动与交互任务,支持真实环境下的可扩展机器人学习00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python059
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
AgentCPM-ReportAgentCPM-Report是由THUNLP、中国人民大学RUCBM和ModelBest联合开发的开源大语言模型智能体。它基于MiniCPM4.1 80亿参数基座模型构建,接收用户指令作为输入,可自主生成长篇报告。Python00