Feldera v0.37.0 版本发布：性能优化与功能增强

2025-07-02 03:40:50作者：邓越浪Henry

The Feldera Incremental Computation Engine

项目地址：https://gitcode.com/gh_mirrors/fe/feldera

Feldera 是一个开源的流式数据处理平台，专注于提供高性能、低延迟的数据处理能力。它采用现代化的架构设计，支持 SQL 查询语言，能够处理复杂的流式数据转换和分析任务。Feldera 的核心优势在于其高效的执行引擎和灵活的数据处理能力，使其成为构建实时数据管道的理想选择。

最新发布的 Feldera v0.37.0 版本带来了一系列重要的性能优化和新功能增强，特别是在 SQL 处理、存储管理和适配器支持方面有了显著改进。以下是对本次更新的技术分析。

SQL 引擎优化

本次版本在 SQL 处理方面进行了多项底层优化，显著提升了查询执行效率：

数据结构优化：引入了 Arc 实现数组类型，减少了数据复制开销。同时使用 interned 字符串技术优化字符串处理，降低了内存占用。
查询计划改进：优化了外连接(outer join)的实现，能够生成更窄的反连接(antijoin)计划。改进了窗口聚合函数的错误提示，使开发者更容易诊断问题。
类型系统增强：正确处理了可为空结构体字段访问的返回类型，改进了区间类型(interval)的解析逻辑，现在支持前导加号的区间表示法。
函数优化：实现了多个 MIN/MAX 聚合函数在仅追加(append-only)集合上的高效执行，消除了不必要的 map 和 map_index 操作。

存储与缓存管理

存储子系统在本版本中获得了多项重要改进：

可配置存储缓存：新增了用户可配置的存储缓存大小设置，允许根据工作负载特点调整缓存策略。
性能优化：实现了针对存储写入的多项优化措施，包括改进的 B 树游标实现和优先合并最长脊柱(spine)的策略，显著提升了写入吞吐量。
统计监控：现在能够分别报告前台和后台工作线程的缓存统计信息，便于性能分析和调优。
布隆过滤器改进：修复了布隆过滤器实现中的若干问题，提高了过滤效率。

适配器与连接器增强

数据输入输出适配器获得了多项新功能和改进：

Kafka 增强：支持摄入 zstd 压缩的 Kafka 流，改进了错误报告机制，当 Kafka 代理不可用时提供更清晰的错误信息。
Delta Lake 实验性支持：新增了 CDC(变更数据捕获)模式支持，并且现在只摄入 SQL 中声明的 Delta 列，减少了不必要的数据传输。
原始输入格式：新增了对原始(raw)输入格式的支持，为特殊数据处理场景提供了更多灵活性。
PostgreSQL 连接器：初步引入了 PostgreSQL 连接器支持，扩展了 Feldera 的数据源集成能力。
Parquet 解析：现在使用 Arrow 库来解析 Parquet 数据，提高了处理效率和兼容性。

其他改进

错误处理：全面改进了管道和运行时的错误报告机制，使问题诊断更加直观。
性能分析：增强了性能分析工具，添加了更多跟踪点(track_caller)注解，便于性能调优。
构建系统：修复了 ARM64 架构下的 Web 控制台构建问题，提升了跨平台兼容性。
文档：新增了 OpenTelemetry 使用案例文档，帮助用户更好地集成监控系统。

Feldera v0.37.0 通过这些优化和新功能，进一步巩固了其作为高性能流处理平台的地位。特别是 SQL 引擎的优化和存储子系统的改进，使得处理大规模流数据更加高效可靠。新增加的连接器支持也扩展了平台的应用场景，为构建复杂的数据管道提供了更多可能性。

The Feldera Incremental Computation Engine

项目地址：https://gitcode.com/gh_mirrors/fe/feldera

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。