Ibis项目10.4.0版本发布：数据分析框架的全面升级

2025-06-10 03:48:28作者：田桥桑Industrious

Ibis是一个开源的Python数据分析框架，它提供了一个统一的接口来操作多种数据库和计算引擎。通过Ibis，数据分析师和数据工程师可以用相同的代码语法在不同的后端（如PostgreSQL、DuckDB、Flink等）上执行查询操作，大大提高了数据处理的效率和可移植性。

新特性亮点

更灵活的聚合操作

10.4.0版本对topk()和value_counts()这两个常用聚合函数进行了增强，使其更加灵活。现在开发者可以更自由地指定排序方式和计数条件，这在进行数据探索和分析时提供了更大的便利性。

数据类型增强

新增了对字符串长度的直接支持，这在处理文本数据时特别有用。开发者现在可以直接获取字符串列的长度，而无需编写复杂的表达式或自定义函数。

Flink后端功能扩展

Flink后端现在支持StringSplit操作，这意味着开发者可以在Flink引擎上直接执行字符串分割操作，进一步丰富了Ibis在流处理场景下的功能。

PostgreSQL后端改进

PostgreSQL后端在这个版本中获得了两个重要改进：

支持读取枚举类型(enum)为字符串，这解决了之前处理PostgreSQL枚举类型时的不便。
实现了asof_join API，通过横向连接(lateral join)支持时间序列数据的非精确匹配连接操作，这对金融时间序列分析等场景特别有价值。

用户体验优化

错误信息现在更加友好，当出现签名验证错误时，会包含错误值的类型信息，帮助开发者更快定位问题所在。

性能优化

这个版本在性能方面做了多处改进：

DuckDB后端优化了ArrayConcat操作的SQL生成，提高了数组连接操作的效率。
结构体(Struct)类型现在会在__getitem__操作时自动丢弃未使用的字段，减少了不必要的数据传输和处理。

问题修复

修复了多个后端在空数组字符串连接时行为不一致的问题，现在所有支持的后端都会一致地返回None。此外还修复了PostgreSQL后端可能存在的游标泄漏问题，提高了资源管理的可靠性。

文档改进

文档方面，新增了对Pandas用户的友好指引，特别是关于如何使用字面量添加单值列的说明。同时修正了多处文档中的拼写错误和格式问题，使文档更加准确易读。

技术架构优化

PostgreSQL后端的get_schema实现进行了重构，改为使用原始SQL查询，简化了代码结构并提高了可维护性。

总的来说，Ibis 10.4.0版本在功能、性能和用户体验方面都有显著提升，特别是对PostgreSQL和Flink后端的增强，使得这个统一的数据分析框架在更多场景下都能发挥更大的价值。

ibis

the portable Python dataframe library

项目地址：https://gitcode.com/GitHub_Trending/ib/ibis

登录后查看全文

项目优选

收起

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

461

455

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.02 K

265

Ibis项目10.4.0版本发布：数据分析框架的全面升级

新特性亮点

更灵活的聚合操作

数据类型增强

Flink后端功能扩展

PostgreSQL后端改进

用户体验优化

性能优化

问题修复

文档改进

技术架构优化

热门内容推荐

最新内容推荐

项目优选

Ibis项目10.4.0版本发布：数据分析框架的全面升级

新特性亮点

更灵活的聚合操作

数据类型增强

Flink后端功能扩展

PostgreSQL后端改进

用户体验优化

性能优化

问题修复

文档改进

技术架构优化

相关内容推荐

热门内容推荐

最新内容推荐

项目优选