Ibis项目10.2.0版本发布：数据操作框架的增强与优化

2025-06-10 06:35:11作者：柯茵沙

Ibis是一个开源的Python数据分析框架，它提供了统一的接口来操作多种数据库和计算引擎。通过Ibis，数据分析师和工程师可以使用相同的Python语法与不同的后端系统交互，而无需学习每种系统的特定查询语言。这一特性使得Ibis成为跨平台数据分析的理想工具。

核心功能增强

在10.2.0版本中，Ibis团队显著扩展了示例功能，使其能够支持更多后端系统。这一改进使得用户能够更容易地学习和理解如何在不同类型的数据库上使用Ibis。开发者现在可以通过统一的示例代码库来探索各种后端系统的特性和用法，大大降低了学习曲线。

对于BigQuery用户，此版本修复了一个重要问题：现在可以在窗口函数中使用count distinct操作而不必显式指定窗口范围。这一改进使得BigQuery后端的行为更加符合用户预期，同时也与其他数据库后端保持了一致性。

数据类型处理优化

数据类型系统在此版本中得到了多项改进。文档中明确说明了"!"符号表示非空约束，同时为类型提示增加了nullable参数支持。这些改进使得类型系统的表达更加清晰和一致。

在PyArrow转换方面，10.2.0版本确保非空约束能够正确保留。这一修复对于数据质量保证至关重要，特别是在数据管道中需要严格类型检查的场景下。Snowflake后端的PyArrow表构造也得到了改进，现在能够正确处理schema信息。

性能提升与架构优化

性能方面，此版本引入了entry points缓存机制，减少了重复加载带来的开销。同时，禁止在Deferred对象上使用__dunder__属性，这一改变优化了对象访问性能。

DuckDB后端的扩展加载和安装过程在此版本中得到了简化，使得用户能够更便捷地使用DuckDB的各种功能。这一改进特别适合需要频繁使用不同扩展的数据分析场景。

文档与示例完善

文档系统在此版本中获得了多项改进。构建系统禁用了行为异常的DuckDB空间优化器，确保了文档生成的稳定性。选择器模块的文档现在直接渲染整个模块内容，而不是手动挑选组件，这使得文档更加全面和准确。

"Getting started"指南新增了使用literal的示例，帮助新用户更快掌握这一常用功能。示例系统也进行了优化，确保在MSSQL等后端上能够正常工作，并避免使用overwrite操作，提高了示例代码的可靠性。

构建系统改进

构建系统在此版本中确保传统工具能够正确识别Ibis许可证的有效性。这一改进虽然看似微小，但对于企业环境中使用严格合规检查的用户来说非常重要。

总体而言，Ibis 10.2.0版本在功能、性能和用户体验方面都做出了显著改进，进一步巩固了其作为跨平台数据分析首选工具的地位。无论是数据类型处理、后端兼容性还是文档系统，这个版本都带来了值得升级的改进。

ibis

the portable Python dataframe library

项目地址：https://gitcode.com/GitHub_Trending/ib/ibis

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Ibis项目10.2.0版本发布：数据操作框架的增强与优化

核心功能增强

数据类型处理优化

性能提升与架构优化

文档与示例完善

构建系统改进

热门内容推荐

最新内容推荐

项目优选

Ibis项目10.2.0版本发布：数据操作框架的增强与优化

核心功能增强

数据类型处理优化

性能提升与架构优化

文档与示例完善

构建系统改进

相关内容推荐

热门内容推荐

最新内容推荐

项目优选