首页
/ Narwhals v1.26.0 版本发布:数据框架库的重大更新

Narwhals v1.26.0 版本发布:数据框架库的重大更新

2025-07-06 07:29:12作者:蔡怀权

Narwhals 是一个专注于数据处理的Python库,它提供了统一的数据框架接口,能够兼容多种后端数据处理引擎(如Pandas、Polars等)。这个项目旨在为数据科学家和分析师提供一个简单一致的API,无论底层使用何种数据处理引擎,都能保持相同的操作体验。

核心功能增强

1. 新增Series.hist方法

本次版本新增了Series.hist方法,使得用户可以直接在Series对象上生成直方图。这个功能对于数据探索和可视化分析非常有用,特别是在快速了解数据分布情况时。该方法会自动处理数值型数据的分箱和计数,简化了数据可视化的流程。

2. 异常处理机制改进

v1.26.0版本对Polars异常进行了捕获,并统一了异常抛出机制。这一改进使得错误处理更加一致和可靠,当操作失败时,用户会收到格式统一、信息明确的错误提示,便于快速定位和解决问题。

3. 数组类型转换优化

数组类型转换功能得到了显著增强,现在能够更智能地处理各种数组类型的转换场景。这一改进特别适用于需要处理混合数据类型或在不同数据处理引擎间转换数据的场景。

4. 新增datetime选择器

新增的datetime选择器使得时间序列数据的处理更加便捷。用户现在可以更简单地筛选和操作包含日期时间类型的数据列,这对于时间序列分析尤为重要。

5. Schema转换方法

新增了Schema.to_(arrow|pandas|polars)方法,提供了更灵活的模式转换选项。这些方法允许用户轻松地将数据模式转换为不同格式,增强了与其他数据处理库的互操作性。

重要问题修复

1. Int128类型支持

修复了Int128类型的转换问题,现在可以正确处理这种大整数类型。这对于需要处理极大整数值的应用场景非常重要。

2. 类型系统改进

修复了类型系统中的几个关键问题,包括__get_item__类型注解和from_native方法的重载问题。这些修复使得类型提示更加准确,有助于开发者在IDE中获得更好的代码补全和类型检查体验。

文档与代码质量提升

1. 文档增强

新增了Schema转换方法的详细文档,并优化了模块文档字符串。项目还新增了文档字符串编写指南,帮助贡献者编写更一致、更清晰的文档。

2. 代码质量改进

进行了多项代码优化,包括减少重复代码、在Narwhals层面实现更多方法而非兼容层实现,以及解决多个类型注解警告。这些改进提升了代码的可维护性和稳定性。

3. 测试覆盖扩展

增加了对TPCH查询结果的验证测试,添加了Validoopsie作为下游测试,并改进了绘图测试的位置。这些测试增强确保了库在各种使用场景下的可靠性。

总结

Narwhals v1.26.0版本带来了多项重要改进和新功能,特别是在数据类型处理、异常管理和API一致性方面。这些变化使得库更加稳定、易用,同时保持了与多种数据处理引擎的良好兼容性。对于数据科学家和分析师来说,这个版本提供了更强大的工具来处理复杂的数据操作任务,同时简化了跨引擎数据处理的复杂性。

登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
202
2.17 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
208
285
pytorchpytorch
Ascend Extension for PyTorch
Python
61
94
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
977
575
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
550
83
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.02 K
399
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
393
27
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
1.2 K
133