Narwhals项目v1.25.0版本发布:多后端数据处理能力再升级
Narwhals是一个致力于为Python生态提供统一API接口的多后端数据处理框架,它允许开发者使用相同的代码操作不同的数据处理引擎,如Polars、DuckDB和Spark等。通过抽象底层实现细节,Narwhals让开发者能够专注于业务逻辑,而不必为不同引擎的API差异而烦恼。
核心功能增强
跨后端爆炸式展开功能
v1.25.0版本为DuckDB后端新增了LazyFrame.explode方法实现。这一功能允许用户将列表类型的列"爆炸"展开为多行,类似于Pandas中的explode操作。对于处理嵌套数据结构特别有用,比如JSON格式的数据。
日期时间处理能力扩展
新版本为DuckDB后端增加了.str.to_datetime方法,使得字符串到日期时间的转换更加便捷。同时,Spark后端现在也支持了日期(date)和日期时间(datetime)数据类型,并在nw.lit函数中增加了对dtype参数的支持,为时间序列数据处理提供了更强大的工具。
灵活的后端选择机制
.lazy()方法现在支持使用ModuleType和字符串来指定后端,这为开发者提供了更大的灵活性。例如,现在可以直接传入import duckdb得到的模块对象,或者简单地传递"duckdb"字符串来指定使用DuckDB引擎。
数据重塑功能增强
LazyFrame.unpivot方法现已支持Spark和DuckDB后端,这使得"宽表转长表"的操作可以在更多引擎上执行。这一功能在数据预处理和可视化准备阶段特别有用,可以方便地将多列数据转换为键值对形式。
性能优化与架构改进
简化的DuckDB分组操作
开发团队对DuckDB的分组(group-by)实现进行了简化,这可能会带来性能上的提升。虽然具体细节未在发布说明中详述,但这类底层优化通常能够减少内存使用和提高查询执行速度。
增强的收集(collect)方法
LazyFrame.collect方法现在支持通过backend参数指定执行引擎,并允许传递额外的关键字参数(**kwargs)。这一改进使得开发者能够更灵活地控制查询执行过程,针对不同后端传递特定的优化参数。
开发者体验提升
文档改进
团队对文档进行了多项修复和优化,特别是缩短了narwhals/expr.py中的示例代码,使其更加简洁易懂。此外,所有异常现在都继承自统一的NarwhalsError基类,这有助于开发者更一致地处理错误情况。
总结
Narwhals v1.25.0版本在多后端支持方面取得了显著进展,特别是在DuckDB和Spark引擎的功能覆盖上。日期时间处理、数据重塑等核心功能的增强,使得开发者能够更轻松地在不同引擎间迁移代码。同时,API的灵活性和文档的改进也大大提升了开发体验。
这一版本的发布标志着Narwhals项目在实现"编写一次,多后端运行"愿景的道路上又迈出了坚实的一步,为Python生态中的数据分析工作流提供了更强大的工具支持。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust099- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00