Daft项目v0.4.17版本发布：增强数据操作能力与稳定性提升

2025-06-17 10:17:17作者：韦蓉瑛

High-performance data engine for AI and multimodal workloads. Process images, audio, video, and structured data at any scale

项目地址：https://gitcode.com/GitHub_Trending/da/Daft

Daft是一个高性能的分布式数据框架，专为大规模数据处理和分析而设计。它结合了Python生态系统的易用性和Rust语言的高性能特性，为用户提供了强大的数据处理能力。在最新发布的v0.4.17版本中，Daft团队带来了一系列功能增强和稳定性改进，进一步提升了框架的实用性和可靠性。

核心功能增强

本次版本在数据操作功能方面进行了显著增强。首先，团队实现了Rust语言对Python目录和表格的支持，这一改进使得Rust开发者能够更直接地利用Python生态中丰富的数据资源，大大提升了跨语言协作的效率。其次，新增的duration表达式功能为时间序列数据处理提供了更强大的支持，开发者现在可以更方便地进行时间相关的计算和转换。

在函数库方面，v0.4.17版本引入了函数前导(函数预加载)机制，优化了函数调用的性能表现。同时，对贡献指南进行了清理和更新，使得新开发者能够更快地参与到项目中来。

稳定性与兼容性改进

稳定性始终是Daft团队关注的重点。本次版本修复了多个关键问题，包括处理null参数时的substr函数问题、进度条可能导致的程序崩溃问题，以及Spark Connect中withColumnRenamed操作对非重命名列的保护问题。这些修复显著提升了框架的健壮性。

在兼容性方面，团队增加了对s3n协议的支持，扩展了框架处理不同数据源的能力。同时，对PyArrow Parquet读取操作增加了重试机制，提高了在大规模数据处理场景下的可靠性。

开发体验优化

为提升开发者体验，Daft团队在多个方面进行了优化。在文档方面，修复了表达式文档生成问题，确保开发者能够获取准确的技术参考。在CI/CD流程中，增加了PR测试的自动取消机制和安装重试机制，提高了开发流程的效率。

类型检查方面，团队为mypy添加了严格模式支持，并修复了runners模块中的类型问题，这些改进有助于在开发早期发现潜在问题，提升代码质量。

技术架构调整

在技术架构层面，v0.4.17版本对表达式系统进行了重构，通过proc宏实现了对FunctionArgs的字面量支持。这一调整使得表达式系统更加灵活和强大，为未来的功能扩展奠定了基础。

Dashboard组件也进行了调整，使其在非CI环境下能够保持自包含性，这一改变简化了部署流程，提升了组件的独立性。

总体而言，Daft v0.4.17版本在功能丰富性、系统稳定性和开发体验等方面都取得了显著进步，为数据工程师和分析师提供了更强大、更可靠的工具集。这些改进不仅解决了现有问题，也为框架的未来发展奠定了坚实基础。

High-performance data engine for AI and multimodal workloads. Process images, audio, video, and structured data at any scale

项目地址：https://gitcode.com/GitHub_Trending/da/Daft

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。