Xan 0.46.0版本发布：数据处理工具的全面升级

2025-06-18 21:35:13作者：伍霜盼Ellen

The CSV command line magician.

项目地址：https://gitcode.com/gh_mirrors/xa/xan

Xan是一个功能强大的命令行数据处理工具，它提供了丰富的数据操作功能，包括数据转换、过滤、聚合和可视化等。作为一个现代化的数据处理工具，Xan特别适合处理结构化数据，如CSV、JSON等格式，并且内置了Moonblade表达式语言，使得数据操作更加灵活高效。

重大变更

本次0.46.0版本带来了几个重要的变更，需要用户特别注意：

Moonblade连接操作符变更：连接操作符从原来的.变更为++，这一变更使得语法更加清晰，避免了与成员访问操作符的潜在混淆。
命令行帮助系统重构：移除了--functions、--cheatsheet和--aggs等参数，引入了全新的xan help命令，提供了更加统一和完整的帮助系统。
Moonblade新增操作符：
- 成员访问操作符：map.name（等同于get(map, "name")）
- 函数调用操作符：string.len()（等同于len(string)）
帮助输出位置变更：现在帮助信息会输出到stdout（标准输出），特别是在使用-h/--help标志时。

新增功能

本次版本增加了多项实用功能，进一步扩展了Xan的能力边界：

格式转换增强：
- xan to html：将数据转换为HTML格式
- xan to md：将数据转换为Markdown格式
- xan to npy和xan from npy：支持NumPy二进制格式的导入导出
数据可视化改进：
- xan plot新增-R/--regression-line选项，可以绘制回归线
数据操作便利性提升：
- 新增xan t作为xan transpose的别名
- fmt函数现在支持映射替换
- xan sort新增-C/--cells选项，支持单元格级别的排序
文本处理增强：
- xan search新增--count和--overlapping选项
- xan tokenize words新增-F/--flatmap选项

问题修复

本次版本修复了多个影响用户体验的问题：

搜索功能修复：
- 修复了xan search --pattern-column的问题
- 修复了xan search --patterns -i的问题
- 修复了xan search -r -i --patterns --count的结果问题
显示和格式化修复：
- 修复了URL和高亮显示问题
- 修复了日期时间高亮显示问题，特别是支持以Z结尾的时间戳格式
数据处理修复：
- 修复了stats命令中日期和URL推断的问题
- 修复了Moonblade对Z结尾时间戳格式的支持
- 修复了xan plot -T粒度推断的问题
- 修复了默认datetime序列化中缺少小数秒的问题
性能优化：
- 优化了聚合器的内存消耗，提升了处理大规模数据时的性能

技术细节深入

对于开发者来说，本次版本的一些变更值得深入理解：

Moonblade语言增强：新增的成员访问和函数调用操作符使得表达式更加直观。例如，现在可以直接使用user.profile.name来访问嵌套数据，或者使用string.trim()来调用函数，这大大提高了代码的可读性。
NumPy格式支持：新增的npy格式支持使得Xan能够更好地与Python生态集成，方便数据科学工作流中的数据交换。
回归线可视化：新增的回归线功能为数据分析提供了更强大的可视化工具，可以帮助用户快速识别数据趋势。
性能优化：聚合器内存消耗的优化意味着Xan现在可以更高效地处理大规模数据集，这对于数据密集型应用尤为重要。

升级建议

对于现有用户，升级到0.46.0版本时需要注意：

检查现有的Moonblade表达式，特别是那些使用.作为连接操作符的地方，需要替换为++。
熟悉新的帮助系统，使用xan help命令来获取完整的文档。
利用新的操作符简化表达式，提高代码的可读性。
对于需要与Python交互的工作流，可以尝试使用新的npy格式来提高数据交换效率。

Xan 0.46.0版本的发布标志着这个工具在功能完整性和用户体验上的又一次重大进步，无论是对于数据分析师还是开发者，都提供了更强大、更便捷的数据处理能力。

The CSV command line magician.

项目地址：https://gitcode.com/gh_mirrors/xa/xan

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理