SpiceAI v1.3.0 发布：数据与AI应用性能全面升级

2025-06-19 06:45:14作者：庞队千Virginia

SpiceAI 是一个开源的数据与AI应用加速平台，它通过智能缓存、查询优化和高效的数据连接器，帮助开发者快速构建和部署数据密集型应用。SpiceAI 的核心优势在于其能够无缝集成多种数据源，并提供高性能的查询能力，特别适合需要实时或近实时数据分析的场景。

性能与功能全面提升

SpiceAI v1.3.0 带来了多项重要更新，主要集中在性能提升、功能增强和安全性改进三个方面。

Databricks SQL执行API支持

新版本增加了对Databricks SQL Statement Execution API的支持，这使得开发者可以直接通过SQL查询Databricks SQL Warehouses，为分析报表类工作流提供了更优的性能表现。这一功能通过简单的spicepod.yml配置即可启用，大大简化了与Databricks的集成过程。

查询缓存性能优化

SpiceAI v1.3.0 引入了新的缓存哈希算法ahash，作为默认siphash算法的补充。ahash算法特别适合处理大型查询或查询计划，能显著降低99百分位请求延迟，并提高大结果集查询的吞吐量。测试数据显示，在处理TPCH Query #17这类复杂查询时，性能提升尤为明显。

安全性与稳定性增强

容器镜像现在以非root用户身份运行，并增强了沙箱隔离机制，同时移除了不必要的依赖，使得镜像更加精简安全。此外，修复了DuckDB加速引擎在高并发查询多个DuckDB文件时的bug，提高了系统稳定性。

DataFusion v46引擎升级

SpiceAI底层基于DataFusion查询引擎，本次升级至v46版本带来了多项性能改进和新功能：

性能显著提升：包括median()函数性能提升2倍，FIRST_VALUE和LAST_VALUE窗口函数提速10-100%，uuid()函数加速40倍等。
新的range()表函数：类似于PostgreSQL的generate_series()或Spark的range()，方便生成整数序列。
UNION BY NAME支持：允许按列名而非位置对齐列，简化异构结果集的合并操作。