GeoSpark中RS_SetValue写入空栅格数据失败问题解析

2025-07-05 03:05:18作者：吴年前Myrtle

项目地址：https://gitcode.com/gh_mirrors/sed/sedona

问题背景

在使用GeoSpark(现称Apache Sedona)进行栅格数据处理时，开发人员可能会遇到一个常见问题：尝试向空栅格(empty raster)写入数据时，RS_SetValue函数会抛出ArrayIndexOutOfBoundsException异常。这种情况通常发生在创建了一个空栅格后，试图填充数据时。

问题现象

当执行如下SQL语句时：

SELECT RS_SetValues(
    RS_MakeEmptyRaster(1, 'D', 10, 10, 0, 0, 1), 
    1, 0, 0, 10, 10, CAST(SEQUENCE(0, 99, 1) AS ARRAY<DOUBLE>)
) as Raster;

系统会抛出ArrayIndexOutOfBoundsException异常，错误信息中显示"cause: -11"，表明尝试访问了非法索引位置。

根本原因

这个问题的根源在于对RS_SetValues函数参数的理解偏差。该函数的colX和rowY参数采用的是1-based索引系统，而不是开发者常见的0-based索引系统。也就是说：

栅格数据的行列索引从1开始计数
左上角第一个像素的位置是(1,1)而不是(0,0)
右下角最后一个像素的位置是(宽度,高度)

正确使用方法

要正确地向空栅格写入数据，应该使用1-based索引：

SELECT RS_SetValues(
    RS_MakeEmptyRaster(1, 'D', 10, 10, 0, 0, 1), 
    1, 1, 1, 10, 10, CAST(SEQUENCE(0, 99, 1) AS ARRAY<DOUBLE>)
) as Raster;

技术细节解析

RS_MakeEmptyRaster函数：创建一个指定大小和类型的空栅格
- 第一个参数是波段数
- 'D'表示数据类型为Double
- 10,10表示栅格的宽度和高度
- 0,0表示左上角的坐标
- 1表示像素大小
RS_SetValues函数：向栅格写入数据
- 第一个参数是目标栅格
- 第二个参数是波段索引(1-based)
- 第三、四个参数是起始列和行(1-based)
- 第五、六个参数是写入区域的宽度和高度
- 最后一个参数是要写入的数据数组