Pandas数据可视化中堆叠条形图的子图绘制问题分析

2025-05-01 11:43:48作者：管翌锬

在Pandas 2.2.3版本及最新开发分支中，使用DataFrame的plot方法绘制堆叠条形图时，当同时启用stacked=True和subplots参数时，会出现堆叠行为异常的问题。本文将深入分析这一问题的表现、原因以及解决方案。

问题现象

当使用Pandas绘制堆叠条形图时，正常情况下各列数据会按照数值进行累加堆叠。例如，对于包含A、B两列的数据：

df = pd.DataFrame([(30, 10), (20, 20), (10, 30)], columns=['A','B'])
df.plot(kind="bar", stacked=True)

这种情况下，每个柱形的高度等于A+B的值，堆叠效果符合预期。

然而，当使用subplots参数指定部分列进行子图绘制时：

df.plot(subplots=[('A','B')], kind="bar", stacked=True)

堆叠行为会发生变化，不再是数值累加，而是简单的视觉叠加，导致柱形高度不正确。

这个问题源于Pandas绘图后端在处理子图堆叠时的实现逻辑。在标准堆叠模式下，Pandas会：

但在子图模式下，当前的实现：

该问题影响所有使用以下组合参数的情况：

修复方案需要修改Pandas绘图后端的子图处理逻辑，确保：

在问题修复前，建议用户可以采用以下替代方案：

df[['A','B']].plot(kind="bar", stacked=True)

fig, ax = plt.subplots()
bottom = np.zeros(len(df))
for col in ['A', 'B']:
    ax.bar(df.index, df[col], bottom=bottom)
    bottom += df[col]

Pandas的数据可视化功能虽然强大，但在某些复杂场景下仍存在边界条件需要处理。这个问题提醒我们，在使用高级参数组合时，应当仔细验证可视化结果是否符合预期。对于需要精确控制的数据可视化任务，有时直接使用Matplotlib可能会提供更可靠的结果。

登录后查看全文