首页
/ Vega/Altair 动态计算时间序列差异的可视化实现

Vega/Altair 动态计算时间序列差异的可视化实现

2025-05-24 00:42:02作者:庞队千Virginia

概述

在数据可视化领域,Vega/Altair作为声明式可视化库,提供了强大的交互能力。本文将介绍如何利用Altair实现一个包含热力图和时间序列图的交互式仪表板,并动态计算两个选定时间序列之间的差异。

问题背景

我们有一个包含多个类别(a-e)的时间序列数据集,需要实现以下功能:

  1. 显示各时间序列最新日期的差异热力图
  2. 允许用户通过点击热力图选择两个时间序列
  3. 显示选中的两个时间序列的折线图
  4. 动态计算并显示这两个序列的差异

技术实现

数据准备

首先,我们生成随机时间序列数据并转换为长格式:

import pandas as pd
import numpy as np
import altair as alt

# 生成随机时间序列数据
ex_ts = pd.DataFrame(
    np.random.random((10, 5)),
    columns=['a', 'b', 'c', 'd', 'e'],
    index=(pd.date_range(start=pd.to_datetime('today')-pd.Timedelta(9, unit='D'), 
                        end=pd.to_datetime('today')).strftime('%Y-%m-%d'))
)

# 转换为长格式
ex_ts_long = ex_ts.stack().reset_index().set_axis(['date', 'category', 'diff'], axis=1)

热力图实现

计算各时间序列最新日期的差异矩阵:

def get_last_diff(i):
    return ex_ts.sub(ex_ts.iloc[:,i], axis=0).iloc[-1,:]

ex_z = pd.concat([get_last_diff(i) for i in np.arange(0, 5)], axis=1)
    .set_axis(ex_ts.columns, axis=1)
    .stack().reset_index()
    .set_axis(['x', 'y', 'diff'], axis=1)
    .round(2)

创建交互式热力图:

select_x = alt.selection_point(fields=['x'], name='select_x')
select_y = alt.selection_point(fields=['y'], name='select_y')

base = alt.Chart(ex_z).encode(
    x='x', 
    y='y', 
    color='diff'
).add_params(select_x).add_params(select_y)

hmap = base.mark_rect()
text = base.mark_text(fontWeight='bold').encode(text='diff', color=alt.value('red'))
hmap_chart = (hmap + text)

时间序列差异计算

实现动态计算两个选定序列差异的关键是使用Altair的transform_calculatetransform_filter

# 基础时间序列图
line_1 = alt.Chart(ex_ts_long).mark_line().encode(
    x='date', 
    y='diff', 
    color='category'
).transform_filter(select_x | select_y)

# 差异计算图
diff_chart = alt.Chart(ex_ts_long).mark_line(strokeDash=[5,5]).encode(
    x='date',
    y='diff_diff:Q'
).transform_filter(select_x & select_y).transform_calculate(
    x_val = f"indexof({ex_ts.columns.tolist()}, select_x.x[0])",
    y_val = f"indexof({ex_ts.columns.tolist()}, select_y.y[0])"
).transform_calculate(
    diff_diff = f"datum.x_val == datum.y_val ? 0 : " +
               f"datum.category == select_x.x[0] ? -datum.diff : " +
               f"datum.category == select_y.y[0] ? datum.diff : 0"
).transform_aggregate(
    diff_diff='sum(diff_diff)',
    groupby=['date']
)

完整仪表板

将各图表组合成最终仪表板:

final_chart = alt.vconcat(
    hmap_chart.properties(width=500, height=500),
    alt.hconcat(
        line_1.properties(width=400, height=200),
        diff_chart.properties(width=400, height=200)
    )
)

技术要点

  1. 交互选择:使用selection_point实现热力图的点击选择功能
  2. 动态计算:通过transform_calculate结合JavaScript表达式实现实时计算
  3. 条件逻辑:在Vega表达式中使用三元运算符处理不同情况
  4. 数据聚合:使用transform_aggregate对计算结果进行汇总

应用场景

这种技术可以广泛应用于:

  • 金融领域分析不同资产的价格差异
  • 气象学中比较不同地区的温度变化
  • 商业分析中监控产品指标间的关联性

通过这种交互式可视化,用户可以直观地探索时间序列数据之间的关系,并实时查看任意两个序列的差异变化。

登录后查看全文