首页
/ Vega/Altair 动态计算时间序列差异的可视化实现

Vega/Altair 动态计算时间序列差异的可视化实现

2025-05-24 03:33:51作者:庞队千Virginia

概述

在数据可视化领域,Vega/Altair作为声明式可视化库,提供了强大的交互能力。本文将介绍如何利用Altair实现一个包含热力图和时间序列图的交互式仪表板,并动态计算两个选定时间序列之间的差异。

问题背景

我们有一个包含多个类别(a-e)的时间序列数据集,需要实现以下功能:

  1. 显示各时间序列最新日期的差异热力图
  2. 允许用户通过点击热力图选择两个时间序列
  3. 显示选中的两个时间序列的折线图
  4. 动态计算并显示这两个序列的差异

技术实现

数据准备

首先,我们生成随机时间序列数据并转换为长格式:

import pandas as pd
import numpy as np
import altair as alt

# 生成随机时间序列数据
ex_ts = pd.DataFrame(
    np.random.random((10, 5)),
    columns=['a', 'b', 'c', 'd', 'e'],
    index=(pd.date_range(start=pd.to_datetime('today')-pd.Timedelta(9, unit='D'), 
                        end=pd.to_datetime('today')).strftime('%Y-%m-%d'))
)

# 转换为长格式
ex_ts_long = ex_ts.stack().reset_index().set_axis(['date', 'category', 'diff'], axis=1)

热力图实现

计算各时间序列最新日期的差异矩阵:

def get_last_diff(i):
    return ex_ts.sub(ex_ts.iloc[:,i], axis=0).iloc[-1,:]

ex_z = pd.concat([get_last_diff(i) for i in np.arange(0, 5)], axis=1)
    .set_axis(ex_ts.columns, axis=1)
    .stack().reset_index()
    .set_axis(['x', 'y', 'diff'], axis=1)
    .round(2)

创建交互式热力图:

select_x = alt.selection_point(fields=['x'], name='select_x')
select_y = alt.selection_point(fields=['y'], name='select_y')

base = alt.Chart(ex_z).encode(
    x='x', 
    y='y', 
    color='diff'
).add_params(select_x).add_params(select_y)

hmap = base.mark_rect()
text = base.mark_text(fontWeight='bold').encode(text='diff', color=alt.value('red'))
hmap_chart = (hmap + text)

时间序列差异计算

实现动态计算两个选定序列差异的关键是使用Altair的transform_calculatetransform_filter

# 基础时间序列图
line_1 = alt.Chart(ex_ts_long).mark_line().encode(
    x='date', 
    y='diff', 
    color='category'
).transform_filter(select_x | select_y)

# 差异计算图
diff_chart = alt.Chart(ex_ts_long).mark_line(strokeDash=[5,5]).encode(
    x='date',
    y='diff_diff:Q'
).transform_filter(select_x & select_y).transform_calculate(
    x_val = f"indexof({ex_ts.columns.tolist()}, select_x.x[0])",
    y_val = f"indexof({ex_ts.columns.tolist()}, select_y.y[0])"
).transform_calculate(
    diff_diff = f"datum.x_val == datum.y_val ? 0 : " +
               f"datum.category == select_x.x[0] ? -datum.diff : " +
               f"datum.category == select_y.y[0] ? datum.diff : 0"
).transform_aggregate(
    diff_diff='sum(diff_diff)',
    groupby=['date']
)

完整仪表板

将各图表组合成最终仪表板:

final_chart = alt.vconcat(
    hmap_chart.properties(width=500, height=500),
    alt.hconcat(
        line_1.properties(width=400, height=200),
        diff_chart.properties(width=400, height=200)
    )
)

技术要点

  1. 交互选择:使用selection_point实现热力图的点击选择功能
  2. 动态计算:通过transform_calculate结合JavaScript表达式实现实时计算
  3. 条件逻辑:在Vega表达式中使用三元运算符处理不同情况
  4. 数据聚合:使用transform_aggregate对计算结果进行汇总

应用场景

这种技术可以广泛应用于:

  • 金融领域分析不同资产的价格差异
  • 气象学中比较不同地区的温度变化
  • 商业分析中监控产品指标间的关联性

通过这种交互式可视化,用户可以直观地探索时间序列数据之间的关系,并实时查看任意两个序列的差异变化。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
144
1.93 K
kernelkernel
deepin linux kernel
C
22
6
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
192
274
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
145
189
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
930
553
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
423
392
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
75
66
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.11 K
0
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
64
509