Stan项目中实现改进的ESS诊断指标：Bulk-ESS与Tail-ESS

2025-06-29 08:09:53作者：农烁颖Land

Stan development repository. The master branch contains the current release. The develop branch contains the latest stable development. See the Developer Process Wiki for details.

项目地址：https://gitcode.com/gh_mirrors/st/stan

背景与需求

Stan作为一款强大的概率编程语言，其核心功能之一是对MCMC采样结果进行诊断分析。在最新开发中，Stan团队正计划引入两种新的有效样本量（ESS）诊断指标：Bulk-ESS和Tail-ESS。这些改进源自Vehtari等人的研究论文，旨在提供更全面的采样效率评估。

传统ESS计算基于自相关函数，而新方法通过秩归一化处理，能更好地反映采样器在不同分布区域的性能。Bulk-ESS关注分布主体部分的采样效率，Tail-ESS则专门评估分布尾部的采样质量。

技术实现方案

核心算法

Bulk-ESS的计算需要对采样值进行秩归一化处理：

对每个链的样本分别进行排序和秩计算
将秩转换为标准正态分布的分位数
在归一化后的数据上计算传统ESS

Tail-ESS则通过以下步骤实现：

计算5%和95%分位数的ESS值
取两者中的较小值作为尾部ESS

代码重构计划

当前实现面临几个技术挑战：

现有chains.hpp中的ESS计算使用自相关方法，但包含过时的注释
诊断函数分散在多个文件中，缺乏统一接口
数据一致性检查重复出现在各函数中

改进方案包括：

创建新的chainset.hpp类，基于vectorEigen::MatrixXd存储链数据
在对象实例化时强制数据一致性检查
将不同诊断功能拆分到独立文件中

相关扩展功能

除了Bulk-ESS和Tail-ESS，团队还考虑实现相关的蒙特卡洛标准误差（MCSE）计算。这部分功能在后验分析包中已有实现，包括：

分位数MCSE计算
基于秩归一化数据的误差估计

实施路线图

首先移除chains.hpp中关于自相关方法的过时注释
实现新的chainset数据结构
添加独立的诊断函数文件
实现Bulk-ESS和Tail-ESS计算
后续考虑添加MCSE功能
最终可能弃用旧的chains.hpp实现

技术影响

这些改进将使Stan的诊断功能：

更符合现代MCMC诊断标准
在各接口间保持一致性
提供更全面的采样质量评估
为后续功能扩展奠定基础

新诊断指标特别有助于识别：

采样器在分布主体部分的混合问题
尾部采样效率不足的情况
需要增加迭代次数的场景

这一系列改进将显著提升Stan用户在模型诊断方面的体验和能力。

Stan development repository. The master branch contains the current release. The develop branch contains the latest stable development. See the Developer Process Wiki for details.

项目地址：https://gitcode.com/gh_mirrors/st/stan

登录后查看全文

最新内容推荐

MQTT 3.1.1协议中文版文档：物联网开发者的必备技术指南 Solidcam后处理文件下载与使用完全指南：提升CNC编程效率的必备资源 Python案例资源下载 - 从入门到精通的完整项目代码合集 TortoiseSVN 1.14.5.29465 中文版：高效版本控制的终极解决方案 CrystalIndex资源文件管理系统：高效索引与文件管理的最佳实践指南 QT连接阿里云MySQL数据库完整指南：从环境配置到问题解决 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南 Python开发者的macOS终极指南：VSCode安装配置全攻略瀚高迁移工具migration-4.1.4：企业级数据库迁移的智能解决方案 STM32到GD32项目移植完全指南：从兼容性到实战技巧

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

flutter_flutter

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

ohos_react_native

React Native鸿蒙化仓库

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system