Turing.jl中SliceSampling作为Gibbs采样器的实现与应用

2025-07-04 01:39:28作者：卓炯娓

Bayesian inference with probabilistic programming.

项目地址：https://gitcode.com/gh_mirrors/tu/Turing.jl

引言

在贝叶斯统计建模中，Gibbs采样是一种常用的马尔可夫链蒙特卡洛(MCMC)方法。Turing.jl作为Julia生态中强大的概率编程语言，提供了灵活的Gibbs采样实现。本文将深入探讨如何在Turing.jl中利用SliceSampling.jl包作为Gibbs采样的组件，以及在实际应用中的性能表现。

SliceSampling与Gibbs采样的结合原理

SliceSampling（切片采样）是一种无需调整参数的MCMC方法，它通过"切片"技术从目标分布中采样。将其作为Gibbs采样的一个组件，可以充分利用Gibbs采样对高维参数空间分解的优势，同时避免手动调整采样参数的麻烦。

在Turing.jl中，通过Experimental.Gibbs接口，我们可以将SliceSampling的采样器作为外部采样器(external sampler)集成到Gibbs框架中。这种组合特别适合于模型中同时包含连续型和离散型变量的情况。

实现方法

在Turing.jl中实现SliceSampling作为Gibbs采样组件的核心代码如下：

using Distributions, Turing, SliceSampling

@model function demo()
    s ~ InverseGamma(3, 3)
    m ~ MvNormal(zeros(10), sqrt(s))
end

# 定义必要的接口方法
Turing.Inference.getparams(::Turing.DynamicPPL.Model, state::SliceSampling.UnivariateSliceState) = state.transition.params
Turing.Inference.getparams(::Turing.DynamicPPL.Model, state::SliceSampling.GibbsState) = state.transition.params

Turing.Experimental.gibbs_requires_recompute_logprob(
    model_dst,
    ::DynamicPPL.Sampler{<:Turing.Inference.ExternalSampler},
    sampler_src,
    state_dst,
    state_src
) = false

# 采样执行
n_samples = 10000
model = demo()
sample(
    model,
    Experimental.Gibbs(
        (
            m = externalsampler(RandPermGibbs(SliceSteppingOut(0.1))),
            s = externalsampler(SliceSteppingOut(0.1)),
        ),
    ),
    n_samples
)

实际应用案例

考虑一个简单的混合模型示例，展示了SliceSampling在Gibbs框架中的实际应用：

@model function simple_choice(xs)
    p ~ Beta(2, 2)
    z ~ Bernoulli(p)
    for i in 1:length(xs)
        if z == 1
            xs[i] ~ Normal(0, 1)
        else
            xs[i] ~ Normal(2, 1)
        end
    end
end

model = simple_choice([1.5, 2.0, 0.3])

# 使用HMC和PG的组合
sample(model, Gibbs(HMC(0.2, 3, :p), PG(20, :z)), 1000)

# 使用SliceSampling和PG的组合
sample(model, Experimental.Gibbs((
    p = externalsampler(SliceSteppingOut(2.0)),
    z = PG(20)), 
n_samples)

性能比较

通过对比实验，我们可以观察到SliceSampling在Gibbs框架中的表现：

HMC+PG组合:
- 参数p的均值: 0.4259
- 标准差: 0.1945
- ESS/s: 9.2327
SliceSteppingOut+PG组合:
- 参数p的均值: 0.5936
- 标准差: 0.1897
- ESS/s: 59.9814
SliceDoublingOut+PG组合:
- 参数p的均值: 0.5970
- 标准差: 0.1919
- ESS/s: 67.0373

从结果可以看出，SliceSampling变体在有效样本量每秒(ESS/s)指标上显著优于HMC，且无需复杂的参数调优。

注意事项与最佳实践

变量顺序问题：在联合采样多个变量时，变量的顺序会影响结果。建议按照模型中变量出现的顺序指定采样变量。
PG采样器使用：在使用粒子Gibbs(PG)采样器时，不应指定变量名参数，直接使用PG(20)而非PG(20, :z)。
参数设置：SliceSampling的步长参数(如SliceSteppingOut中的2.0)虽然不需要精确调整，但过大或过小仍会影响采样效率。
扩展实现：目前最佳实践是通过包扩展机制实现接口，未来这些接口可能会迁移到AbstractMCMC.jl中。

结论

将SliceSampling集成到Turing.jl的Gibbs采样框架中，提供了一种高效且无需复杂调参的贝叶斯推断方法。特别适合那些包含连续变量的模型，在实际应用中表现出色。随着Turing生态系统的不断完善，这种组合采样方法将为复杂统计建模提供更加灵活高效的解决方案。

对于Julia用户而言，掌握这种技术组合将大大提升贝叶斯建模的效率和便利性，特别是在处理中等规模问题时，可以避免繁琐的采样器参数调优过程。

Bayesian inference with probabilistic programming.

项目地址：https://gitcode.com/gh_mirrors/tu/Turing.jl

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理