使用pomegranate计算贝叶斯网络的边际概率分布

2025-06-24 00:26:03作者：滑思眉Philip

概述

pomegranate是一个功能强大的概率图模型库，特别适用于构建和分析贝叶斯网络。本文将详细介绍如何使用最新版本的pomegranate计算贝叶斯网络中节点的边际概率分布，以及如何正确设置条件概率表(CPT)。

边际概率计算

在旧版pomegranate中，可以直接使用marginal()方法计算节点的边际概率。而在新版中，我们需要通过以下方式实现：

创建贝叶斯网络结构
使用掩码张量表示未知变量
调用predict_proba方法获取概率分布

import numpy as np
import torch
from pomegranate import *

# 定义节点概率分布
a = Categorical([[0.1, 0.85, 0.05]])
b = Categorical([[0.2, 0.8]])

# 定义条件概率表(注意额外的维度包装)
probs = np.array([[
    [[0.2, 0.3, 0.5], [0.1, 0.6, 0.3]],
    [[0.4, 0.4, 0.2], [0.3, 0.2, 0.5]],
    [[0.1, 0.7, 0.2], [0.6, 0.1, 0.3]]
]])

c = ConditionalCategorical(probs=probs)
model = BayesianNetwork([a, b, c], [(a, c), (b, c)])

# 使用掩码张量表示未知变量(-1表示未知)
X = torch.tensor([[-1, -1, -1]])
X_masked = torch.masked.MaskedTensor(X, mask=X >= 0)

# 计算边际概率
result = model.predict_proba(X_masked)

条件概率表设置

在设置条件概率表时，需要注意维度匹配问题。条件概率表的维度应该为：

[1, 父节点1状态数, 父节点2状态数, ..., 当前节点状态数]

对于有多个父节点的情况，例如节点d有三个父节点(a,b,c)，其条件概率表应该设置为四维数组：

d_probs = np.array([[
    [
        [[0.62, 0.35, 0.03], [0.24, 0.61, 0.15]],
        [[0.55, 0.37, 0.08], [0.11, 0.52, 0.38]]
    ],
    [
        [[0.58, 0.42, 0.0], [0.16, 0.84, 0.0]],
        [[0.51, 0.50, 0.0], [0.01, 0.99, 0.0]]
    ],
    [
        [[0.58, 0.35, 0.08], [0.16, 0.47, 0.38]],
        [[0.51, 0.31, 0.19], [0.01, 0.05, 0.94]]
    ]
]])

实用技巧

维度自动调整：可以使用reshape方法根据网络结构自动调整概率表维度

shape = [1]
for parent in node.parents:
    shape.append(parent.state_count)
shape.append(node.state_count)
probs = np.array(raw_probs).reshape(shape)