零代码实现工程寿命预测：PyMC贝叶斯生存分析实战指南

2026-02-04 04:43:04作者：乔或婵

你是否还在为设备故障预测头疼？传统可靠性分析要么依赖大量失效数据，要么无法量化不确定性。本文将用PyMC实现贝叶斯生存分析，只需基础Python知识即可掌握工程寿命预测的完整流程。读完你将获得： Weibull分布建模技巧、右删失数据处理方法、失效率可视化工具，以及一个可直接复用的电机寿命预测案例。

生存分析在工程领域的应用价值

在制造业中，准确预测设备寿命意味着：

降低20-30%的维护成本（根据IEEE可靠性工程报告）
减少50%的意外停机时间
优化备件库存，降低资金占用

传统方法如Kaplan-Meier估计需要大量失效数据，而贝叶斯方法能在小样本下给出可靠的概率预测。PyMC作为Python生态中最成熟的概率编程库，提供了灵活的生存模型构建工具。

核心数学模型与PyMC实现

Weibull分布：工程寿命分析的黄金标准

Weibull分布是描述产品寿命的常用模型，其概率密度函数为：

$f(t) = \frac{\beta}{\eta^\beta} t^{\beta-1} e^{-(t/\eta)^\beta}$

其中：

$\beta$ 形状参数（决定失效率趋势）
$\eta$ 尺度参数（特征寿命）

当 $\beta=1$ 时退化为指数分布（恒定失效率）， $\beta>1$ 表示失效率随时间增加（磨损型故障）， $\beta<1$ 表示失效率随时间降低（早期故障）。

在PyMC中，Weibull分布通过 pymc/distributions/continuous.py 实现，核心代码如下：

class Weibull(PositiveContinuous):
    def __init__(self, beta, eta, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.beta = beta
        self.eta = eta

    def logp(self, value):
        return (pt.log(self.beta) - self.beta * pt.log(self.eta) + 
                (self.beta - 1) * pt.log(value) - (value / self.eta) ** self.beta)

处理工程数据的关键：右删失问题

在实际工程中，我们往往只能观察到"设备在观测期内未失效"的删失数据。PyMC通过截断分布轻松处理这类问题：

with pm.Model() as model:
    # 先验分布
    beta = pm.HalfNormal('beta', sigma=2)
    eta = pm.HalfNormal('eta', sigma=1000)
    
    # 生存模型（处理右删失）
    weibull = pm.Weibull('weibull', beta=beta, eta=eta)
    y_obs = pm.Bound(weibull, lower=0).dist()
    
    # 观测数据（status=1表示失效，0表示删失）
    likelihood = pm.DensityDist('likelihood', 
        lambda x: pm.logp(y_obs, x), 
        observed={'x': lifetimes, 'status': status}
    )

电机寿命预测完整案例

数据准备与可视化

我们使用某工厂30台电机的运行数据，包含：

运行时间（小时）
失效状态（1=失效，0=正常运行中）

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 加载数据
data = pd.read_csv('motor_lifetimes.csv')
lifetimes = data['operating_hours'].values
status = data['failed'].values  # 1=失效, 0=删失

# 绘制生存数据直方图
plt.figure(figsize=(10, 6))
sns.histplot(data=data, x='operating_hours', hue='failed', 
             multiple='stack', bins=20)
plt.xlabel('运行时间(小时)')
plt.ylabel('电机数量')
plt.title('电机寿命分布与失效状态')
plt.show()

贝叶斯模型构建与采样

import pymc as pm
import arviz as az

with pm.Model() as motor_model:
    # 先验分布
    beta = pm.HalfNormal('beta', sigma=2, transform=pm.distributions.transforms.log)
    eta = pm.HalfNormal('eta', sigma=1000, transform=pm.distributions.transforms.log)
    
    # 构建生存模型
    with pm.Model() as submodel:
        t = pm.Uniform('t', lower=0, upper=1e5)
        pm.Weibull('weibull', beta=beta, eta=eta, observed=t)
    
    # 处理删失数据
    def logp(t):
        return pm.logp(submodel, t)
    
    # 似然函数
    pm.DensityDist('likelihood', logp, observed={'t': lifetimes[status==1]})
    # 处理删失观测
    for t in lifetimes[status==0]:
        pm.Potential(f'censor_{t}', pm.logcdf(submodel, t))
    
    # MCMC采样
    trace = pm.sample(2000, cores=2, target_accept=0.95)

模型结果分析与可视化

# 后验分布可视化
az.plot_trace(trace, var_names=['beta', 'eta'])

# 生存曲线预测
t_range = np.linspace(0, 5000, 100)
survival_curves = np.exp(-(t_range[:, None]/trace.posterior['eta'])**trace.posterior['beta'])

# 绘制生存曲线
plt.figure(figsize=(10, 6))
plt.plot(t_range, survival_curves.mean(axis=(1,2)), label='平均生存概率')
plt.fill_between(t_range, 
                 np.percentile(survival_curves, 2.5, axis=(1,2)),
                 np.percentile(survival_curves, 97.5, axis=(1,2)),
                 alpha=0.3, label='95%置信区间')
plt.xlabel('运行时间(小时)')
plt.ylabel('生存概率')
plt.title('电机生存曲线预测')
plt.legend()

工程实践中的高级技巧

多变量加速寿命测试模型

通过引入协变量（如温度、负载），可以构建加速寿命模型：

with pm.Model() as model:
    # 协变量系数
    alpha_temp = pm.Normal('alpha_temp', mu=0, sigma=1)
    
    # 加速模型参数
    beta = pm.HalfNormal('beta', sigma=2)
    eta0 = pm.HalfNormal('eta0', sigma=1000)
    
    # 温度加速因子
    eta = eta0 * pm.math.exp(alpha_temp * (temp - 25))  # 25°C为基准温度
    
    # Weibull模型
    pm.Weibull('lifetime', beta=beta, eta=eta, observed=lifetimes)

失效率曲线可视化

失效率函数 $h(t) = \beta t^{\beta-1}/\eta^\beta$ 可帮助识别故障模式：

def hazard_rate(t, beta, eta):
    return beta * (t / eta) ** (beta - 1) / eta

# 计算失效率曲线
hazard_curves = hazard_rate(t_range[:, None], 
                          trace.posterior['beta'], 
                          trace.posterior['eta'])

# 绘制失效率曲线
plt.figure(figsize=(10, 6))
plt.plot(t_range, hazard_curves.mean(axis=(1,2)))
plt.xlabel('运行时间(小时)')
plt.ylabel('失效率')
plt.title('电机失效率曲线')