首页
/ PyMC 项目技术文档

PyMC 项目技术文档

2024-12-23 05:47:33作者:董斯意

1. 安装指南

安装环境要求

  • Python 3.7 或更高版本
  • 推荐使用 Anaconda 或 Miniconda 进行环境管理

安装步骤

  1. 使用 pip 安装

    pip install pymc
    
  2. 使用 conda 安装

    conda install -c conda-forge pymc
    
  3. 验证安装: 安装完成后,可以通过以下命令验证是否安装成功:

    import pymc as pm
    print(pm.__version__)
    

2. 项目使用说明

项目简介

PyMC 是一个用于贝叶斯统计建模的 Python 包,专注于高级马尔可夫链蒙特卡罗(MCMC)和变分推断(VI)算法。其灵活性和可扩展性使其适用于大量问题。

主要功能

  • 直观的模型指定语法:例如,x ~ N(0,1) 可以翻译为 x = Normal('x',0,1)
  • 强大的采样算法:如 No U-Turn Sampler (NUTS),允许处理具有数千个参数的复杂模型。
  • 变分推断:如 ADVI,用于快速近似后验估计,以及适用于大数据集的 mini-batch ADVI。
  • 依赖 PyTensor:提供计算优化、动态 C 或 JAX 编译、NumPy 广播和高级索引、线性代数运算以及简单的可扩展性。
  • 透明支持缺失值插补

示例:线性回归

以下是一个简单的线性回归示例,用于预测植物生长基于不同的环境变量。

import pymc as pm

# 生成数据
seed = 42
x_dist = pm.Normal.dist(shape=(100, 3))
x_data = pm.draw(x_dist, random_seed=seed)

# 定义坐标值
coords = {
    "trial": range(100),
    "features": ["sunlight hours", "water amount", "soil nitrogen"],
}

# 定义生成模型
with pm.Model(coords=coords) as generative_model:
    x = pm.Data("x", x_data, dims=["trial", "features"])
    betas = pm.Normal("betas", dims="features")
    sigma = pm.HalfNormal("sigma")
    mu = x @ betas
    plant_growth = pm.Normal("plant growth", mu, sigma, dims="trial")

# 生成数据
fixed_parameters = {"betas": [5, 20, 2], "sigma": 0.5}
with pm.do(generative_model, fixed_parameters) as synthetic_model:
    idata = pm.sample_prior_predictive(random_seed=seed)
    synthetic_y = idata.prior["plant growth"].sel(draw=0, chain=0)

# 推断参数
with pm.observe(generative_model, {"plant growth": synthetic_y}) as inference_model:
    idata = pm.sample(random_seed=seed)
    summary = pm.stats.summary(idata, var_names=["betas", "sigma"])
    print(summary)

3. 项目 API 使用文档

主要 API

  • pm.Model():定义贝叶斯模型。
  • pm.Normal():定义正态分布。
  • pm.HalfNormal():定义半正态分布。
  • pm.Data():定义数据变量。
  • pm.sample():从模型中采样。
  • pm.sample_prior_predictive():从先验预测分布中采样。
  • pm.sample_posterior_predictive():从后验预测分布中采样。

示例

with pm.Model() as model:
    x = pm.Normal('x', mu=0, sigma=1)
    y = pm.Normal('y', mu=x, sigma=1)
    trace = pm.sample(1000)

4. 项目安装方式

使用 pip 安装

pip install pymc

使用 conda 安装

conda install -c conda-forge pymc

验证安装

import pymc as pm
print(pm.__version__)

通过以上步骤,您可以成功安装并开始使用 PyMC 进行贝叶斯统计建模。

登录后查看全文
热门项目推荐
相关项目推荐