【亲测免费】Preswald 开源项目教程：Python数据应用开发新范式

2026-01-30 05:06:05作者：裘旻烁

Preswald is a WASM packager for Python-based interactive data apps: bundle full complex data workflows, particularly visualizations, into single files, runnable completely in-browser, using Pyodide, DuckDB, Pandas, and Plotly, Matplotlib, etc. Build dashboards, reports, and notebooks that run offline, load fast, and share like a document.

项目地址：https://gitcode.com/gh_mirrors/pr/preswald

还在为数据可视化应用的部署和分享而烦恼吗？还在纠结于复杂的Web框架和服务器配置吗？Preswald（Python Reactive Web Application Local Development）为你提供了一个革命性的解决方案——用纯Python构建交互式数据应用，无需服务器，直接在浏览器中运行！

读完本文，你将掌握：

✅ Preswald核心特性与工作原理
✅ 从零开始构建数据应用的完整流程
✅ 内置UI组件的使用方法与最佳实践
✅ 数据连接与可视化配置技巧
✅ 应用打包与分享的多种方式

🚀 什么是Preswald？

Preswald是一个基于WASM（WebAssembly）技术的静态站点生成器，专门为Python数据科学家和开发者设计。它集成了Pyodide和DuckDB，让你能够：

代码优先开发：用纯Python编写应用逻辑，无需学习前端框架
文件驱动部署：单命令生成完整的HTML应用，包含所有依赖
浏览器内计算：利用Pyodide在浏览器中运行Python代码
响应式引擎：自动追踪依赖关系，智能更新受影响的部分
本地执行：完全离线运行，保护敏感数据安全

flowchart TD
    A[Python脚本] --> B[Preswald处理]
    B --> C[Pyodide WASM运行时]
    B --> D[DuckDB数据查询]
    B --> E[UI组件渲染]
    C --> F[浏览器内Python执行]
    D --> F
    E --> F
    F --> G[静态HTML应用]

📦 安装与环境配置

系统要求

Python 3.7+
现代浏览器（Chrome、Firefox、Safari、Edge）

安装步骤

# 使用pip安装
pip install preswald

# 或者使用uv（推荐，更快更稳定）
uv pip install preswald

# 验证安装
preswald --version

创建第一个项目

# 初始化项目
preswald init my_first_app
cd my_first_app

# 查看项目结构
tree .

项目结构如下：

my_first_app/
├── hello.py           # 主应用逻辑文件
├── preswald.toml      # 应用配置文件
├── secrets.toml       # 密钥配置文件
├── data/
│   └── sample.csv     # 示例数据文件
├── images/
│   ├── logo.png       # 应用logo
│   └── favicon.ico    # 网站图标
└── .gitignore         # Git忽略文件

🎯 核心概念解析

响应式运行时（Reactive Runtime）

Preswald的核心创新在于其自动响应式系统。传统的数据应用需要手动定义更新逻辑，而Preswald能够：

自动依赖追踪：分析代码中的数据流关系
最小化更新：只重新执行受影响的部分
DAG优化：构建有向无环图来管理计算依赖

# 传统方式：需要手动管理状态更新
def update_visualization(data):
    # 手动更新所有相关组件
    update_chart(data)
    update_table(data)
    update_summary(data)

# Preswald方式：自动响应式
from preswald import get_df, table, text

df = get_df("sample.csv")  # 自动追踪数据依赖
table(df)                  # 自动追踪UI依赖

数据连接配置

Preswald支持多种数据源，通过preswald.toml文件配置：

# 数据源配置示例
[data.sales_csv]
type = "csv"
path = "data/sales_data.csv"

[data.users_postgres]
type = "postgres"
host = "localhost"
port = 5432
dbname = "user_database"
user = "admin"

[data.events_parquet]
type = "parquet"
path = "data/events.parquet"
columns = ["user_id", "event_type", "timestamp"]

🛠️ 实战：构建鸢尾花数据分析应用

让我们通过一个完整的示例来学习Preswald的使用。

步骤1：准备数据

首先确保data/iris.csv文件存在，包含经典的鸢尾花数据集。

步骤2：编写应用逻辑

编辑hello.py文件：

import plotly.express as px
from preswald import text, table, get_df, sidebar

# 侧边栏配置
sidebar()

# 应用标题
text("# 🌸 鸢尾花数据集分析")
text("本应用对经典的鸢尾花数据集进行可视化分析，展示三种不同品种的形态特征差异。")

# 加载数据
df = get_df("iris_csv")

# 散点图：花萼长度 vs 花萼宽度
text("## 花萼尺寸关系分析")
text("散点图展示了不同品种鸢尾花的花萼长度和宽度之间的关系。Setosa品种在花萼尺寸上与其他两个品种有明显区别。")

fig1 = px.scatter(
    df,
    x="sepal.length",
    y="sepal.width", 
    color="variety",
    title="花萼长度 vs 花萼宽度",
    labels={
        "sepal.length": "花萼长度 (cm)",
        "sepal.width": "花萼宽度 (cm)",
        "variety": "品种"
    }
)
fig1.update_layout(template="plotly_white")
fig1.show()

# 直方图：花瓣长度分布
text("## 花瓣长度分布")
text("直方图显示了三个品种的花瓣长度分布情况。Virginica品种的花瓣通常更长。")

fig2 = px.histogram(
    df, 
    x="petal.length", 
    color="variety",
    title="花瓣长度分布",
    labels={"petal.length": "花瓣长度 (cm)"}
)
fig2.update_layout(template="plotly_white")
fig2.show()

# 箱线图：花萼宽度分布
text("## 花萼宽度统计")
text("箱线图展示了每个品种花萼宽度的统计分布，包括中位数、四分位数和异常值。")

fig3 = px.box(
    df,
    x="variety",
    y="sepal.width",
    color="variety",
    title="花萼宽度分布统计",
    labels={
        "variety": "品种", 
        "sepal.width": "花萼宽度 (cm)"
    }
)
fig3.update_layout(template="plotly_white")
fig3.show()

# 数据表格预览
text("## 数据样本预览")
text("以下是数据集的前10行样本，展示了完整的测量数据。")
table(df.head(10))

# 分析总结
text("## 📊 分析洞察")
text("""
通过可视化分析，我们可以得出以下结论：
1. **Setosa品种**：花萼较宽而短，与其他品种区分明显
2. **Versicolor品种**：各项特征处于中间水平
3. **Virginica品种**：花瓣较长，花萼相对窄长

这些特征差异使得机器学习模型能够很好地分类不同品种的鸢尾花。
""")

步骤3：配置应用

编辑preswald.toml文件：

[project]
title = "鸢尾花数据分析应用"
version = "1.0.0"
port = 8501
slug = "iris-analysis-app"
entrypoint = "hello.py"

[branding]
name = "鸢尾花分析"
logo = "images/logo.png"
favicon = "images/favicon.ico"
primaryColor = "#4CAF50"

[data.iris_csv]
type = "csv"
path = "data/iris.csv"

[logging]
level = "INFO"
format = "%(asctime)s - %(name)s - %(levelname)s - %(message)s"

步骤4：运行应用

# 启动开发服务器
preswald run

# 输出结果：
# 🌐 App running at: http://localhost:8501

在浏览器中打开 http://localhost:8501，你将看到完整的交互式数据应用！

🎨 内置UI组件详解

Preswald提供了丰富的内置UI组件，满足各种数据展示需求：

文本显示组件

from preswald import text

# 各级标题
text("# 一级标题")
text("## 二级标题")
text("### 三级标题")

# 格式化文本
text("**粗体文本** *斜体文本* `代码片段`")
text("[超链接文本](https://example.com)")

# 多行文本
text("""
这是多行文本内容
支持Markdown格式
- 列表项1
- 列表项2
- 列表项3
""")

数据表格组件

from preswald import table, get_df

# 显示完整数据框
df = get_df("sales_data")
table(df)

# 显示部分数据
table(df.head(20))

# 自定义列显示
table(df[['date', 'revenue', 'profit']])

图表可视化组件

Preswald支持多种图表库：

图表类型	支持库	特点	适用场景
静态图表	Matplotlib	成熟稳定	科学计算、论文图表
交互图表	Plotly	交互性强	数据探索、仪表板
实时图表	Fastplotlib	GPU加速	实时数据流、高性能需求

表单输入组件

from preswald import slider, selectbox, checkbox, text_input

# 滑块输入
value = slider("选择阈值", min_value=0, max_value=100, value=50)

# 下拉选择
option = selectbox("选择算法", ["决策树", "随机森林", "神经网络"])

# 复选框
checked = checkbox("启用高级选项")

# 文本输入
name = text_input("请输入姓名")

🔗 高级数据连接技巧

数据库连接配置

# PostgreSQL连接示例
[data.sales_db]
type = "postgres"
host = "production-db.example.com"
port = 5432
dbname = "sales_database"
user = "analyst"

# ClickHouse连接示例  
[data.events_ch]
type = "clickhouse"
host = "clickhouse-server"
port = 8123
database = "events"
user = "readonly_user"

对应的secrets.toml文件：

[data.sales_db]
password = "your_secure_password_here"

[data.events_ch] 
password = "clickhouse_password_here"

数据查询优化

from preswald import get_df

# 基本数据加载
df = get_df("sales_db")

# 带条件查询
recent_sales = get_df("sales_db", query="SELECT * FROM sales WHERE date > '2024-01-01'")

# 聚合查询
summary = get_df("sales_db", query="""
    SELECT 
        region,
        COUNT(*) as total_orders,
        SUM(amount) as total_revenue
    FROM sales 
    GROUP BY region
    ORDER BY total_revenue DESC
""")

📊 响应式编程模式

自动依赖追踪示例

from preswald import get_df, text, slider
import plotly.express as px

# 用户交互控件
threshold = slider("销售阈值", 0, 1000, 500)

# 数据加载和过滤
sales_data = get_df("sales_db")
filtered_data = sales_data[sales_data['amount'] > threshold]

# 动态更新显示
text(f"## 销售额超过 ${threshold} 的交易")
text(f"共找到 {len(filtered_data)} 笔交易")

# 动态图表
fig = px.histogram(filtered_data, x="amount", title="交易金额分布")
fig.show()

当用户移动滑块时，Preswald会自动：

检测到threshold值变化
重新执行数据过滤逻辑
更新文本显示内容
重新渲染图表

自定义响应式函数

from preswald import get_df, text
import numpy as np

# 自定义计算函数
def calculate_kpi(data):
    total_sales = data['amount'].sum()
    avg_order = data['amount'].mean()
    max_order = data['amount'].max()
    return total_sales, avg_order, max_order

# 主应用逻辑
sales_data = get_df("sales_db")
total, avg, maximum = calculate_kpi(sales_data)

text(f"## 销售KPI分析")
text(f"- 总销售额: ${total:,.2f}")
text(f"- 平均订单额: ${avg:,.2f}")  
text(f"- 最大订单额: ${maximum:,.2f}")

🚀 应用部署与分享

静态导出

# 导出为静态网站
preswald export

# 导出目录结构
dist/
├── index.html          # 主应用文件
├── assets/
│   ├── app.js         # 打包的JavaScript
│   ├── style.css      # 样式文件
│   └── data/          # 内嵌数据文件
└── pyodide/           # Pyodide运行时

部署选项对比

部署方式	优点	缺点	适用场景
本地文件	完全离线、无需网络	文件较大	内部演示、安全环境
GitHub Pages	免费、简单	有大小限制	开源项目、文档
云存储	可扩展、CDN加速	需要配置	生产环境、团队共享
Docker容器	环境隔离、易于部署	需要Docker知识	企业部署、CI/CD

高级部署配置

[project]
title = "生产环境应用"
version = "2.0.0"
slug = "production-app"
entrypoint = "main.py"
disable_reactivity = false  # 生产环境建议保持启用

[telemetry]
enabled = false  # 生产环境建议禁用遥测

[logging]
level = "WARNING"  # 生产环境减少日志输出
format = "%(asctime)s - %(levelname)s - %(message)s"

🔧 故障排除与优化

常见问题解决

问题1：应用启动缓慢

# 解决方案：使用uv替代pip
uv pip install preswald

问题2：内存占用过高

# 解决方案：优化数据加载
# 使用列子集减少内存占用
df = get_df("large_dataset", query="SELECT id, name, value FROM table")

# 或者使用Parquet格式
[data.optimized_data]
type = "parquet"
path = "data/optimized.parquet"
columns = ["essential_columns_only"]

问题3：响应式更新卡顿

# 解决方案：临时禁用响应式进行调试
[project]
disable_reactivity = true

性能优化技巧

数据预处理：在数据库层面进行聚合和过滤

preswald

项目地址：https://gitcode.com/gh_mirrors/pr/preswald

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

【亲测免费】Preswald 开源项目教程：Python数据应用开发新范式

🚀 什么是Preswald？

📦 安装与环境配置

系统要求

安装步骤

创建第一个项目

🎯 核心概念解析

响应式运行时（Reactive Runtime）

数据连接配置

🛠️ 实战：构建鸢尾花数据分析应用

步骤1：准备数据

步骤2：编写应用逻辑

步骤3：配置应用

步骤4：运行应用

🎨 内置UI组件详解

文本显示组件

数据表格组件

图表可视化组件

表单输入组件

🔗 高级数据连接技巧

数据库连接配置

数据查询优化

📊 响应式编程模式

自动依赖追踪示例

自定义响应式函数

🚀 应用部署与分享

静态导出

部署选项对比

高级部署配置

🔧 故障排除与优化

常见问题解决

性能优化技巧

热门内容推荐

最新内容推荐

项目优选

【亲测免费】Preswald 开源项目教程：Python数据应用开发新范式

🚀 什么是Preswald？

📦 安装与环境配置

系统要求

安装步骤

创建第一个项目

🎯 核心概念解析

响应式运行时（Reactive Runtime）

数据连接配置

🛠️ 实战：构建鸢尾花数据分析应用

步骤1：准备数据

步骤2：编写应用逻辑

步骤3：配置应用

步骤4：运行应用

🎨 内置UI组件详解

文本显示组件

数据表格组件

图表可视化组件

表单输入组件

🔗 高级数据连接技巧

数据库连接配置

数据查询优化

📊 响应式编程模式

自动依赖追踪示例

自定义响应式函数

🚀 应用部署与分享

静态导出

部署选项对比

高级部署配置

🔧 故障排除与优化

常见问题解决

性能优化技巧

相关内容推荐

热门内容推荐

最新内容推荐

项目优选