Marimo 开源项目教程

2024-09-13 16:56:09作者：吴年前Myrtle

项目介绍

Marimo 是一个开源的 Python 笔记本项目，旨在提供一个可重复、Git 友好、可作为脚本执行并可作为应用共享的编程环境。Marimo 的核心特性包括：

反应式编程环境：Marimo 确保笔记本代码、输出和程序状态的一致性，解决了传统笔记本（如 Jupyter）中手动重新运行单元格的错误问题。
交互式 UI 元素：支持绑定滑块、表格、图表等 UI 元素到 Python 代码，无需回调。
可重复性：Marimo 没有隐藏状态，执行顺序确定，内置包管理。
可执行性：笔记本可以作为 Python 脚本执行，并可通过 CLI 参数进行参数化。
可共享性：可以部署为交互式 Web 应用或幻灯片，并支持在浏览器中通过 WASM 运行。

项目快速启动

安装

首先，确保你已经安装了 Python 环境。然后，通过 pip 安装 Marimo：

pip install marimo

或者使用 conda 安装：

conda install -c conda-forge marimo

创建和编辑笔记本

安装完成后，你可以通过以下命令创建或编辑笔记本：

marimo edit

运行应用

你可以将笔记本作为 Web 应用运行，隐藏 Python 代码并使其不可编辑：

marimo run your_notebook.py

执行脚本

将笔记本作为脚本在命令行中执行：

python your_notebook.py

自动转换 Jupyter 笔记本

Marimo 还支持自动将 Jupyter 笔记本转换为 Marimo 笔记本：

marimo convert your_notebook.ipynb > your_notebook.py

应用案例和最佳实践

数据分析

Marimo 非常适合用于数据分析任务。你可以使用 Marimo 的反应式特性来实时更新图表和数据视图，而无需手动重新运行代码。

import marimo as mo
import pandas as pd

# 创建一个数据框
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6]
})

# 显示数据框
mo.output(df)

机器学习模型训练

在机器学习项目中，Marimo 可以帮助你实时监控模型训练过程，并动态调整超参数。

import marimo as mo
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

# 加载数据
X, y = load_data()
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 创建模型
model = LinearRegression()
model.fit(X_train, y_train)

# 显示模型评分
mo.output(f"模型评分: {model.score(X_test, y_test)}")

典型生态项目

数据可视化

Marimo 可以与 Matplotlib、Plotly 等数据可视化库无缝集成，提供丰富的图表展示功能。

import marimo as mo
import matplotlib.pyplot as plt

# 创建一个简单的图表
plt.plot([1, 2, 3], [4, 5, 6])

# 显示图表
mo.output(plt.gcf())

数据库查询

Marimo 内置 SQL 引擎，支持对数据框、数据库、CSV 文件等进行 SQL 查询，并将结果返回为 Python 数据框。

import marimo as mo
import pandas as pd

# 创建一个数据框
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [24, 27, 22]
})

# 执行 SQL 查询
result = mo.sql("SELECT * FROM df WHERE age > 25")

# 显示结果
mo.output(result)