首页
/ Vizro项目在Kaggle环境下的部署解决方案

Vizro项目在Kaggle环境下的部署解决方案

2025-06-27 03:26:47作者:鲍丁臣Ursa

背景介绍

Vizro是一个基于Python的数据可视化仪表盘构建框架,它能够帮助数据科学家和分析师快速创建交互式数据可视化应用。然而,在Kaggle这样的云端Jupyter Notebook环境中部署Vizro应用时会遇到一些特殊的技术挑战。

问题分析

在Kaggle Notebook中运行Vizro应用时,虽然控制台显示Dash应用已在本地端口8050启动,但实际上无法通过浏览器访问。经过排查发现,这是由于Kaggle环境的安全限制和网络隔离机制导致的。Kaggle Notebook运行在一个受限的容器环境中,不允许直接暴露本地端口到外部网络。

解决方案:使用Ngrok隧道

针对这一问题,我们可以使用Ngrok工具创建一个安全的隧道,将Kaggle内部的Vizro应用暴露到公网。以下是详细实现步骤:

1. 准备工作

首先需要注册Ngrok账号并获取认证令牌。这个令牌将用于建立安全连接。

2. 环境配置

在Kaggle Notebook中安装必要的Python包:

!pip install vizro pyngrok dash_ag_grid

3. 设置Ngrok认证

将Ngrok认证令牌存储在Kaggle Secrets中,确保安全性:

from kaggle_secrets import UserSecretsClient
from pyngrok import ngrok

ngrok.set_auth_token(UserSecretsClient().get_secret("ngrok_authtoken"))

4. 创建Vizro应用

构建一个标准的Vizro仪表盘应用:

import vizro.plotly.express as px
from vizro import Vizro
import vizro.models as vm

Vizro._reset()  # 重置Vizro状态,便于多次运行

df = px.data.iris()  # 示例数据集

page = vm.Page(
    title="我的第一个仪表盘",
    components=[
        vm.Graph(id="散点图", figure=px.scatter(df, x="sepal_length", y="petal_width", color="species")),
        vm.Graph(id="直方图", figure=px.histogram(df, x="sepal_width", color="species")),
    ],
    controls=[
        vm.Filter(column="species", selector=vm.Dropdown(value=["ALL"])),
    ],
)

dashboard = vm.Dashboard(pages=[page])

5. 启动应用并建立隧道

port = 8050
tunnel = ngrok.connect(port)  # 建立Ngrok隧道

app = Vizro().build(dashboard)
app.run(host="0.0.0.0", port=port, jupyter_server_url=tunnel.public_url, jupyter_mode="tab")

技术原理

Ngrok通过在公网和本地环境之间建立安全的反向代理隧道,解决了Kaggle环境无法直接暴露端口的问题。当用户访问Ngrok提供的公网URL时,请求会被转发到Kaggle容器内部运行的Vizro应用。

注意事项

  1. Ngrok免费账户有并发连接数限制(3个),频繁重启可能导致达到限制
  2. 生成的URL是公开的,敏感数据应考虑额外安全措施
  3. 建议在开发原型阶段使用,生产环境应考虑专业部署方案

替代方案

除了Ngrok外,还可以考虑以下部署方式:

  • 使用Render、Huggingface Spaces等专业PaaS平台
  • 通过Docker容器化应用后部署到云服务
  • 使用专门的Dash/Vizro托管服务

总结

通过Ngrok隧道技术,我们成功解决了Vizro在Kaggle环境中的部署难题。这种方法简单易行,特别适合快速原型开发和协作展示。对于更正式的项目,建议考虑专业的部署方案以获得更好的性能和安全性。

登录后查看全文
热门项目推荐
相关项目推荐