【免费下载】 Apache Superset 配置指南:从基础到高级设置
概述
Apache Superset 是一个现代化的企业级商业智能(BI)工具,它提供了强大的数据可视化和仪表板功能。本文将详细介绍如何配置 Superset,从基础设置到高级定制,帮助您根据实际需求优化 Superset 的运行环境。
基础配置
配置文件概述
Superset 通过 superset_config.py 文件提供数百个可配置参数,这些参数控制着 Superset 的各个方面。与直接修改核心配置文件不同,最佳实践是创建自己的配置文件来覆盖默认设置。
配置文件的加载方式
有两种主要方式让 Superset 加载您的自定义配置:
- 环境变量方式:
export SUPERSET_CONFIG_PATH=/path/to/your/superset_config.py
- Docker 部署方式:
COPY --chown=superset superset_config.py /app/
ENV SUPERSET_CONFIG_PATH /app/superset_config.py
关键配置项详解
安全密钥设置
SECRET_KEY 是 Superset 最重要的配置之一,用于安全地签名会话 cookie 和加密数据库中的敏感信息。必须为生产环境设置一个强密钥。
# 使用 openssl rand -base64 42 生成强密钥
SECRET_KEY = 'your-random-generated-secret-key-here'
如果需要更换密钥,可以添加旧密钥作为 PREVIOUS_SECRET_KEY,然后运行 superset re-encrypt-secrets 命令重新加密现有数据。
元数据数据库配置
Superset 需要一个数据库来存储其管理的元数据(如图表、仪表板定义等)。虽然默认使用 SQLite,但生产环境强烈建议使用更强大的数据库。
支持的数据库引擎
| 数据库类型 | 支持版本 | 连接字符串示例 | 所需驱动包 |
|---|---|---|---|
| PostgreSQL | 10.X-15.X | postgresql://user:pass@host/dbname | pip install psycopg2 |
| MySQL | 5.7, 8.X | mysql://user:pass@host/dbname | pip install mysqlclient |
示例配置:
SQLALCHEMY_DATABASE_URI = 'postgresql://superset:superset@localhost/superset'
生产环境部署建议
WSGI 服务器配置
对于生产环境,推荐使用 Gunicorn 作为 WSGI 服务器,特别是其异步工作模式:
gunicorn \
-w 10 \
-k gevent \
--worker-connections 1000 \
--timeout 120 \
-b 0.0.0.0:8080 \
--limit-request-line 0 \
--limit-request-field_size 0 \
"superset.app:create_app()"
HTTPS 配置
可以通过以下方式实现 HTTPS:
- 在负载均衡器或反向代理(如 Nginx)上终止 SSL/TLS
- 直接在 Gunicorn 中配置 SSL(如果使用官方 Docker 镜像)
负载均衡器配置
当 Superset 运行在负载均衡器后面时:
- 启用健康检查端点
/health - 如果负载均衡器插入
X-Forwarded-For/X-Forwarded-Proto头,设置:
ENABLE_PROXY_FIX = True
高级配置
自定义 OAuth2 集成
Superset 支持通过 Flask-AppBuilder 集成各种 OAuth2 提供程序。以下是自定义 OAuth2 配置示例:
from flask_appbuilder.security.manager import AUTH_OAUTH
AUTH_TYPE = AUTH_OAUTH
OAUTH_PROVIDERS = [
{
'name': 'myOAuth',
'icon': 'fa-cloud',
'remote_app': {
'client_id': 'your-client-id',
'client_secret': 'your-client-secret',
'api_base_url': 'https://oauth.provider/api/',
'access_token_url': 'https://oauth.provider/oauth/token',
'authorize_url': 'https://oauth.provider/oauth/authorize',
'client_kwargs': {'scope': 'read'}
}
}
]
AUTH_USER_REGISTRATION = True
AUTH_USER_REGISTRATION_ROLE = "Gamma"
对于 OpenID Connect 1.0 兼容的提供程序(如 Keycloak),可以使用更简单的配置:
OAUTH_PROVIDERS = [
{
'name': 'keycloak',
'remote_app': {
'client_id': 'your-client-id',
'client_secret': 'your-client-secret',
'server_metadata_url': 'https://keycloak/auth/realms/your-realm/.well-known/openid-configuration'
}
}
]
Keycloak 专用配置
对于 Keycloak 集成,可以使用 Flask-OIDC 替代方案。首先创建自定义安全管理器:
# keycloak_security_manager.py
from flask_appbuilder.security.manager import AUTH_OID
from superset.security import SupersetSecurityManager
from flask_oidc import OpenIDConnect
class OIDCSecurityManager(SupersetSecurityManager):
def __init__(self, appbuilder):
super().__init__(appbuilder)
if self.auth_type == AUTH_OID:
self.oid = OpenIDConnect(self.appbuilder.get_app)
然后在配置中启用:
from keycloak_security_manager import OIDCSecurityManager
CUSTOM_SECURITY_MANAGER = OIDCSecurityManager
AUTH_TYPE = AUTH_OID
性能调优
缓存配置
Superset 支持多种缓存后端,推荐使用 Redis 作为缓存:
from superset.typing import CacheConfig
CACHE_CONFIG: CacheConfig = {
'CACHE_TYPE': 'RedisCache',
'CACHE_DEFAULT_TIMEOUT': 86400,
'CACHE_KEY_PREFIX': 'superset_',
'CACHE_REDIS_URL': 'redis://localhost:6379/0'
}
查询结果限制
调整默认查询行数限制:
ROW_LIMIT = 10000
DEFAULT_SQLLAB_LIMIT = 1000
总结
本文详细介绍了 Apache Superset 的配置方法,从基础的安全设置到高级的 OAuth 集成。正确的配置不仅能确保 Superset 的安全运行,还能优化其性能和用户体验。根据您的具体环境和需求,可以选择性地实施这些配置选项,打造最适合您业务需求的 BI 平台。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0213
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0137
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03