Vanna 2.0：用自然语言查询数据库的革新性突破

2026-04-02 09:21:53作者：舒璇辛Bertina

Vanna 2.0 是一个开源 Python RAG 框架，专为将自然语言问题转换为准确 SQL 查询而设计。无论是数据分析师、开发者还是企业用户，都能通过它以最直观的方式与数据库交互，无需编写复杂 SQL 语句。

核心价值：重新定义数据库交互体验 🚀

用户感知权限控制：智能门禁系统般的安全防护 🔒

Vanna 2.0 最引人注目的革新是其用户感知权限控制系统。这就像一个智能门禁系统，能够自动识别用户身份，并根据用户所属的权限组对查询结果进行精准过滤。不同用户访问同一数据库时，会自动看到符合其权限的数据，无需手动配置复杂的权限规则。

图：Vanna 2.0 架构展示了用户感知权限控制在整个系统中的核心位置

企业级安全特性：全方位守护数据安全 🛡️

Vanna 2.0 专为生产环境打造，提供了完整的企业安全功能：

行级安全：查询结果根据用户权限自动过滤，确保敏感数据只对授权用户可见
审计日志：每个用户的每次查询都被完整记录，满足合规性要求
速率限制：通过生命周期钩子实现按用户配额控制，防止滥用

最佳实践：在企业部署中，建议同时启用行级安全和审计日志功能，确保数据访问的可追溯性和安全性。

现代化 Web 界面：即插即用的聊天组件 💬

项目内置了精美的 <vanna-chat> 组件，可以直接嵌入到任何现有网页中。这个组件支持实时数据流、交互式表格和图表展示，让你的应用瞬间拥有专业级的聊天界面。

场景化应用：解决实际业务难题 🌐

多租户 SaaS 应用：如何解决数据隔离难题？

在多租户环境中，不同客户的数据必须严格隔离。Vanna 2.0 的用户感知权限控制完美解决了这一挑战：

from vanna.core.user import UserResolver

class MultiTenantResolver(UserResolver):
    async def resolve_user(self, request_context):
        # 从请求头获取租户ID
        tenant_id = request_context.get_header('X-Tenant-ID')
        # 从JWT获取用户信息
        user_info = self._decode_jwt(request_context.get_header('Authorization'))
        
        return User(
            id=user_info['sub'],
            email=user_info['email'],
            group_memberships=[f"tenant:{tenant_id}", user_info['role']]
        )

💡 关键提示：在多租户场景中，确保将租户ID作为用户组的一部分，这样可以在SQL生成时自动添加租户过滤条件。

数据分析平台：非技术人员如何自助式取数？

传统数据分析流程中，业务人员需要向数据分析师提需求，等待数天才能获得结果。Vanna 2.0 改变了这一现状：

图：展示了传统数据分析流程与使用Vanna的高效流程对比

业务用户只需用自然语言提问，如"显示上个季度各产品类别的销售额"，Vanna就能自动生成SQL、执行查询并返回可视化结果，整个过程在几秒内完成。

企业内部系统：如何实现精细化权限管理？

大型企业往往需要复杂的权限控制，如HR部门只能查看本部门员工数据，管理层可以查看汇总数据但不能查看明细。Vanna 2.0 的工具权限系统可以轻松实现这一点：

from vanna.tools import RunSqlTool
from vanna.integrations.postgres import PostgresRunner

class HRRunSqlTool(RunSqlTool):
    @property
    def access_groups(self):
        return ["hr", "management"]
    
    async def execute(self, context, args):
        # HR用户只能查询HR相关表
        if "hr" in context.user.group_memberships and "management" not in context.user.group_memberships:
            args["sql"] = self._add_hr_filter(args["sql"], context.user.department)
        
        return await super().execute(context, args)

技术实现：深入了解Vanna 2.0的工作原理 🔍

自然语言转SQL的幕后流程：从问题到结果的旅程

Vanna 2.0采用了先进的RAG（检索增强生成）技术，将自然语言问题转换为准确的SQL查询。其核心流程如下：

图：展示了Vanna将自然语言转换为SQL的完整框架

问题理解：分析用户的自然语言问题，提取关键信息
检索相关信息：从知识库中检索与问题相关的表结构、字段信息和示例SQL
SQL生成：结合检索到的信息，生成初步SQL查询
权限过滤：根据用户权限对SQL进行调整，添加必要的过滤条件
执行与结果处理：执行SQL并将结果转换为自然语言回答和可视化图表

模块化架构：灵活扩展的秘密

Vanna 2.0采用模块化设计，主要包含以下核心组件：

LLM服务：负责自然语言理解和SQL生成
工具系统：提供执行SQL、可视化等功能
用户解析器：处理用户身份和权限
存储系统：管理知识库和用户数据

这种架构使得Vanna可以轻松集成不同的LLM提供商、数据库类型和认证系统。

动态系统提示：个性化AI助手的秘诀

Vanna 2.0会根据用户身份动态调整系统提示，确保AI生成的SQL符合用户的权限和需求：

from vanna.core.system_prompt import SystemPromptProvider

class DynamicPromptProvider(SystemPromptProvider):
    async def get_prompt(self, context):
        base_prompt = "You are a SQL expert. Generate valid SQL for the user's question."
        
        # 根据用户角色调整提示
        if "management" in context.user.group_memberships:
            return base_prompt + " Include summary statistics and trends."
        elif "hr" in context.user.group_memberships:
            return base_prompt + " Only include data from the user's department."
        
        return base_prompt

核心概念回顾：Vanna 2.0通过动态系统提示、用户感知权限控制和模块化架构，实现了安全、灵活且高效的自然语言到SQL转换。

扩展指南：从零开始构建你的智能查询系统 🛠️

环境准备：快速搭建开发环境

首先，克隆Vanna仓库并安装所需依赖：

git clone https://gitcode.com/GitHub_Trending/va/vanna
cd vanna
pip install -e .

接下来，安装你选择的LLM提供商依赖，例如OpenAI：

pip install vanna[openai]

💡 关键提示：建议使用虚拟环境来隔离项目依赖，避免版本冲突。

基础操作：连接数据库并开始查询

以下是一个连接到PostgreSQL数据库的基本示例：

import vanna
from vanna import Agent
from vanna.tools import RunSqlTool
from vanna.integrations.postgres import PostgresRunner
from vanna.integrations.openai import OpenAILlmService

# 初始化LLM服务
llm = OpenAILlmService(api_key="your-api-key")

# 初始化数据库连接
sql_runner = PostgresRunner(
    host="localhost",
    port=5432,
    database="mydb",
    user="myuser",
    password="mypassword"
)

# 注册工具
tools = vanna.core.registry.ToolRegistry()
tools.register(RunSqlTool(sql_runner=sql_runner))

# 创建代理
agent = Agent(
    llm_service=llm,
    tool_registry=tools
)

# 开始提问
result = await agent.ask("显示过去30天的销售额")
print(result)

常见问题诊断：解决你可能遇到的问题

问题1：生成的SQL包含语法错误

解决方案：

确保数据库模式已正确加载
提供更多示例SQL以帮助模型学习
启用SQL验证工具，自动检测并修正语法错误

from vanna.core.enhancer import SqlValidationEnhancer

agent.add_enhancer(SqlValidationEnhancer(sql_runner=sql_runner))

问题2：查询结果超出用户权限

解决方案：

检查用户解析器是否正确返回用户组
确保工具的access_groups属性正确设置
添加SQL过滤中间件，确保敏感数据被过滤

问题3：LLM响应时间过长

解决方案：

启用查询缓存，避免重复生成相同SQL
降低LLM模型复杂度或调整温度参数
实现异步处理，提高并发性能

核心概念回顾：Vanna 2.0的扩展性设计允许你轻松解决常见问题，通过增强器、中间件和缓存机制优化性能和安全性。

通过本文，你已经了解了Vanna 2.0如何通过革新性的用户感知权限控制、灵活的模块化架构和强大的自然语言处理能力，重新定义数据库交互体验。无论你是构建企业级应用还是个人项目，Vanna 2.0都能帮助你实现安全、高效的自然语言数据库查询。

vanna

🤖 Chat with your SQL database 📊. Accurate Text-to-SQL Generation via LLMs using Agentic Retrieval 🔄.

项目地址：https://gitcode.com/GitHub_Trending/va/vanna

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

454

436

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Vanna 2.0：用自然语言查询数据库的革新性突破

核心价值：重新定义数据库交互体验 🚀

用户感知权限控制：智能门禁系统般的安全防护 🔒

企业级安全特性：全方位守护数据安全 🛡️

现代化 Web 界面：即插即用的聊天组件 💬

场景化应用：解决实际业务难题 🌐

多租户 SaaS 应用：如何解决数据隔离难题？

数据分析平台：非技术人员如何自助式取数？

企业内部系统：如何实现精细化权限管理？

技术实现：深入了解Vanna 2.0的工作原理 🔍

自然语言转SQL的幕后流程：从问题到结果的旅程

模块化架构：灵活扩展的秘密

动态系统提示：个性化AI助手的秘诀

扩展指南：从零开始构建你的智能查询系统 🛠️

环境准备：快速搭建开发环境

基础操作：连接数据库并开始查询

常见问题诊断：解决你可能遇到的问题

问题1：生成的SQL包含语法错误

问题2：查询结果超出用户权限

问题3：LLM响应时间过长

热门内容推荐

最新内容推荐

项目优选

Vanna 2.0：用自然语言查询数据库的革新性突破

核心价值：重新定义数据库交互体验 🚀

用户感知权限控制：智能门禁系统般的安全防护 🔒

企业级安全特性：全方位守护数据安全 🛡️

现代化 Web 界面：即插即用的聊天组件 💬

场景化应用：解决实际业务难题 🌐

多租户 SaaS 应用：如何解决数据隔离难题？

数据分析平台：非技术人员如何自助式取数？

企业内部系统：如何实现精细化权限管理？

技术实现：深入了解Vanna 2.0的工作原理 🔍

自然语言转SQL的幕后流程：从问题到结果的旅程

模块化架构：灵活扩展的秘密

动态系统提示：个性化AI助手的秘诀

扩展指南：从零开始构建你的智能查询系统 🛠️

环境准备：快速搭建开发环境

基础操作：连接数据库并开始查询

常见问题诊断：解决你可能遇到的问题

问题1：生成的SQL包含语法错误

问题2：查询结果超出用户权限

问题3：LLM响应时间过长

相关内容推荐

热门内容推荐

最新内容推荐

项目优选