Llama Index项目中实现用户级SQL查询权限控制的技术方案

2025-05-02 11:18:36作者：幸俭卉

在数据库应用开发中，确保用户只能访问其权限范围内的数据是一项基本安全要求。本文将以Llama Index项目中的NLSQLTableQueryEngine为例，探讨如何实现对AI生成SQL查询的权限控制。

核心挑战

当使用自然语言转SQL(NLSQL)功能时，系统会根据用户输入的自然语言自动生成SQL查询语句。这一过程存在两个关键问题：

生成的SQL可能缺少必要的权限过滤条件
直接依赖AI模型添加权限控制存在安全隐患

解决方案比较

方案一：查询后过滤

在SQL执行后对结果集进行过滤，这种方法简单但效率低下，特别是当数据量大时。

方案二：SQL语句预处理

更优的解决方案是在SQL执行前修改查询语句，直接添加权限过滤条件。这需要：

拦截生成的SQL语句
解析并修改SQL
确保修改后的SQL语法正确

技术实现细节

Llama Index项目提供了Workflow机制，非常适合实现这种控制逻辑。以下是典型实现步骤：

SQL生成阶段：使用NLSQL功能将自然语言转换为SQL
SQL修改阶段：通过正则表达式或SQL解析器添加权限条件
安全验证阶段：检查SQL类型(仅允许SELECT)
结果限制阶段：添加分页或结果数量限制
响应生成阶段：根据结果数量决定是否调用大模型解释结果

代码实现示例

class SecureSQLWorkflow(Workflow):
    def __init__(self, sql_retriever, llm, user_id, engine):
        self.sql_retriever = sql_retriever
        self.llm = llm
        self.user_id = user_id
        self.engine = engine

    @step
    def generate_sql(self, ctx, ev):
        result = self.sql_retriever.retrieve(ev.query)
        return SQLGeneratedEvent(sql=result[0].text, query=ev.query)

    @step
    def execute_query(self, ctx, ev):
        if not ev.sql.startswith("SELECT "):
            raise Exception("仅支持查询操作")
        
        secure_sql = f"{ev.sql} WHERE user_id = {self.user_id}"
        count_sql = f"SELECT COUNT(*) FROM ({secure_sql}) AS subquery"
        
        # 执行查询和结果处理逻辑
        ...