BK-CI项目中T_PIPELINE_WEBHOOK表PROJECT_NAME字段异常问题分析与修复

2025-07-01 22:32:16作者：傅爽业Veleda

在持续集成平台BK-CI的开发过程中，我们发现了一个关于代码仓库与流水线绑定关系的数据库表设计问题。这个问题主要影响代码仓库Webhook触发流水线时的匹配效率，需要从技术层面进行深入分析和修复。

问题背景

BK-CI系统使用T_PIPELINE_WEBHOOK表来存储代码仓库与流水线之间的绑定关系。该表包含三个关键字段：PROJECT_NAME（项目名称）、PROJECT_ID（项目ID）和PIPELINE_ID（流水线ID）。原始设计中，PROJECT_NAME字段的处理存在一个特殊逻辑：当仓库名包含三层路径（如a/b/c）时，系统会自动截取中间部分（b）作为项目名称。

这种设计最初是为了适配工蜂SVN仓库的特殊命名规则，但在实际应用中，特别是对于Git代码库，这种处理方式会导致以下问题：

当Git仓库名也为三层结构时，系统会错误地截取中间部分
查询关联流水线时会匹配到大量无效记录
流水线触发时的匹配效率显著降低

技术分析

问题的核心在于项目名称处理函数getProjectName的实现过于简单，没有考虑不同版本控制系统的差异。原始代码如下：

fun getProjectName(projectName: String): String {
    // 如果项目名是三层的，比如a/b/c，那对应的rep_name是b
    val repoSplit = projectName.split("/")
    if (repoSplit.size != 3) {
        return projectName
    }
    return repoSplit[1].trim()
}

这种实现存在两个主要缺陷：

缺乏版本控制系统区分：没有根据仓库类型（SVN/Git）采用不同的处理逻辑
数据污染风险：错误的截取逻辑可能导致数据库中存储了不完整的项目名称

解决方案

针对这个问题，我们设计了多层次的修复方案：

1. 代码逻辑优化

首先修改getProjectName函数，增加对仓库类型的判断：

fun getProjectName(projectName: String, repoType: RepoType): String {
    return when(repoType) {
        RepoType.SVN -> {
            val repoSplit = projectName.split("/")
            if (repoSplit.size == 3) repoSplit[1].trim() else projectName
        }
        else -> projectName // Git等其他类型直接使用完整名称
    }
}