Snakemake中Python 3.12 f-string解析问题的分析与解决

2025-07-01 01:25:45作者：裴麒琰

问题背景

Snakemake是一个流行的生物信息学工作流管理系统，它使用Python语法来定义工作流规则。近期，在Snakemake 8.4.0及以上版本中，用户报告了一个与Python 3.12 f-string解析相关的语法错误问题。

问题现象

当用户在Snakemake规则中使用包含if-else条件表达式的f-string时，系统会抛出语法错误。例如以下代码：

params:
    out_tmp = f"{output_dir}{{fastq}}/ASSEMBLERS/SMARTDENOVO/ASSEMBLER/SMART.{'zmo' if 'zmo' in config['params']['SMARTDENOVO']['OPTIONS'] else 'dmo'}.cns"

在Python 3.12环境中直接运行这段代码是正常的，但在Snakemake中会报错："expected 'else' after 'if' expression"。

问题根源

经过深入分析，发现问题出在Snakemake的parse_fstring方法中。该方法在处理f-string时移除了所有空格，导致条件表达式变得无法解析。例如：

原始代码：

f"/path/file/{'zmo' if 'fstring' in string_test else 'dmo'}.txt"

被错误处理为：

f"/path/file/{'zmo'if'fstring'instring_testelse'dmo'}.txt"

这种处理方式在Python 3.12之前可能还能工作，但由于Python 3.12对f-string解析机制的重大改进（参见PEP 701），这种空格移除行为导致了语法错误。

解决方案

针对这个问题，可以采取以下几种解决方案：

1. 修改parse_fstring方法

核心修复方案是修改Snakemake的parse_fstring方法，保留必要的空格：

def parse_fstring(self, token: tokenize.TokenInfo):
    isin_fstring = 1
    t = token.string
    for t1 in self.snakefile:
        if t1.type == tokenize.FSTRING_START:
            isin_fstring += 1
            t += t1.string
        elif t1.type == tokenize.FSTRING_END:
            isin_fstring -= 1
            t += t1.string
        elif t1.type == tokenize.FSTRING_MIDDLE:
            t += t1.string.replace("{", "{{").replace("}", "}}")
        elif t1.type == tokenize.OP and t1.string == "{":
            t += t1.string
        else:
            t += " "+t1.string  # 保留空格
        if isin_fstring == 0:
            break
    if hasattr(self, "cmd") and self.cmd[-1][1] == token:
        self.cmd[-1] = t, token
    return t

2. 使用替代编码风格

在等待官方修复的同时，可以采用更易读的编码风格：

params:
    out_tmp = (
        f"{output_dir}{{fastq}}/ASSEMBLERS/SMARTDENOVO/ASSEMBLER/SMART."
        + ("zmo" if "zmo" in config["params"]["SMARTDENOVO"]["OPTIONS"] else "dmo")
        + ".cns"
    )