STT语音识别项目中同名音频文件缓存问题的分析与解决

2025-06-24 06:13:35作者：裴锟轩Denise

问题现象

在STT语音识别项目中，开发者遇到了一个奇怪的现象：当用户多次上传同名录音文件进行语音识别时，系统始终返回第一次识别结果，即使后续上传的音频内容已经发生变化。具体表现为：

用户首次上传"recording.mp3"（内容为"朝辞白帝彩云间"），系统正确识别为"招子白地参运见"
后续上传同名文件但内容不同，系统仍然返回第一次的识别结果
只有在删除临时目录中的.wav文件后，才能获取新的识别结果

问题根源分析

经过深入排查，发现问题的核心在于系统的缓存机制：

文件处理流程：系统在上传音频文件后，会在临时目录中生成.wav和.mp3两种格式的副本
缓存机制：语音识别模块可能基于文件名建立了缓存机制，当检测到相同文件名时，直接返回缓存结果而不重新处理
文件残留：临时目录中的.wav文件未被自动清理，导致系统误认为文件未变化

技术解决方案

针对这一问题，我们设计了两种可行的解决方案：

方案一：装饰器自动清理

通过Python装饰器在每次API调用前自动清理临时目录中的.wav文件：

def init_delete_wav_files(func):
    '''装饰器，先删除TMP_DIR所有的.wav文件'''
    def delete_wav_files(*args, directory=cfg.TMP_DIR, **kargs):
        try:
            for filename in os.listdir(directory):
                if filename.endswith(".wav"):
                    file_path = os.path.join(directory, filename)
                    os.remove(file_path)
        except Exception as e:
            print(f"清理文件时出错: {e}")
        return func(*args, **kargs)
    return delete_wav_files

@app.route('/api',methods=['GET','POST'])
@init_delete_wav_files
def api():
    # API处理逻辑

方案二：唯一文件名策略

另一种更优雅的解决方案是采用唯一文件名策略：

import uuid

def generate_unique_filename(original_name):
    ext = os.path.splitext(original_name)[1]
    return f"{uuid.uuid4()}{ext}"

@app.route('/upload', methods=['POST'])
def upload_file():
    file = request.files['file']
    if file:
        unique_name = generate_unique_filename(file.filename)
        file_path = os.path.join(app.config['UPLOAD_FOLDER'], unique_name)
        file.save(file_path)
        # 后续处理

方案对比

方案	优点	缺点
装饰器清理	实现简单，改动小	需要额外I/O操作，可能影响性能
唯一文件名	彻底解决问题，性能更好	需要修改文件处理逻辑