Av1an视频编码工具中的探针速度优化方案探讨

2025-07-10 05:36:14作者：董灵辛Dennis

背景介绍

Av1an是一款流行的视频编码工具，它采用分块编码技术来提高编码效率。在目标质量(Target Quality)模式下，Av1an会先使用探针(probe)对视频片段进行快速编码分析，以确定最佳的质量参数。目前，这些探针编码默认使用编码器提供的最快预设值，这在某些情况下可能导致探针结果不够准确。

当使用最快的编码预设进行探针时，可能会产生块状伪影(blocking artifacts)，影响视频质量评估的准确性。虽然Av1an提供了--probe-slow选项让探针继承用户提供的视频参数，但这些参数可能过于耗时，特别是当只需要比最快设置稍慢一点的探针就能获得足够准确结果时。

为解决这一问题，开发者提出了两种可选方案：

探针速度选项(--probe-speed)
提供五个级别：veryslow、slow、medium、fast、veryfast，默认值为veryfast，保持现有行为。此方案需要将现有的--probe-slow选项重命名为更准确的--probe-custom。
探针质量选项(--probe-quality)
同样提供五个级别：verylow、low、medium、high、veryhigh，默认值为verylow，对应现有行为。

在技术实现上，这个功能将通过修改编码器命令构造函数来实现。以AOM编码器为例，修改后的代码会在构造探针命令时注入速度参数，类似于现有实现中注入量化参数的方式。

对于使用数值表示速度的编码器(如AOM使用0-11)，会将用户选择的0-4级别映射到相应范围。对于使用字符串表示的编码器，则使用简单的匹配逻辑。

在讨论过程中，有开发者提出了一些技术考量：

编码器特性差异
不同编码器的预设参数在不同级别下可能有不同的行为表现，某些功能可能只在特定预设下激活。这需要仔细处理以确保探针结果的准确性。
质量评估相关性
有观点认为，恒定质量(CRF)到质量评分(如VMAF)的映射在不同速度预设下可能不一致，这会影响探针的准确性。目前Av1an使用1%低分作为评估标准，这也有其局限性。
用户体验优化
当前--probe-slow选项名称不够准确，因为它实际上是让探针继承用户自定义参数，而非简单地"慢速"探针。更准确的命名有助于用户理解其功能。