使用ffmpeg-python实现MP4到多质量HLS转换的技术方案

2025-05-22 10:55:33作者：柏廷章Berta

概述

在视频处理领域，将MP4格式转换为HLS（HTTP Live Streaming）格式是一项常见需求，特别是需要支持多种分辨率和码率自适应的情况。本文将详细介绍如何使用ffmpeg-python库实现这一转换过程。

HLS转换的基本原理

HLS是苹果公司开发的基于HTTP的自适应比特率流媒体协议。它将视频流分割成一系列小的基于HTTP的文件，每个文件包含很短时间的视频片段。多质量HLS转换的核心在于：

将原始视频转码为多个不同分辨率和码率的版本
生成对应的TS分片文件
创建主播放列表(m3u8)和各个质量级别的子播放列表

ffmpeg-python实现方案

以下是使用ffmpeg-python实现MP4到多质量HLS转换的完整代码示例：

import ffmpeg

input_file = 'test.mp4'
output_dir = '/tmp/downloaded-videos/'
output_prefix = 'test_video_hls'

# 创建输入流
input_stream = ffmpeg.input(input_file)

# 定义视频流分割和缩放
video_streams = input_stream.video.split(4)
scaled_streams = [
    video_streams[0].filter('scale', w=1920, h=1080, force_original_aspect_ratio='increase'),
    video_streams[1].filter('scale', w=1280, h=720, force_original_aspect_ratio='increase'),
    video_streams[2].filter('scale', w=854, h=480, force_original_aspect_ratio='increase'),
    video_streams[3].filter('scale', w=640, h=360, force_original_aspect_ratio='increase')
]

# 定义音频流分割
audio_streams = input_stream.audio.split(4)

# 配置输出参数
output_args = {
    'format': 'hls',
    'master_pl_name': f'{output_prefix}.m3u8',
    'var_stream_map': 'v:0,a:0,name:1080p v:1,a:1,name:720p v:2,a:2,name:480p v:3,a:3,name:360p',
    'profile:v': 'main',
    'crf': 20,
    'sc_threshold': 0,
    'g': 48,
    'keyint_min': 48,
    'hls_time': 2,
    'hls_playlist_type': 'vod',
    'hls_flags': 'independent_segments',
    'hls_segment_filename': f'{output_dir}{output_prefix}_%v_%03d.ts',
    'c:a': 'aac',
    'ac': 2,
    'ar': 48000
}

# 添加各个质量级别的流配置
output = ffmpeg.output(
    scaled_streams[0], audio_streams[0],
    scaled_streams[1], audio_streams[1],
    scaled_streams[2], audio_streams[2],
    scaled_streams[3], audio_streams[3],
    f'{output_dir}{output_prefix}_%v.m3u8',
    **output_args
)

# 设置各个质量级别的码率参数
output = output.global_args(
    '-b:v:0', '5000k', '-maxrate:v:0', '5350k', '-bufsize:v:0', '7500k', '-b:a:0', '192k',
    '-b:v:1', '2800k', '-maxrate:v:1', '2996k', '-bufsize:v:1', '4200k', '-b:a:1', '128k',
    '-b:v:2', '1400k', '-maxrate:v:2', '1498k', '-bufsize:v:2', '2100k', '-b:a:2', '128k',
    '-b:v:3', '800k', '-maxrate:v:3', '856k', '-bufsize:v:3', '1200k', '-b:a:3', '96k'
)

# 执行转换
output.run()

关键参数解析

视频缩放处理：
- 使用split将视频流分成4个相同的流
- 使用scale滤镜分别缩放到1080p、720p、480p和360p
- force_original_aspect_ratio=increase确保保持原始宽高比
音频处理：
- 使用split将音频流分成4个相同的流
- 最终输出为AAC编码，双声道，48kHz采样率
码率控制：
- 为每个质量级别分别设置视频和音频的目标码率、最大码率和缓冲区大小
- 例如1080p设置为5000kbps视频码率和192kbps音频码率
HLS参数：
- hls_time 2表示每个TS分片约2秒
- hls_playlist_type vod表示点播视频
- hls_flags independent_segments确保每个分片可以独立解码