MediaPipe项目中获取FaceMesh关键点数据的C++实现方法

2025-05-05 02:50:42作者：凤尚柏Louis

前言

MediaPipe是Google开源的一个跨平台多媒体处理框架，其中FaceMesh是其提供的一个面部关键点检测解决方案。本文将详细介绍如何在C++环境下使用MediaPipe获取FaceMesh的面部关键点数据(NormalizedLandmarkList)。

关键点数据结构

MediaPipe中的面部关键点使用NormalizedLandmarkList数据结构表示，这是一个包含多个NormalizedLandmark的列表。每个NormalizedLandmark包含x、y、z三个坐标值，这些值都是归一化后的结果，范围在[0,1]之间。

实现步骤

1. 环境准备

首先需要确保已经正确编译安装了MediaPipe的C++版本。在Ubuntu 20.04系统上，需要安装必要的依赖项并配置好Bazel构建系统。

2. 头文件引入

要使用关键点相关功能，需要包含以下头文件：

#include "mediapipe/framework/formats/landmark.pb.h"
#include "mediapipe/calculators/util/landmarks_to_render_data_calculator.pb.h"

3. 配置计算图

创建一个MediaPipe计算图配置文件，指定输入输出流。关键点数据通常通过"multi_face_landmarks"输出流获取。

4. 关键点数据获取

在代码实现中，主要分为以下几个部分：

初始化输出流监听器：

MP_ASSIGN_OR_RETURN(mediapipe::OutputStreamPoller poller_detection,
                   graph.AddOutputStreamPoller("multi_face_landmarks"));

处理视频帧：

// 捕获视频帧并转换为MediaPipe格式
auto input_frame = absl::make_unique<mediapipe::ImageFrame>(
    mediapipe::ImageFormat::SRGB, camera_frame.cols, camera_frame.rows,
    mediapipe::ImageFrame::kDefaultAlignmentBoundary);

获取关键点数据：

mediapipe::Packet detection_packet;
if (!poller_detection.Next(&detection_packet)) break;

const auto& landmarks = packet.Get<mediapipe::NormalizedLandmarkList>();

遍历关键点：

for (int i = 0; i < landmarks.landmark_size(); ++i) {
    const auto& landmark = landmarks.landmark(i);
    std::cout << "Landmark " << i << ": (" 
              << landmark.x() << ", " 
              << landmark.y() << ", " 
              << landmark.z() << ")" << std::endl;
}