在Supervision项目中扩展MediaPipe FaceMesh的关键点支持

2025-05-07 23:24:34作者：庞眉杨Will

Supervision项目正在扩展其关键点检测功能，以支持Google MediaPipe的FaceMesh面部网格检测。这一增强将使开发者能够更方便地在计算机视觉应用中集成面部特征点检测功能。

功能概述

MediaPipe FaceMesh提供了两种面部网格检测模式：

基础模式：检测468个面部特征点
增强模式（启用refine_landmarks选项）：检测478个特征点，包含额外的虹膜特征点

Supervision项目计划通过from_mediapipe方法支持这两种模式的面部特征点检测，为开发者提供更灵活的面部分析工具。

技术实现细节

骨架枚举扩展

项目将在Skeleton枚举中新增两种面部网格配置：

FACEMESH_TESSELATION_NO_IRIS：对应468个基础特征点
FACEMESH_TESSELATION：对应478个完整特征点（包含虹膜）

这种设计允许开发者根据实际需求选择使用基础或增强版本的面部网格。枚举值的实现采用了组合模式，增强版本可以通过组合基础版本和虹膜特征点来构建，减少代码冗余。

关键点转换功能

from_mediapipe方法将支持处理两种MediaPipe FaceMesh输出格式：

传统API的输出格式
现代任务API的输出格式

方法内部会自动识别输入数据的格式，并将其转换为Supervision的标准关键点表示形式。这种设计确保了向后兼容性，同时支持最新的MediaPipe接口。

应用场景

这一功能的增强将使得以下应用场景更加便捷：

面部表情分析
虚拟化妆和滤镜应用
面部特征跟踪
生物识别认证系统

开发者可以轻松地将MediaPipe的面部检测结果集成到自己的计算机视觉流程中，利用Supervision提供的丰富可视化工具进行进一步分析和展示。

实现考虑

在实现过程中，团队特别关注了以下技术细节：

内存效率：通过合理的枚举设计减少内存占用
兼容性：支持新旧两种MediaPipe API格式
可扩展性：为未来可能的面部网格更新预留了接口

这一功能的加入将进一步丰富Supervision项目的关键点检测能力，为计算机视觉开发者提供更全面的工具集。

supervision

项目地址：https://gitcode.com/GitHub_Trending/su/supervision

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781