DeepLabCut项目中Transformer追踪方法在GUI中的使用限制分析

2025-06-09 19:00:15作者：宣利权Counsellor

Official implementation of DeepLabCut: Markerless pose estimation of user-defined features with deep learning for all animals incl. humans

项目地址：https://gitcode.com/gh_mirrors/de/DeepLabCut

背景概述

DeepLabCut作为一款开源的动物行为分析工具，在3.0.0rc8版本中引入了基于Transformer的无监督个体追踪功能。这一功能通过深度学习模型实现了对视频中多个动物的自动识别和追踪，无需人工标注个体身份数据。

核心问题

在最新版本的DeepLabCut GUI界面中，用户发现Transformer追踪方法虽然可以在"无监督ID追踪"部分运行，但在"分析视频"部分的下拉菜单中却缺少这一选项。这导致用户无法直接在GUI中完成从追踪到结果分析的全流程。

技术原因

经过项目团队确认，Transformer追踪方法相比传统方法需要额外的处理步骤，包括：

特征三元组提取和训练
轨迹可视化
标记视频生成

这些步骤在当前的GUI设计中尚未完全集成，因此团队建议用户通过编程接口来完成Transformer追踪的完整流程。

推荐解决方案

对于需要使用Transformer追踪方法的用户，建议采用以下三种方式之一：

终端命令行方式：使用deeplabcut.transformer_reID命令进行初始追踪，然后分别使用plot_trajectories和create_labeled_video进行结果可视化和视频生成。
Jupyter Notebook方式：项目提供了专门的示例笔记本，详细展示了Transformer追踪的完整流程，包括参数设置和结果可视化。
自定义脚本方式：用户可以根据项目文档编写自己的Python脚本，灵活控制追踪流程的各个环节。

技术实现细节

Transformer追踪的核心流程包含三个关键阶段：

特征提取阶段：通过预训练的Transformer模型提取视频帧中每个检测目标的特征向量，构建可用于区分不同个体的特征空间。
三元组训练阶段：自动采样大量"锚点-正样本-负样本"三元组，训练一个能够将同一目标的不同实例映射到特征空间相近位置，不同目标映射到远离位置的度量学习模型。
追踪关联阶段：利用学习到的特征表示，在视频序列中关联属于同一目标的检测结果，形成连续轨迹。

最佳实践建议

对于希望使用这一功能的用户，建议：

首先在小规模视频数据上测试流程，验证参数设置
关注特征提取的质量，必要时调整模型参数
结果可视化阶段检查轨迹连续性，评估追踪效果
考虑计算资源需求，Transformer方法通常需要更强的GPU支持

未来展望

随着DeepLabCut项目的持续发展，预计未来版本将会在GUI中更完整地集成Transformer追踪方法，提供更友好的用户界面和更流畅的工作流程。在此之前，通过编程接口使用这一先进功能仍然是推荐的做法。

Official implementation of DeepLabCut: Markerless pose estimation of user-defined features with deep learning for all animals incl. humans

项目地址：https://gitcode.com/gh_mirrors/de/DeepLabCut

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。