DXcam 项目使用教程

2024-09-14 11:34:55作者：殷蕙予

1. 项目介绍

DXcam 是一个基于 Python 的高性能屏幕捕捉库，专为 Windows 系统设计，使用 Desktop Duplication API 实现。它能够以超过 240Hz 的频率进行屏幕捕捉，适用于需要高帧率捕捉的场景，如深度学习管道中的 FPS 游戏分析。与现有的 Python 解决方案（如 python-mss 和 D3DShot）相比，DXcam 提供了更快的捕捉速度、对 Direct3D 独占全屏应用的无干扰捕捉、自动处理缩放/拉伸分辨率、以及在捕捉模式下精确的 FPS 目标设定。

2. 项目快速启动

安装

从 PyPI 安装 DXcam：

pip install dxcam

如果需要同时安装 OpenCV（DXcam 依赖 OpenCV 进行颜色空间转换），可以使用以下命令：

pip install dxcam[cv2]

基本使用

以下是一个简单的示例，展示如何使用 DXcam 进行屏幕截图：

import dxcam

# 创建一个 DXCamera 实例
camera = dxcam.create()

# 进行屏幕截图
frame = camera.grab()

# 显示截图
from PIL import Image
Image.fromarray(frame).show()

区域截图

如果你想捕捉屏幕的特定区域，可以使用 region 参数：

left, top = (1920 - 640) // 2, (1080 - 640) // 2
right, bottom = left + 640, top + 640
region = (left, top, right, bottom)

frame = camera.grab(region=region)

屏幕捕捉

启动屏幕捕捉并获取最新帧：

camera.start(region=(left, top, right, bottom))

for i in range(1000):
    image = camera.get_latest_frame()

camera.stop()

3. 应用案例和最佳实践

深度学习中的屏幕捕捉

DXcam 特别适用于需要高帧率屏幕捕捉的深度学习应用，如 FPS 游戏中的实时分析。以下是一个简单的示例，展示如何将捕捉到的帧用于深度学习模型的输入：

import dxcam
import torch

camera = dxcam.create()
camera.start()

model = torch.load('your_model.pth')

for i in range(1000):
    frame = camera.get_latest_frame()
    if frame is not None:
        # 预处理帧
        input_tensor = preprocess(frame)
        # 模型推理
        output = model(input_tensor)
        # 处理输出
        process_output(output)

camera.stop()

视频录制

DXcam 还可以用于视频录制，特别是在需要高帧率录制的场景中：

import dxcam
import cv2

target_fps = 120
camera = dxcam.create(output_idx=0, output_color="BGR")
camera.start(target_fps=target_fps, video_mode=True)

writer = cv2.VideoWriter(
    "video.mp4", cv2.VideoWriter_fourcc(*"mp4v"), target_fps, (1920, 1080)
)

for i in range(600):
    writer.write(camera.get_latest_frame())

camera.stop()
writer.release()