图像去重工具imagededup安装与配置指南

2026-01-25 04:06:45作者：秋泉律Samson

1. 项目基础介绍和主要编程语言

imagededup是一个用于在图像集合中查找重复和近似重复图像的Python包。该项目的主要目标是简化图像去重的任务，提供了多种算法来识别重复图像，包括卷积神经网络（CNN）和多种哈希算法（如感知哈希、差异哈希、小波哈希和平均哈希）。

imagededup主要使用Python语言开发，适合Python 3.8及以上版本。

2. 项目使用的关键技术和框架

imagededup项目中使用的关键技术和框架包括：

卷积神经网络（CNN）：用于识别近似重复图像，支持多种预打包模型和自定义模型。
哈希算法：包括感知哈希（PHash）、差异哈希（DHash）、小波哈希（WHash）和平均哈希（AHash），用于快速查找重复图像。
PyTorch：用于CNN模型的训练和推理。
Cython：用于优化性能，特别是在哈希算法的实现中。

3. 项目安装和配置的准备工作和详细安装步骤

准备工作

在安装imagededup之前，请确保您的系统满足以下要求：

Python 3.8及以上版本：imagededup需要Python 3.8或更高版本。
Cython：imagededup依赖于Cython进行性能优化，因此需要安装Cython。
PyTorch：如果您计划使用CNN模型，需要安装PyTorch。

安装步骤

方法一：通过PyPI安装（推荐）

打开终端或命令提示符。
运行以下命令安装imagededup：
```
pip install imagededup
```

方法二：通过GitHub源码安装

打开终端或命令提示符。

克隆imagededup的GitHub仓库：

git clone https://github.com/idealo/imagededup.git

进入项目目录：
```
cd imagededup
```
安装Cython（如果尚未安装）：
```
pip install "cython>=0.29"
```
运行安装脚本：
```
python setup.py install
```

配置步骤

安装完成后，您可以开始使用imagededup进行图像去重。以下是一个简单的示例，展示如何使用感知哈希（PHash）方法查找重复图像：

导入所需的模块：
```
from imagededup.methods import PHash
```
创建PHash对象：
```
phasher = PHash()
```

生成图像目录中所有图像的编码：

encodings = phasher.encode_images(image_dir='path/to/image/directory')

查找重复图像：

duplicates = phasher.find_duplicates(encoding_map=encodings)

绘制找到的重复图像（可选）：

from imagededup.utils import plot_duplicates
plot_duplicates(image_dir='path/to/image/directory', duplicate_map=duplicates, filename='ukbench00120.jpg')

通过以上步骤，您可以成功安装并配置imagededup，开始进行图像去重任务。

imagededup

😎 Finding duplicate images made easy!

项目地址：https://gitcode.com/gh_mirrors/im/imagededup

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271