首页
/ PSFR-GAN使用指南

PSFR-GAN使用指南

2024-10-10 13:25:01作者:鲍丁臣Ursa

1. 目录结构及介绍

├── align_and_crop_dir.py        # 脸部对齐与裁剪脚本
├── data                         # 数据存放目录(需自行下载并放置)
│   ├── FFHQ                     # FFHQ数据集路径
│   └── ...
├── generate_mask.py             # 生成遮罩图的脚本
├── models                       # 模型相关代码
├── options                      # 配置选项模块
├── requirements.txt             # 项目所需Python包列表
├── test_dir                     # 测试图像目录示例
├── test_dir_align_results       # 对齐后脸部图片保存目录(测试步骤产生)
├── test_dir_enhance_results     # 增强处理结果保存目录(测试步骤产生)
├── test_enhance_dir_align.py    # 批量测试对齐图像增强脚本
├── test_enhance_dir_unalign.py  # 测试未对齐图像批量增强并粘贴回原图脚本
├── test_enhance_single_unalign.py  # 单张未对齐图像增强脚本
├── train.py                     # 训练主脚本
├── utils                        # 辅助工具函数
├── README.md                    # 项目说明文档
├── LICENSE                      # 许可证文件
  • align_and_crop_dir.py: 处理源图像目录中的多张图片,进行人脸检测、对齐并保存。
  • generate_mask.py: 用于生成解析掩模,若自动生成则需已训练好的FPN模型。
  • train.py: 主要的训练脚本,用于训练PSFR-GAN模型。
  • **test_**系列脚本: 提供不同场景下的测试功能,包括单张图片、未对齐图片目录和对齐图片目录的处理。
  • models: 包含网络架构定义和相关模型逻辑。
  • options: 定义了运行时的各种配置选项,如学习率、批次大小等。

2. 项目的启动文件介绍

训练启动:

使用train.py脚本来训练模型。基本命令示例如下:

python train.py --gpus 2 --model enhance --name PSFRGAN_v001 \
                --g_lr 0.0001 --d_lr 0.0004 --beta1 0.5 \
                --gan_mode 'hinge' --lambda_pix 10 --lambda_fm 10 --lambda_ss 1000 \
                --Dinput_nc 22 --D_num 3 --n_layers_D 4 \
                --batch_size 2 --dataset ffhq --dataroot /datasets/FFHQ \
                --visual_freq 100 --print_freq 10

这个命令会利用指定数量的GPU来训练一个名为PSFRGAN_v001的模型,参数配置涵盖了学习率、损失权重等关键设置。

测试启动:

对于测试,你可以使用test_enhance_single_unalign.py来进行单张图片的快速测试:

python test_enhance_single_unalign.py --test_img_path test_dir/test_hzgg.jpg --results_dir test_hzgg_results --gpus 1

此命令将处理一张图片,并将增强后的结果存放在指定的结果目录中。

3. 项目的配置文件介绍

配置主要通过train.py和脚本中的命令行参数进行,而不是独立的配置文件。options目录下的各种文件提供了预设的配置项,这些配置项可以通过脚本调用时的命令行参数进行覆盖或修改。例如,学习率(--g_lr--d_lr)、优化器参数(--beta1)、损失函数权重(--lambda_pix, --lambda_fm, --lambda_ss)等都是在运行脚本时直接设定的。

通过这种方式,用户可以在不直接编辑代码的情况下灵活地调整实验设置,实现不同目的的模型训练与测试。

登录后查看全文
热门项目推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
184
266
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
138
189
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
887
528
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
370
383
Git4ResearchGit4Research
Git4Research旨在构建一个开放、包容、协作的研究社区,让更多人能够参与到科学研究中,共同推动知识的进步。
HTML
19
0
kernelkernel
deepin linux kernel
C
22
6
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
337
1.11 K
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.08 K
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
84
4
harmony-utilsharmony-utils
harmony-utils 一款功能丰富且极易上手的HarmonyOS工具库,借助众多实用工具类,致力于助力开发者迅速构建鸿蒙应用。其封装的工具涵盖了APP、设备、屏幕、授权、通知、线程间通信、弹框、吐司、生物认证、用户首选项、拍照、相册、扫码、文件、日志,异常捕获、字符、字符串、数字、集合、日期、随机、base64、加密、解密、JSON等一系列的功能和操作,能够满足各种不同的开发需求。
ArkTS
61
2