Damselfly:一款强大的照片管理系统
项目介绍
Damselfly 是一款基于服务器的数字照片管理系统,专为管理大量基于文件夹的照片集合而设计。它特别注重快速搜索和关键词标记工作流程,帮助用户高效地管理和组织照片库。Damselfly 集成了强大的机器学习功能,能够识别照片及其主题,包括面部检测、物体检测和识别,以及(通过可选的 Azure Face Services 账户)完整的面部识别功能。用户只需标记一次人物,Damselfly 就能自动识别他们在其他照片中的出现。
Damselfly 的用户界面和工作流程灵感来源于备受喜爱的 Google Picasa 应用,提供了一个用于选择和处理图像的“篮子”功能。此外,Damselfly 还提供了一个桌面客户端应用,允许用户快速将选定的图像从服务器同步到本地文件夹,方便编辑等操作。
项目技术分析
Damselfly 基于 Microsoft .Net 7 构建,采用了 Blazor WebAssembly 和 EFCore 7 技术。它支持多种图像格式,包括 JPG、PNG、HEIC、TIFF、Webp、BMP 和 RAW 文件(如 DNG/CR2/ORF/NEF)。Damselfly 的核心功能包括:
- AI / 计算机视觉图像识别:面部检测、物体检测和识别、图像分类和面部识别(目前暂时不可用)。
- 全文本搜索:支持多短语部分单词搜索,快速定位目标照片。
- 图像重组织:支持在文件夹之间移动/复制图像,并通过回收站功能删除图像。
- 高级搜索:可根据日期范围、物体/面部/识别的面部、相机/镜头品牌/型号、文件大小、方向等条件进行过滤。
- 多用户支持:支持用户账户和基于角色的权限管理,确保数据安全。
- 地理定位:显示照片拍摄地点的地图,前提是照片包含地理位置元数据。
项目及技术应用场景
Damselfly 适用于需要高效管理大量照片的个人和专业用户。无论是摄影师、设计师还是普通用户,Damselfly 都能帮助他们快速找到所需的照片,并进行高效的标记和分类。具体应用场景包括:
- 摄影师:管理大量照片库,快速查找和标记照片。
- 设计师:从庞大的照片库中筛选出符合需求的图像,进行后续设计工作。
- 家庭用户:整理家庭照片,方便回忆和分享。
项目特点
- 高性能:搜索 50 万张照片仅需不到一秒,确保用户能够快速找到所需内容。
- 非破坏性 EXIF 数据更新:使用 ExifTool 进行关键词标记,避免重新编码 JPEG 文件。
- 多用户支持:支持用户账户和角色管理,确保数据安全。
- 自动化后台索引:自动更新和索引新添加或更新的照片,保持照片库的实时性。
- 跨平台支持:支持 Windows、Linux 和 OSX,并可在 Docker 中运行。
- 桌面客户端:提供 MacOS、Windows 和 Linux 的桌面客户端,方便用户进行本地编辑和同步。
Damselfly 是一款功能强大且易于使用的照片管理系统,无论是个人用户还是专业用户,都能从中受益。如果你正在寻找一款高效的照片管理工具,Damselfly 绝对值得一试!
支持 Damselfly
Damselfly 是免费的开源软件。如果你觉得它有用,并愿意支持开发者,可以通过以下链接购买一杯咖啡或一块披萨,表示你的支持!
联系我们
你可以通过以下方式联系 Damselfly 团队:
- 在 Twitter 上关注我们
- 在 Reddit 的 r/DamselflyPhotos 板块提问或获取支持
- 如果有问题、功能请求或发现了 bug,可以在 GitHub 上提交问题
- 如果你想打个招呼,可以通过 email 联系我们
截图展示
未来计划
- 图像去重(正在进行中)
- 直接上传到社交媒体平台、Google Drive 等
- 支持更多图像格式和视频
- 直接分享到社交媒体(Twitter、Facebook 等)
- 支持选择和上传到 Alamy Stock Image 照片服务
- 简单的非破坏性编辑/处理:裁剪、颜色调整等
- 本地图像同步回服务器
如果你有其他功能的想法,欢迎通过 GitHub 问题 告诉我们!
更多信息
感谢与致谢
- Microsoft Blazor.Net:让我们避免了编写 JavaScript。
- PumpkinBeth:为 Damselfly 的 logo 拍摄了照片,并提供了最初的灵感。
- SkiaSharp:快速生成缩略图的库。
- SixLabors ImageSharp:便携式缩略图生成库。
- Drew Noakes 的 MetadataExtractor:用于 IPTC 和其他图像元数据索引。
- Phil Harvey 的 ExifTool:Damselfly 用于所有 EXIF 写操作。
- ZZZ Project 的 Entity Framework Extensions:优秀的 EFCore 扩展。
- MudBlazor:出色的 Blazor 组件库。
- EmguCV:面部和物体检测 Haar 分类器模型。
- Azure Cognitive Services:面部识别引擎。
- Accord.Net:额外的面部识别库。
- Font Awesome:出色的图标库。
- Chris Sainty 的 Blazored Modal 和 Typeahead,以及他在 Blazor 上的所有优秀信息。
- Serilog.Net:用于日志记录。
- Wisne 的 Infinite Scroll 灵感。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00