Queryable 项目教程

2024-09-17 09:12:38作者：齐冠琰

Run OpenAI's CLIP model on iOS to search photos.

项目地址：https://gitcode.com/gh_mirrors/qu/Queryable

1. 项目介绍

Queryable 是一个开源的 iOS 应用程序，利用 OpenAI 的 CLIP 模型和 Apple 的 MobileCLIP 模型，在用户的照片库中进行离线搜索。与 iOS 照片应用内置的基于类别的搜索模型不同，Queryable 允许用户使用自然语言描述（如“一只棕色的狗坐在长椅上”）来搜索他们的照片库。由于搜索过程完全离线，用户的照片隐私不会受到任何公司（包括 Apple 或 Google）的侵犯。

主要功能

自然语言搜索：用户可以使用自然语言描述来搜索照片。
离线处理：所有搜索操作都在本地进行，保护用户隐私。
多模型支持：支持 OpenAI 的 CLIP 模型和 Apple 的 MobileCLIP 模型。

2. 项目快速启动

环境准备

Xcode 开发环境
下载 CLIP 模型文件（可以从 Google Drive 获取）

快速启动步骤

克隆项目

git clone https://github.com/mazzzystar/Queryable.git

下载模型文件 从 Google Drive 下载 TextEncoder_mobileCLIP_s2.mlmodelc 和 ImageEncoder_mobileCLIP_s2.mlmodelc 文件，并将它们放置在项目目录下的 CoreMLModels/ 路径中。
打开项目 使用 Xcode 打开项目文件 Queryable.xcodeproj。
运行项目 在 Xcode 中选择合适的模拟器或设备，点击运行按钮（或按 Cmd + R）启动应用。

示例代码

以下是一个简单的示例代码，展示如何在应用中加载和使用 CLIP 模型进行搜索：

import CoreML

// 加载模型
let textEncoder = try! TextEncoder_mobileCLIP_s2(configuration: MLModelConfiguration())
let imageEncoder = try! ImageEncoder_mobileCLIP_s2(configuration: MLModelConfiguration())

// 编码文本查询
let query = "一只棕色的狗坐在长椅上"
let textVector = try! textEncoder.prediction(text: query).features

// 编码照片
let imageVector = try! imageEncoder.prediction(image: inputImage).features

// 计算相似度
let similarity = cosineSimilarity(textVector, imageVector)

// 输出结果
print("相似度: \(similarity)")

3. 应用案例和最佳实践

应用案例

个人照片管理：用户可以使用自然语言描述快速找到特定场景或对象的照片。
隐私保护：由于所有操作都在本地进行，用户的照片隐私得到充分保护。

最佳实践

模型优化：根据用户需求，可以选择不同的 CLIP 模型版本（如 s1, s2）以平衡效率和精度。
多语言支持：通过调整模型和输入处理，可以支持多种语言的搜索。

4. 典型生态项目

相关项目

PicQuery (Android)：由 @greyovo 开发的 Android 版本，支持英语和中文搜索。
Searchable (macOS)：由 yujinqiu 开发的 macOS 版本，支持全盘搜索。

生态整合

跨平台支持：通过开源社区的努力，Queryable 项目正在逐步扩展到多个平台，提供一致的用户体验。
模型共享：不同平台的模型文件可以共享，减少重复工作，提高开发效率。

通过本教程，您应该能够快速上手 Queryable 项目，并在实际应用中发挥其强大的搜索功能。

Run OpenAI's CLIP model on iOS to search photos.

项目地址：https://gitcode.com/gh_mirrors/qu/Queryable

热门内容推荐

1 开源项目 developer-roadmap 使用教程 2 开发者路线图项目教程 3 开源项目教程：awesome-selfhosted 4 开源项目 `awesome-selfhosted` 使用教程 5 Vue.js 教程与指南 6 Vue.js 项目教程 7 TensorFlow 开源项目教程 8 TensorFlow：开启机器学习新纪元 9 Linux 内核项目使用教程 10 Visual Studio Code 开源项目教程

最新内容推荐

《C++操作符库taocpp/operators安装与使用教程》探索三维世界：cpu_tsdf开源项目的安装与使用教程《moc-ng：Qt的moc替代工具的安装与使用教程》《Tracey的安装与使用教程》深入探索Vireio Perception：安装与使用教程 gason：轻量级JSON解析库的安装与使用教程深入解析Arduino RestClient库：安装与使用教程深入浅出掌握netLink：安装与使用教程《ftplibpp的安装与使用教程》深入探索编程乐趣：玩转开源项目 toys

项目优选

收起

Python-100-Days

Python - 100天从新手到大师

面向全场景的 Java 企业级插件化编程框架，支持聚散部署和共享内存，以一切皆可替换为核心理念，旨在为用户提供一种灵活的服务开发范式。

HarmonyOS-Examples

本仓将收集和展示仓颉鸿蒙应用示例代码，欢迎大家投稿，在仓颉鸿蒙社区展现你的妙趣设计！

RuoYi-Cloud-Vue3

🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

😎丰富生态、🧩支持扩展、🦄多模态 - 大模型原生即时通信机器人平台 | 适配 QQ / 微信（企业微信、个人微信）/ 飞书 / 钉钉 / Discord / Telegram 等消息平台 | 支持 OpenAI GPT、ChatGPT、DeepSeek、Dify、Claude、Gemini、Ollama、LM Studio、SiliconFlow、Qwen、Moonshot、ChatGLM 等 LLM 的机器人 / Agent | LLM-based instant messaging bots platform, supports Discord, Telegram, WeChat, Lark, DingTalk, QQ, OpenAI ChatGPT, DeepSeek

RGF是Windows系统下的通用渲染框架，其基于Direct3D、Direct2D、DXGI、DirectWrite、WIC、GDI、GDIplus等技术开发。RGF仓颉版（后续简称"RGF"）基于RGF(C/C++版)封装优化而来。RGF为开发者提供轻量化、安全、高性能以及高度一致性的2D渲染能力，并且提供对接Direct3D的相关接口，以满足开发者对3D画面渲染的需求。

Omega-AI：基于java打造的深度学习框架，帮助你快速搭建神经网络，实现模型推理与训练，引擎支持自动求导，多线程与GPU运算，GPU支持CUDA，CUDNN。

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

CangjieCommunity

为仓颉编程语言开发者打造活跃、开放、高质量的社区环境