【亲测免费】 Chinese-CLIP: 中文版的跨模态预训练模型
2026-01-20 02:42:41作者:俞予舒Fleming
项目基础介绍与编程语言
Chinese-CLIP 是一个专为中国市场设计的 CLIP(Contrastive Language-Image Pre-training)模型变体,它利用约2亿的中文图像-文本对进行训练。项目目标在于促进中文领域内图文特征计算、跨模态检索及零样本图片分类任务的便捷实现。此项目基于Python开发,并广泛使用PyTorch深度学习框架。
核心功能
- 跨模态检索: 支持中文环境下图像与文本之间的高效检索。
- 特征生成: 生成具有代表性的图像与文本特征向量,便于相似度比较。
- 零样本图像分类: 不需要额外标签即可对新类别的图像进行分类。
- API支持: 提供易用的API,简化开发者集成过程。
- 适应多种场景: 包括但不限于社交媒体分析、内容检索和多媒体应用。
最近更新的功能
- 模型转换支持: 添加了将PyTorch模型转化为CoreML格式的脚本,便于iOS设备上的部署。(感谢贡献者@manymuch)
- 知识蒸馏微调: 支持基于ModelScope库的模型知识蒸馏功能,提升了在中文数据上的表现。(致谢阿里云PAI团队成员)
- PyTorch 2.0兼容: 项目已升级以适应PyTorch 2.0,确保与最新工具链的无缝对接。
- 性能增强: 引入FlashAttention,提高了训练速度并减少了显存占用。
- 部署选项扩展: 增强了对ONNX和TensorRT模型的支持,提供预训练TensorRT模型,加快特征推理速度。
本项目不仅提供了丰富的模型规模选择,还持续优化以适应不同的应用场景和性能需求,是研究和开发中文跨模态应用的宝贵资源。无论是科研人员还是工程师,Chinese-CLIP 都是一个强大的工具箱,加速从理论到实践的过程。
登录后查看全文
热门项目推荐
相关项目推荐
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C0134
let_datasetLET数据集 基于全尺寸人形机器人 Kuavo 4 Pro 采集,涵盖多场景、多类型操作的真实世界多任务数据。面向机器人操作、移动与交互任务,支持真实环境下的可扩展机器人学习00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python059
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
AgentCPM-ReportAgentCPM-Report是由THUNLP、中国人民大学RUCBM和ModelBest联合开发的开源大语言模型智能体。它基于MiniCPM4.1 80亿参数基座模型构建,接收用户指令作为输入,可自主生成长篇报告。Python00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
499
3.65 K
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
870
485
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
314
134
React Native鸿蒙化仓库
JavaScript
297
347
暂无简介
Dart
747
180
Ascend Extension for PyTorch
Python
302
344
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
11
1
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
66
20
仓颉编译器源码及 cjdb 调试工具。
C++
150
882