Unsloth项目全面支持SmolVLM2模型及各类Transformer架构

2025-05-03 17:55:46作者：苗圣禹Peter

Unsloth项目团队近期宣布了一项重要更新：现已全面支持SmolVLM2模型以及几乎所有Transformer架构的模型。这一突破性进展为开发者提供了更高效的模型训练和推理能力。

作为专注于优化大语言模型训练效率的开源项目，Unsloth此次更新主要包含三大技术亮点：

首先是对SmolVLM2模型的原生支持。SmolVLM2作为轻量级视觉语言模型，以其高效的推理速度著称。Unsloth通过底层优化，使该模型能够在保持精度的同时获得更快的运行速度。开发者现在可以轻松地将SmolVLM2集成到自己的应用中，享受其快速推理的优势。

其次是量化支持方面的突破。Unsloth现已支持4位量化技术，这种量化方式能在几乎不损失模型性能的前提下，大幅减少模型体积和内存占用。项目团队已经在模型库中提供了预量化的模型版本，开发者可以直接下载使用。

最后是训练方法的全面升级。Unsloth不仅支持传统的全参数微调，还实现了FFT（Fast Fine-Tuning）等高效训练技术。这些技术可以显著减少训练所需的计算资源和时间，特别适合资源有限的研究团队和个人开发者。

值得一提的是，Unsloth团队正在开发多GPU支持功能，这将进一步提升大规模模型训练的并行效率。这一功能预计将在不久的将来发布，为需要处理超大规模模型的用户带来福音。

对于希望快速上手的使用者，项目团队建议从他们提供的预量化模型开始尝试。这些模型已经过优化，可以直接用于推理任务，同时也支持进一步的微调。无论是研究机构还是企业开发者，都可以利用这些优化后的模型加速自己的AI应用开发流程。

unsloth

5X faster 60% less memory QLoRA finetuning

项目地址：https://gitcode.com/GitHub_Trending/un/unsloth

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Unsloth项目全面支持SmolVLM2模型及各类Transformer架构

相关内容推荐

最新内容推荐

项目优选