LLaMA-Factory项目新增对Mistral Small 24B模型的支持

2025-05-02 22:38:11作者：盛欣凯Ernestine

LLaMA-Factory作为一个功能强大的大语言模型训练和微调框架，近期宣布已实现对Mistral Small 24B系列模型的支持。这一更新为研究人员和开发者提供了更多模型选择，特别是针对需要中等规模但高性能语言模型的应用场景。

Mistral Small 24B系列包含两个重要版本：

Mistral-Small-24B-Instruct-2501 - 经过指令微调的版本，适用于对话和任务导向型应用
Mistral-Small-24B-Base-2501 - 基础预训练版本，适合作为自定义微调的起点

24B参数规模的模型在性能和资源消耗之间提供了良好的平衡点。相比更大的模型，它在保持较强语言理解能力的同时，对计算资源的要求相对较低，这使得它在实际部署中更具可行性。

LLaMA-Factory框架的支持意味着用户现在可以：

直接加载这些预训练模型进行推理
利用框架提供的工具对模型进行进一步微调
将模型适配到特定硬件环境
与其他支持的模型进行性能比较

这一更新体现了LLaMA-Factory项目团队对保持框架前沿性的承诺，也反映了开源社区对多样化模型支持的需求。对于需要在资源受限环境下部署高质量语言模型的研究人员和工程师来说，这无疑是一个值得关注的发展。

随着大语言模型生态系统的不断演进，中等规模模型因其在性能和效率上的平衡而受到越来越多的关注。LLaMA-Factory对Mistral Small 24B的支持，为社区提供了又一个有力的工具选择。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

414

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

LLaMA-Factory项目新增对Mistral Small 24B模型的支持

热门内容推荐

最新内容推荐

项目优选

LLaMA-Factory项目新增对Mistral Small 24B模型的支持

相关内容推荐

热门内容推荐

最新内容推荐

项目优选