开源大模型推理革命：Ring-1T-preview万亿参数模型逼近GPT-5数学能力

2026-02-07 05:53:07作者：乔或婵

导语

蚂蚁集团旗下inclusionAI团队提前发布万亿参数推理模型Ring-1T-preview，在2025年美国数学邀请赛(AIME)中以92.6分逼近GPT-5水平，标志着开源模型正式具备竞赛级推理能力。

行业现状：大模型推理能力的"军备竞赛"

2025年，大语言模型的竞争已从参数规模转向推理质量。根据《2025大模型开源生态全景图》显示，全球135个核心开源项目中，数学推理成为衡量模型智能的关键指标。随着GPT-5、Gemini 2.5 Pro等闭源模型在数学推理、代码生成等领域不断突破，开源社区亟需能与之抗衡的大模型。在此背景下，Ring-1T-preview的开源具有里程碑意义。

核心亮点：三大突破重塑开源推理能力

1. 竞赛级数学推理能力

Ring-1T-preview在AIME 2025数学竞赛中获得92.6分的高分，接近GPT-5的94.6分。在IMO 2025测试中，该模型一次性解出第3题，并在其他题目上给出部分正确答案，展现出高阶推理能力，包括洞察力、构造性问题解决、反例生成、战略思维和严谨的逻辑链推理。

如上图所示，Ring-1T-preview在AIME 25、HMMT 25、LiveCodeBench(2408-2505)、CodeForces和ARC-AGI-v1等多个基准测试任务上表现优异，部分指标接近或超越Gemini-2.5-pro、DeepSeek-V3.1-Terminus-Thinking等模型。这张对比图直观展示了Ring-1T-preview在数学推理和代码生成领域的竞争力，为开发者和企业选择合适的开源模型提供了重要参考。

2. 高效的混合专家架构

Ring-1T-preview采用Ling 2.0高效的混合专家(MoE)架构，总参数规模达到万亿级别，但每个token仅激活约370亿参数（总参数的3.7%）进行计算。这种设计使得模型在保持推理速度的同时，具备了处理极其复杂任务的能力。门控网络的学习过程使不同专家网络逐渐擅长处理特定类型的问题，如数学推理、代码分析或语言理解。

3. 创新的训练方法与开源生态

模型在20万亿token的高质量语料上完成预训练，并通过自研的ASystem强化学习系统进行了专门针对推理能力的RLVR训练。团队采用了创新的"icepop"方法，鼓励模型展示思考过程而非仅输出最终答案。Ring-1T-preview已完全开源，开发者可通过GitCode仓库获取相关资源，仓库地址为https://gitcode.com/hf_mirrors/inclusionAI/Ring-1T-preview。

这张图片再次展示了Ring-1T-preview在AIME 25、HMMT 25等多任务中的性能对比，蓝色柱形代表Ring-1T-preview的性能。通过与Gemini-2.5-pro、DeepSeek等模型的对比，可以清晰看出Ring-1T-preview在开源模型中的领先地位，尤其是在数学推理任务上的优势，为科研机构和企业提供了一个高性能且经济的AI解决方案。