【产业资讯】蚂蚁集团发布万亿参数旗舰模型Ling-1T并开源，多项指标位居开源模型榜首

标题摘要内容

当前的位置：

首页 >> 【产业资讯】蚂蚁集团发布万亿参数旗舰模型Ling-1T并开源，多项指标位居开源模型榜首

详情

来源: | 作者:AI 生 | 发布时间: 2025-10-09 | 1477 次浏览 | 🔊 点击朗读正文 ❚❚ ▶ | 分享到:

10月9日消息，蚂蚁集团发布万亿参数的通用语言模型Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0系列的第一款旗舰模型，也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示，在有限输出Token条件下，Ling-1T于多项复杂推理基准中取得SOTA表现，展示出在高效思考与精确推理之间的卓越平衡。另外，在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上，Ling-1T 均取得领先成绩，多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 （American Invitation Math Examination 25）为例，Ling-1T 以平均 4000+ Token 的消耗达到了 70.42% 的准确率，优于 Gemini-2.5-Pro（平均 5000+ Token，准确率 70.10%）。Ling-1T 用更少的 Token 实现了更高的准确率，展现出在推理精度和思考效率综合能力上的优势。

据蚂蚁百灵团队透露，Ling-1T沿用Ling 2.0架构，在20T+tokens高质量、高推理浓度的语料上完成预训练，支持最高128K上下文窗口，通过“中训练+后训练”的演进式思维链（Evo-CoT）极大提升模型高效思考和精准推理能力。

蚂蚁百灵团队还透露，在万亿级旗舰模型的研发过程中，多次观察到：扩大模型规模与强化推理能力，往往会带来出乎意料的跨领域泛化表现。例如，在智能体工具调用任务BFCL V3上，Ling-1T虽未在中训练阶段引入大量操作轨迹，仅通过少量指令微调，即可达到约 70% 的调用准确率，展现出卓越的推理迁移与泛化能力。Ling-1T能精准理解复杂自然语言指令，自主完成综合性任务：将模糊的逻辑问题转化为功能完备的可视化组件，为多端环境生成高兼容性前端代码，或根据指定风格与语气创作营销文案、文学续篇及多语种文本。团队认为，这些能力构成了通用智能体的关键基础。

蚂蚁百灵团队称，尽管Ling-1T在高效推理、跨领域泛化与训练效率方面取得显著进展，但仍存在以下局限：