标题摘要内容
当前的位置:
详情
【会员动态】九章云极DART-GUI-7B登顶OSWorld 7B榜首,强化学习云赋能轻量化模型突破
来源: | 作者:AI 生 | 发布时间: 2026-02-24 | 22 次浏览 | 分享到:


图片


图片

近日,操作智能领域权威评测OSWorld发布最新榜单,九章云极DataCanvas的DART-GUI-7B模型凭借卓越智能操控表现,斩获OSWorld 7B赛道冠军。该模型基于九章云极Alaya NeW Cloud强化学习平台训练而成。

图片

Alaya NeW Cloud是九章云极打造的强化学习智算云平台,将强化学习能力深度融入底层基础设施,支持一键式Agentic RL开发环境启动、分布式极核训练,实现训推分离与全流程加速,预置多种主流Agent仿真环境,精准解决AI应用的效率与成本问题。目前,九章云极已在全球布局多个AIDC智算中心,持续赋能AI技术行业规模化落地。

OSWorld是衡量“智能体跨软件操作电脑”能力的顶尖基准测试,模拟真实操作系统环境,要求AI操控浏览器、Excel等各类桌面应用完成复杂任务,被OpenAI、Anthropic等顶尖团队广泛采用。该评测对7B模型堪称“地狱难度”,任务在真实软件中运行,需连续理解截图、规划路径并进行键鼠操作,限时30步且零容错,基础成功率不足1/4,让参数有限的7B模型长期处于“不可用”状态。

九章云极通过系统级算法创新实现突破,提出DART解耦式GUI智能体强化学习框架,将训练流程解耦为四个异步模块,实现环境利用率、GPU推演利用率显著提升,且训练与推理异步执行避免服务阻塞。针对“成功少、噪声多”的难题,DART设计四层自适应筛选机制,使7B模型在30步内稳定完成任务。同时,采用“场景适配、精度优化、算力协同”三维技术方案,优化语义理解能力与推理效率,降低资源占用与推理延迟。

在30步限制下,DART-GUI-7B在浏览器、图像设计、邮件客户端等多类任务中表现突出,GIMP类任务正确率达80.77%,办公套件、多应用协同等任务能力显著提升。真实场景验证中,该模型完成文档查找、页面导航等任务的成功率超90%。

当前,AI大模型正加速向产业落地转变,通用人工智能在办公自动化、智能运维等领域应用前景广阔,但部署成本高、轻量化模型性能不足等问题制约产业规模化。九章云极依托Alaya NeW Cloud强化学习核心能力,实现7B GUI模型的技术突破,为行业提供了“低成本、高性能”的通用人工智能解决方案,有望推动其在中小企业及长尾场景的普及。

九章云极DataCanvas是领先的AI基础设施及智算云提供商,以“创造智能,探索未知”为使命、“助力全球企业智能升级”为愿景,自研完整AIDC技术栈、智算操作系统及产业链。旗下有九章智算云、智算操作系统等品牌,提供AI训练推理相关算力、智算云服务和人工智能软件,赋能开发者与企业。

作为全球普惠算力倡导者,它引领首个算力计量标准,拥有万P级智能算力储备与超四百项自主知识产权,助力数字中国AI基础设施建设。