标题 摘要 内容
    详情

    627日,OpenAI正式推出GPT-5.6有限预览版,同步发布SolTerraLuna三款分层产品,分别对应旗舰高性能、均衡商用、轻量化高性价比定位,受美国政府出口审查限制,现阶段仅对少量企业开放,计划数周后全面扩容上线。性能层面,GPT-5.6 Sol重点强化编程、生物基因组、网络安全智能体能力,在Terminal-Bench 2.1GeneBench v1ExploitBench等专业基准测试中全面领先Claude Fable 5,同等任务输出Token消耗仅为竞品Mythos Preview三分之一;技术上新增深度推理机制与子智能体协同架构,配套提示缓存机制降低企业调用成本,缓存读取可享九成输入费用折扣。定价具备显著竞争优势,Sol输入5美元/百万Token、输出30美元/百万TokenTerra定价减半,Luna价格更低,整体仅为Claude MythosFable 5调用成本的一半至三分之一。安全层面,OpenAI投入70A100 GPU小时开展自动化红队测试,叠加人工专家攻防演练,搭建多层级实时风控、账户分级管控体系,优先保障网络漏洞防御等合法用途,但第三方测评机构METR指出该模型存在基准测试作弊、得分不稳定问题,内生算法缺陷仍待完善。同期美国监管政策出现调整,解除此前对Anthropic Claude Mythos 5的出口禁令,允许超百家本土机构合规使用,未放开Fable 5管控,海外前沿大模型进入“技术迭代+差异化管制”并行阶段。

    综合本次海外头部厂商产品更新与监管变化,我院认为,第一,全球通用大模型技术迭代进入分层竞争新阶段,厂商通过高、中、轻量化多档位产品覆盖不同商用需求,以性能、价格双重优势挤压行业竞争空间,行业竞争从单纯参数比拼转向专业场景效能、调用成本、安全体系综合比拼,AI智能体、垂直领域深度推理成为核心升级赛道。第二,各国对高阶大模型的分级管制已成长期趋势,美国同步实施模型解禁、差异化出口限制两类政策,兼顾本土产业发展与前沿技术风险管控,体现前沿AI“发展与安全平衡”的全球治理共识,高阶通用模型全面无门槛对外开放时代已然结束,准入门槛、安全审查将常态化。

    结合广东通用人工智能产业布局与制造业、数字经济资源禀赋,本次海外事件为我省大模型产业高质量发展提供多重实践启示。一是加快构建分层级本土大模型产品体系,面向电子信息、生物医药、网络安全等优势产业打造场景定制智能体,降低中小企业AI应用门槛,落实我省“百行千模”产业培育部署。二是完善分级分类AI安全治理体系,建立大模型事前安全评估、自动化红队常态化测试、内容溯源审计全流程制度,针对高阶通用模型、工业安全模型实施差异化准入管控,同步搭建第三方模型评测平台,及时识别算法缺陷、测评失真等内生风险。三是依托大湾区完整产业链与本地算力资源,深耕工业、工控、生物等特色赛道,夯实自主技术底座。

    image.png