【标准动态】可信AI标准｜中国信通院顺利召开大模型标准体系2.0研讨会

标题摘要内容

来源:可信AI评测 | 作者:可信AI评测 | 发布时间: 2023-05-08 | 6722 次浏览 | 分享到:

2021年11月，中国信通院依托人工智能关键技术和应用评测工业和信息化部重点实验室组建大模型工作组，广泛吸纳成员单位，共同围绕技术研究、产业交流、标准制定、生态共建等方面开展工作，并初步取得成效。为进一步适应当前国内外大模型发展态势，工作组在前期基础上升级形成标准体系2.0。4月27日，大模型工作组顺利召开大模型标准体系2.0研讨会，来自工作组的组长单位、副组长单位、成员单位的70余位行业专家参会。会议由中国信通院南京新一代人工智能研究院高级业务主管张学强主持。

中国信通院云计算与大数据研究所人工智能部主任曹峰在开场致辞中指出，当前大模型的发展重心已逐步由学术打榜向工程实践转移，支撑人工智能应用创新与产业落地。然而，当前大模型仍存在隐私安全、数据投毒、恶意使用等问题，亟需通过标准制定、评估测试等工作进行引导。未来，工作组将以大模型标准体系2.0为中心与各方携手共推大模型工程化进程、共筑大模型可信生态。

张学强对工作组相关工作进行总结，重点对大模型标准体系2.0进行介绍。中国信通院充分结合当前国内外大模型发展态势以及前期研究基础，在大模型标准体系1.0基础上，升级并发布以“模型即服务MaaS”为核心的大模型标准体系2.0。标准体系2.0将全面关注大模型的模型化、能力化、工程化、产业化等维度，从模型开发、模型能力、模型运营、模型应用、安全可信五个方向持续构建和完善大模型标准体系。

来自中国信通院云计算与大数据研究所人工智能部、中国信通院南京新一代人工智能研究院的张丹、陆铁文、陶秋雨、吴思奇等人，分别对《大规模预训练模型技术和应用评估方法》系列标准的模型开发、模型能力、模型运营、模型应用、安全可信等五个部分进行了详细介绍。

模型开发包含数据构建、模型训练、模型管理和模型部署4个能力域，数据管理、数据处理、训练方式等16个能力子域，共计60余个能力项，可用以评估研究主体开发大模型的能力。模型能力包含功能丰富度、性能优越度和服务成熟度3个评测维度，智能语义、智能视觉、智能语音、跨模态等8个能力域，共计30余个能力项，可用以评估大模型的各项技术能力。模型运营计划围绕数据工程、模型调优、模型交付、服务运营、平台能力等维度，新增能力要求，即重点面向工具或平台，提炼应具备的技术能力要求。模型应用拟从应用丰富度和应用成熟度两个维度进行评价，围绕行业覆盖度、场景适配度、任务支持度、效果优越性、服务可靠性、定制满足度等评估大模型应用阶段的各项能力。安全可信拟从大模型研发运营等全生命周期评估大模型安全性、合规性、自主性、可信性，保障大模型安全可用。