要目
0 引言
1 我国人工智能关键领域技术标准化研究
2 我国人工智能关键领域技术标准化存在问题
3 我国人工智能关键领域技术标准化发展建议
摘要:依据现行新一代人工智能标准体系建设指南规定的标准体系结构分类,分别以发布的有效标准和在研立项标准两个维度系统梳理了人工智能涉及关键领域技术标准化研究现状。从统计数据可以得出,我国已初步建立人工智能关键领域技术标准体系,尤其是智能语音和人机交互等关键领域的标准化研究已经走在了国际前列。但是仍存在标准研究与产业发展不匹配、安全标准研究不足、伦理道德标准滞后等突出问题,最后对相关标准化体系发展提出发展建议。
关键词:人工智能;标准化;关键领域技术
0 引言
近年来,随着计算机技术的发展,人工智能的应用场景不断扩大和延伸,涵盖了诸多领域,尤其在金融、制造、医疗、教育、交通、城市管理等关键领域得到长足发展。例如,智能交通管理可以通过分析交通状况和交通流数据,实现智能信号灯控制、道路方向干道选择等。智能交通安全可以通过实时监测车辆位置及动态数据,预测交通违规和交通事故。智能交通信息服务可以帮助人们更好地利用交通网络,通过AI自动分析实时交通状况,可以实现智能驾驶,减少车辆拥堵,提供完整交通信息提醒。
影响人工智能产品是否顺利应用的关键技术主要包括自然语言处理、智能语音、计算机视觉、虚拟现实/增强现实、人机交互等。同时,人工智能涉及跨领域的多技术融合,标准之间存在着相互依存、相互制约的内在联系。因此,人工智能标准化工作需要统筹协调,以系统科学的理论和方法为基础,运用标准化的工作原理不断优化标准之间的关系,避免标准间不配套、不协调及组成不合理等问题。本文聚焦在人工智能关键领域技术方向,统计现行标准化文件和在研标准项目,分析相关标准化研究现状,综合得出我国在人工智能关键领域技术方面存在问题并提出相关建议。
1 我国人工智能关键领域技术标准化研究
2020年7月,国家标准化管理委员会等五部门联合发布了《国家新一代人工智能标准体系建设指南》,其中制定了人工智能标准体系各项标准,包括关键领域技术标准。本文聚焦于人工智能自然语言处理、智能语音、计算机视觉、虚拟现实/增强现实、人机交互等关键领域技术,开展相关标准化工作现状研究。
1.1 自然语言处理
自然语言处理是人工智能的重要甚至是核心内容。根据现有的理论和技术现状,具有相当自然语言处理能力的实用系统已经出现,有些已实现商品化,甚至开始产业化。典型例子有多语种数据库和专家系统的自然语言接口、各种机器翻译系统、全文信息检索系统、自动文摘系统等。近期推出的ChatGPT就是一种自然语言处理技术,它是由OpenAI推出的一种基于大规模语言模型的自然语言生成模型。
自然语言处理技术细分方向有语言信息提取、文本处理、语义处理和机器翻译等,发布并现行标准有12项(见表1)。其中7项标准等效采用国际标准,5项为国家推荐性标准。在研的标准项目有6项(见表2),基本为2022-2023年立项标准,且以MOD 或等同采用标准为主。
表1 自然语言处理现行标准文件列表
表2 自然语言处理在研标准项目列表
传统自然语言处理的机器翻译、语音控制已经不能满足现代化社会发展的需求,目前的自然语言处理虽然在专业领域文档翻译、搜索引擎等方面提供可靠的辅助性帮助,但是在很多基础问题研究仍然有很大差距,如词义消歧、语法分析、语义分析、篇章处理和跨文本处理等方面。随着词表词义词法语料库等数据资源的丰富,自然语言处理未来将在知识抽取、融合、建模、计算和应用等方面加强技术与标准化研究。
1.2 智能语音
智能语音是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS),而语音交互技术是语音识别和语音合成的基础和支撑。目前的标准化工作主要围绕语音识别、语音合成和语音交互等技术开展。
智能语音方向发布并现行标准有27项(见表3)。其中1项标准等效采用国际标准;13项为国家推荐性标准,内容涵盖基础概念、技术规范、测试方法、终端规范和应用场景等;6项行业标准,主要是在汽车、家电和公安行业制定的标准文件;5项团体标准,以智能语音技术与产品评估方法为主题制定的系列标准;3项应用场景的技术规范标准。在研的标准项目有2项(见表4),均为智能语音产品制订的规范要求。
表3 智能语音现行标准文件列表
借助于深度学习、云计算和高性能的运算平台等技术,在语音识别率方面,以百度、谷歌、科大讯飞为主流的平台识别准确率均在96%以上,未来智能语音识别技术标准研究更多聚焦在场景应用、跨地域跨语种实施交互、非主流语言/非标准化发音/低信号质量情景中的语音识别、合成和处理技术。
1.3 计算机视觉
计算机视觉技术已成为计算机研究领域中一门综合性的前沿交叉学科,细分方向包含画面重建、事件监测、目标跟踪、目标识别、索引建立、图像恢复等,发布并现行标准有4项(见表5)。其中1项标准为基础概念相关的国家推荐下标准,3项为产品技术要求和职业技能评价相关的团体标准。在研的标准项目有2项(见表6),基本为2021年立项标准,均为以技术要求或产品规范相关标准。
近年来,国内计算机视觉算法技术供应商集中度较高,以商汤科技为代表的4家企业占据市场份额超过50%。应用领域集中在零售、安防、制造、政务、医疗等行业,其中零售行业占比最大,可基于场景化营销、商品识别分析等应用提升营销转化率,实现门店运营的智能化改革;安防行业是计算机视觉最早落地的场景,利用安防影像智能分析协助城市治理等领域的智能化转型。未来计算机视觉的需求和发展趋势更多针对具体业务场景进行针对性开发,以提供更加全面、及时的服务,这对计算机视觉技术在重视前沿算法研发的同时,需要进一步加强算法和商业应用的融合,同时也是标准化工作布局的重点方向。
1.4 虚拟现实/增强现实
现阶段虚拟现实和增强现实通过赋能各产业和重点场景,已经开始运用在各个领域中,支撑我国虚拟现实产业快速发展。在《中华人民共和国国民经济和发展第十四个五年规划和2035年远景目标纲要》中,将虚拟现实和增强现实列为数字经济重点产业,提出推动三维图形生产,动态环境建模、实时动作捕捉快速渲染处理技等技术创新。
虚拟现实和增强现实发布并现行标准有14项(见表7)。其中3项国家推荐性标准、3项行业标准、3项团体标准和5项地方标准,内容涵盖基础概念、通用技术标准及垂直行业应用标准。在研标准项目有5项(见表8),均为垂直行业应用相关的规范要求。
目前,虚拟现实/增强现实均处于初级阶段,未来在通用技术标准中将聚焦在网络、云、平台、终端、协同一体化优化等细分方向仍需要加快标准化工作研制,为产业发展和应用推广提供统一规范,引导和支持我国产业良性快速发展。
表4 智能语音在研标准项目列表
表5 计算机视觉现行标准文件列表
表6 计算机视觉在研标准项目列表
表7 虚拟现实/增强现实现行标准文件列表
表8 虚拟现实/增强现实在研标准项目列表
1.5 人机交互
人机交互作为中国计算机领域一个新的发展方向,在社会、经济和国家安全等领域中扮演着越来越重要的角色。细分领域有单通道人机交互、笔/手势交互、手势交互、语音交互和情绪认知计算等。
人机交互发布并现行标准有18项(见表9)。其中11项国家推荐性标准、5项行业标准、2项团体标准,内容涵盖基础概念、手势交互技术、通用产品、垂直行业应用等相关标准。目前无在研标准研制项目。
人机交互技术从界面形式来看,正在从图形用户界面向多通道用户界面、混合用户界面等更人性化的交互界面发展,未来的核心技术以感性交互为重要发展方向,同时伦理学也是给予关注的重点内容,均需要制定引导行业健康发展的标准指南和规范。
2 我国人工智能关键领域技术标准化存在问题
2.1 标准化工作与产业发展不匹配
从第1部分标准研究现状可以得到,在政策引领、项目支撑、人才协同等多因素同向发力作用下,人工智能产业已形成以关键技术为核心、以新一代信息技术为引领、以新型智能基础设施为关键支撑,各领域深度融合发展的智能科技产业,尤其在金融、医疗和安防等领域应用场景较为成熟,但是仍存在标准更新速度较慢且覆盖范围不够广泛、现行标准间协调配合度不高的问题,不能满足关键领域技术快速发展的需求。
2.2 关键领域技术安全标准研究不足
当前,人工智能利用服务过程中的用户数据进行优化训练的时候可能涉及在用户不知情情况下收集个人信息、个人隐私、商业秘密等,安全风险较为突出。人工智能模型日益庞大,开发过程越来越复杂,数据泄露风险点更多、隐蔽性更强,人工智能所使用开源库漏洞引发数据泄露情况时有发生,同时,交互式人工智能的应用降低了数据流入模型的门槛。
表9 人机交互现行标准文件列表
在技术层面,由于深度模型算法的复杂结构是黑盒,人工智能模型天然缺乏呈现决策逻辑。由于近年来人工智能算法、模型、应用发展演化速度快,如何判断人工智能是否具备可解释性一直缺乏统一认知,难以形成统一判别标准。叠加现实场景中环境因素复杂多变,人工智能难以通过有限的训练数据覆盖应用场景的全部情况,因此可靠性也是制约人工智能关键领域应用广泛落地的主要因素。
2.3 与伦理、犯罪相关的标准和规范滞后
近年来,利用虚假视频、图像、音频等恶意使用人工智能技术的负面事件层出不穷,更甚者进行诈骗、勒索、传播色情暴力信息的恶意威胁。而且,模型和数据逐渐变成企业、行业甚至是国家的核心资产,通过模型窃取、成员推理等攻击手段反向获取模型、数据,或者利用人工标注、数据存储等环节的安全管理漏洞套取数据均有可能造成伦理道德风险。我国现有的保护标准主要以生物特征识别和智能汽车等应用领域,在业务数据安全、安全评估规范和生成式人工智能标准亟需加快推进与发布实施文件。
3 我国人工智能关键领域技术标准化发展建议
结合我国人工智能产业的发展趋势和需求,最终形成标准引领人工智能产业全面规范化的新格局,对于关键领域技术标准化研究提出以下建议。
3.1 加强标准顶层设计和统筹制定
强化标准化顶层设计,建立关键领域技术标准化体系,重点支持以人工智能自然语言处理、智能语音、计算机视觉、虚拟现实/增强现实、人机交互为代表的关键技术、核心产品和应用迭代等标准化研究,落实国家关于人工智能的决策部署,推动人工智能技术在开源、 开放的产业生态不断自我优化,充分发挥基础共性、伦理、安全隐私等方面标准的引领作用, 指导人工智能国家标准、行业标准、团体标准等的制修订和协调配套,形成标准引领人工智能产业全面规范化发展的新格局。
3.2 加强安全标准的相关研究
在关键技术安全标准研究方面,主要针对公平性、鲁棒性、可解释性、可泛化性、可复现性等技术方面展开,为可信赖人工智能应用和管理提供技术支撑,如加强人工智能算法模型的安全性和鲁棒性;能应用标准之前优先考虑智能产品的安全标准,进一步深化人工智能应用安全标准工作,针对已有标准完善智能安全要求,优先针对标准化需求迫切且应用较成熟,或应用较敏感的领域进行标准研究。
3.3 引导行业健康发展的标准指南和规范
为了更好地落实《数据安全法》《个人信息保护法》等法律法规,提出可以切实解决用户输入数据安全问题的相关标准规范,同时需要开展在数据集防护、算法模型保护、抗逆向攻击等方面的安全技术措施指南。为了更好地提前防范安全隐患,提升人工智能产品或服务的安全水平,推动人工智能应用于行业的进一步融合发展,需要对人工智能安全评估规范标准开展相关研究。
本文来源与作者信息
原文刊发于《网络安全与数据治理》2023年第9期。
朱肖曼(1978-),女,硕士,副研究员,主要研究方向:人工智能、大数据相关政策研究及行业应用。申志伟(1980-),男,博士,正高级工程师,高级经济师,主要研究方向:云计算、网络安全、人工智能、大数据、移动互联网产品研发等。时文丰(1990-),男,博士,工程师,主要研究方向:新一代通信和信息技术。其他作者:范晶、李春光、于寅虎、郭烁。以上作者单位均为中国电子信息产业集团有限公司第六研究所和工业控制系统信息安全技术国家工程研究中心。
因篇幅较长,已略去原文注释