神经网络是一种人工智能(AI),其灵感来源于人脑的结构和功能。从Alexa或Siri等语音助手到自动驾驶汽车和个性化推荐系统,神经网络技术被广泛应用于各种应用中,正在改变我们与世界互动的方式。
神经网络由相互连接的节点(也称为人工神经元或单元)组成,分层组织。每个神经元接收输入,使用特定的权重和偏置对其进行处理,然后产生输出,并输送到下一层。
神经网络通过一个称为训练的过程从数据中学习,在这个过程中,神经网络会随着时间的推移调整其权重和偏置,以做出更好的预测或决策。神经网络能够处理非结构化数据(如图像或声音)、识别模式并进行预测,因此已成为现代人工智能系统的重要组成部分。
人工智能技术在计算机视觉、自然语言处理、语音识别等各种应用领域都取得了令人瞩目的成就。然而,随着人工智能技术更深入地融入我们的生活,人们对其可信度的担忧也与日俱增。这种担忧来自神经网络的两个内在因素:难以解释其输出和难以预测其在使用领域中的任何地方的行为。
我们能否依靠人工智能系统做出准确的决策,尤其是在出现意外情况时?在医疗保健、金融和自动驾驶汽车等关键领域,人工智能错误会对系统的可信度产生重要影响,进而影响公众或行业对系统的接受程度。
国际电工委员会和国际标准化组织人工智能联合委员会SC42正在开发ISO/IEC24029系列,以解决这些问题。
通过支持深度学习,基于神经网络的人工智能系统可以实现大量有益于社会的新应用,而这些应用在其他情况下是不可能实现的。ISO/IEC24029神经网络系列采用了同样基于生态系统的整体方法,同时解决伦理问题和新兴技术要求,以实现负责任的采用。
鲁棒性是指人工智能系统在任何条件下保持其性能水平的能力。2021年发布的技术报告(TR)《ISO/IECTR24029-1》重点介绍了可用于评估神经网络鲁棒性的三种方法:
形式化方法依靠完善的形式化证明来检查某些属性在特定使用领域是否可以证明。例如,评估人员可以评估系统是否始终在指定的安全范围内运行;
统计方法涉及对数据集进行数学测试,以确定结果的可信度。它们有助于评估人员回答与性能阈值有关的问题,如假阳性/阴性率,以及这些阈值是否是可以接受的;
经验方法:这些方法包括实验、观察和专家判断,以评估系统在特定情况下的行为。评估人员可以确定系统特性在现实生活中的适用程度。
新发布的国际标准ISO/IEC24029-2重点关注衡量神经网络鲁棒性的正式评估方法。
该标准为评估人员提供了一套具体的要求、建议和技术,从而为评估神经网络在不同约束和条件下的鲁棒性提供了重要指导。