NIST发布可识别和缓解针对人工智能系统网络攻击的指南

NIST发布可识别和缓解针对人工智能系统网络攻击的指南时间：2024-01-24部门：国际合作部

　　美国国家标准与技术研究院（NIST）长期致力于推动人工智能的安全发展，并在近期发布的指南中阐述了如何识别基于人工智能系统的网络攻击类型及缓解此类攻击风险。

　　人工智能系统通过接受数据训练学习在执行任务时的决策能力。比如，自动驾驶汽车可能会被训练观察含有道路标志的高速公路和街道的图像——“此类数据可帮助人工智能预测特定的情景并做出正确反应”。鉴于网络攻击会损坏数据甚至增加偏差语言，由此带来的挑战是人工智能系统数据本身或许就不可信赖。

　　在政府、学术界和业界的共同努力下，NIST最新发布的指南——“对抗性机器学习：攻击和缓解的分类和术语”重点关注了人工智能系统面临的四种主要攻击类型：躲避攻击、中毒攻击、隐私攻击和滥用攻击。NIST指出，该指南能够帮助人工智能研发者和使用者“掌握他们能够预想到的网络攻击类型及缓解攻击的方法”。

　　NIST识别人工智能系统面临的四种网络攻击类型如下：

　　躲避攻击发生在人工智能系统部署后，攻击者试图改变输入的数据进而改变系统的应答方式。比如在停车标志上添加其他标记，使自动驾驶汽车将其误解为限速标志，或创造令人混淆的车道标记，致使车辆偏离道路。

　　中毒攻击发生在培训阶段，攻击者试图引入损坏的数据。比如给聊天机器人植入不恰当的语言，使其在与顾客互动时将此类语言解读为可接受的正常用语。

　　隐私攻击发生在部署过程中，攻击者通过获取人工智能或其训练数据的敏感信息并进行滥用。

　　滥用攻击发生在将错误信息插入到源中（如网页或在线文档），使其被人工智能系统吸收。

　　NIST计算机科学家、指南合著者Apostol Vassilev表示，尽管人工智能和机器学习取得了重大进展，但这些技术很容易遭受攻击，从而导致重大失误和严重后果。该指南概述了涵盖所有基于人工智能的网络攻击技巧和方法，并提供了缓解上述攻击的策略，但尚无法证明此类防御措施完全有效，因此呼吁各界提出更好的应对措施。

　　原文网址：

　　https://www.ansi.org/standards-news/all-news/2024/01/1-16-24-supporting-trustworthy-ai-nist-publishes-guidance

附件：

标准化知识

法律法规