当前位置: 首页>行业 >

BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

来源: 北京商报 | 时间: 2023-07-06 17:59:51 |


(资料图片仅供参考)

伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。、

大语言模型引领创新浪潮席卷全球,国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时,大模型的安全风险也引发广泛担忧。此前,BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中,对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估,发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外,AI安全实验室还在主流AI框架中发现200多个漏洞,影响超过40亿终端设备。5月30日,二十届中央国家安全委员会第一次会议上也明确提出,需“提升网络数据人工智能安全治理水平”。

目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中,提示注入攻击因利用有害提示覆盖大语言模型的原始指令,具有极高危害性,也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。

为推动行业采取有效防御措施,构建更加安全可信的大语言模型,BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。 报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。

测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面,需进行网络安全测评和内容安全测评,检测模型软件、插件及供应链等的安全漏洞,并评估模型是否产生有害、有偏见、侵权或与事实不符的内容,以提出整改建设方案。在安全防御方面,报告建议应构建多层次的协同防御体系,包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性,以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面,需建设大语言模型安全风险监测预警平台,包括构建威胁情报库和建立自动化预警系统,以实时追踪安全事件、攻击模式和漏洞信息,并及时发出预警。

基于报告形成测评能力,未来,BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”,为国内大模型提供提示注入攻击风险安全测评,全面推动我国构建安全可信的人工智能。

关键词:

 

热文推荐

BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》

伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。

2023-07-06

“嗨啤”一夏!2023武汉啤酒节将在汉阳激情启幕

“嗨啤”一夏!2023武汉啤酒节将在汉阳激情启幕---本周末,2023武汉啤

2023-07-06

上半年24个创新药、28个创新医疗器械获批上市

”焦红介绍,我国将进一步优化附条件上市申请审评审批相关工作程序,同

2023-07-06

EKPO获得百万欧元邮轮燃料电池组合同 天天关注

EKPOFuelCellTechnologies(EKPO)从一家国际邮轮公司获得了一份订单。包

2023-07-06

中国绿发自主研发的世界最大液态(化)空气储能示范项目开工|全球微头条

7月1日,中国绿发自主研发投资建设的世界最大液态(化)空气储能示范项目

2023-07-06

世界微头条丨382个赈济箱已发放!重庆市红十字会火速驰援万州灾区

7月3日至4日,万州区遭受暴雨袭击,截至7月4日9时,24个镇乡街道达到暴

2023-07-06

"抹香鲸尸体内发现龙涎香,价值390万元"

当一头抹香鲸被冲上西班牙拉帕尔马加那利岛的海滩时,没人会想到它的身

2023-07-06

小米10s对比opporeno6pro_天天热点

小米10s和opporeno6pro那个好其实OPPOReno6Pro+和小米10s这两款手机是

2023-07-06

理想成为最快达成 40 万辆交付的新势力

[爱卡汽车行业新闻原创]7月5日,理想汽车于北京交付中心完成了第40万辆

2023-07-06

天天微动态丨恒丰银行“全球银行1000强” 排名升至第119位

自1970年以来,英国《银行家》杂志连续发布全球银行1000强榜单,是当今

2023-07-06

国网武陟县供电公司: 服务升级 助企节能降碳|焦点报道

国网武陟县供电公司:服务升级助企节能降碳

2023-07-06

泽塔奥特曼9月剧情预告四次元怪兽和双雷德王半总集篇预定

泽塔奥特曼有关即将在9月放送的具体内容,在近日有所透露和公开,这次

2023-07-06

北辰区:绿地新里天澜周边道路年底后陆续完工 播资讯

天津北方网讯:《党群心连心》栏目网民李**留言:绿地新里天澜项目三个

2023-07-06

高温橙色预警 北京河北河南等地部分地区可达40℃或以上

据中国天气网,中央气象台7月6日06时继续发布高温橙色预警:预计7月6日

2023-07-06

已发现多例!湖北疾控紧急提醒_世界观速讯

已发现多例!湖北疾控紧急提醒

2023-07-06

俄海军护卫舰编队访问上海_热点评

每经AI快讯,7月5日,由俄罗斯海军太平洋舰队“响亮”号和“完美”号护

2023-07-06

当前简讯:算力“降碳” 绿色数据中心建设加速

工作人员在中国联通贵安数据中心微模块机房进行巡检,新华社记者陶亮摄

2023-07-06

科学家首次演示“量子数字支付”

奥地利维也纳大学科学家设计了一种无条件安全的系统,将现代加密技术与

2023-07-06

全球热议:洪山区政府采购中心推行“基本资格条件一张承诺函”

洪山区政府采购中心推行“基本资格条件一张承诺函”---洪山区政府采购

2023-07-06

全球新资讯:机油盖密封不好后果(宝马机油盖在哪个位置?)

相信大家对机油盖密封不好后果,宝马机油盖在哪个位置?的问题都很疑惑

2023-07-06

资讯

胡松辉:澳门特区正在努力争取承办CBA赛事

昨晚,第六届粤澳杯第二回合的比赛在恩平体育中心落下帷幕,广东队以89∶77赢下比赛。两回合比赛,广东队以177∶160的优势获得本届比赛的冠

2022-07-08     
北京推出14条秋游文化线路

金秋时节,北京市文化和旅游局以赏银杏品文化为主题,推出14条“叶落的季节——漫步北京赏银杏品文化主题线路”,邀市民和游客以步行、骑行

2021-10-27     
基因编辑发力 培育高质量人源化供体猪

此次人体试验,仅仅验证了基因编辑猪克服异种器官移植的超急性排斥反应,还需解决延迟性排斥反应、消耗性血栓等问题。但通过这次试验,能更

2021-10-27     
中国经济高质量发展步伐稳健 长期向好基本面未变

在全球疫情走势和经济走势趋于复杂的背景下,中国经济巨轮将驶向何方,举世关注。2020年10月26日至29日,党的十九届五中全会在京举行,明确

2021-10-27     
南美解放者杯决赛允许近4.5万观众入场

南美洲足联主席多明格斯25日与今年解放者杯决赛对阵的两支俱乐部负责人会晤,宣布决赛现场观众人数增加到球场容量的75%,即近4 5万人。今年

2021-10-27     
22年从警生涯 面对荣誉他说不要给我报功

9月24日,时任安徽省安庆市公安局迎江分局刑警大队大要案中队中队长周磊因在工作中激烈搏斗引发心源性猝死,倒在了工作岗位上,经医院抢救

2021-10-27