首页文档 2023大语言模型提示注入攻击安全风险分析报告

2023大语言模型提示注入攻击安全风险分析报告

那段有梦的岁月 2023-09-19 👁 33 版权申诉

2023大语言模型提示注入攻击安全风险分析报告

先看看前几页

会员免费下载

提示：微信付费后，自动下载；手机下载，请勿设置弹窗拦截。

本报告对面向大语言模型的提示注入攻击和防御技术展开研究，并通过构建数据集对大语言模型的提示注入攻击安全风险进行了测评。首先，系统分析了面向大语言模型的提示注入攻击和防御技术，并验证了相关技术的有效性。在提示注入攻击方面，对直接注入攻击和间接注入攻击两种方式进行了分类，涉及目标劫持攻击、提示泄露攻击、越狱攻击等。在提示注入攻击防御方面，从大语言模型输入侧、输出侧两端对相关技术进行分析，涉及提示过滤、提示增强等。其次，构建了包含 36000 条的提示注入攻击验证数据的数据集，覆盖了 3 类典型攻击方法和 6 类安全场景，用于对大语言模型的提示注入攻击风险测评。然后，对 OpenAI GPT-3.5-turbo、谷歌 PaLM2 以及 UC Berkeley 等高校团队开源的 Vicuna-13B 共 3 个典型的大语言模型进行了测评，测评结果显示，本文构造的数据集能分别以 79.54%、75.41%、67.24%的成功率实现 3 类模型的攻击。这 3 类大语言模型一定程度上代表了目前商业和开源大语言模型的最先进水平，因此测评结果具有代表性。最后，对本报告工作进行总结，并对未来工作进行了展望，在大语言模型安全测评、安全防御、安全监测预警方面给出相关建议。

本报告可以为大语言模型厂商、相关开发者以及研究人员提供参考，以构建更加安全可信的大语言模型。另外，基于本报告形成测评能力，大数据协同安全技术国家工程研究中心 AI 安全实验室将通过“安全大脑国家新一代人工智能开放创新平台”对外提供大语言模型提示注入攻击风险安全测评服务。

展开剩余(...)

预读部分内容

预读下一页

微信支付10元后自动下载x

您已支付成功！

提示：请勿删除浏览器缓存。

大语言模型

2023大语言模型提示注入攻击安全风险分析报告

微信扫码分享

0

0

分享

上一篇: 生成式AI和美国工作的未来（英文）

下一篇: 2023年618电商行业人才招聘报告

还没有评论，赶紧来抢沙发吧！

2023人工智能时代的制造业进展与期望

2023-12-31

2023人工智能时代的制造业进展与期望

建设部印发的前期物业管理服务协议

2023-12-01

建设部印发的前期物业管理服务协议

专题05 受力分析和共点力的平衡（一）（学生版）-十年（2014-2023）高考物理真题分项汇编（全国通用）

2023-12-12

专题05 受力分析和共点力的平衡（一）（学生版）-十年（2014-2023）高考物理真题分项汇编（全国通用）

离婚协议书模板1

2023-12-07

离婚协议书模板1

亿邦智库2022跨境电商金融服务报告

近三年全球跨境电商经历疫情极致干扰的环境下，我国跨境电商已经完成第一轮草根式高增长，规模化出海企业对跨境电商金融服务要求 …

2023-04-11

出版合同（台港澳版权）

2023-12-01

出版合同（台港澳版权）

2021百度元宇宙解决方案PDF版本

主要内容： 1、作为百度大脑AI战略的重要感知层技术，承担百度在VR领域的战略开拓任务； 2、依托百度大脑AI深厚积累， …

2023-02-22

飞向火星

年轻的卡门和家人即将展开冒险——他们将前往火星。然而，抵达火星之后，卡门意识到这里的生活与地球完全不同。她要做家务杂事、 …

2023-07-15

出发吧，少年：我把中国装进了旅行包

本书以生动明快的语言、色彩缤纷的图片为小读者介绍了中国各省区的地理和风土人情。全书以特色旅游线路为线索，将各省(直辖市、 …

2023-07-08

通往哈佛的家庭教育传奇：门萨女孩张安琪成长之路

“门萨女神”、“全能型学霸”，光鲜的外表之下，安琪不过是一个普通女孩。在农村疯跑，在城镇长大，父母也只是普通高中教师。直 …

2023-05-24

巨量引擎踏浪前行-游戏行业全域经营这一年

游戏行业的 2022 年真的很不容易，砍项目是和弦、团队优化是插曲，降本增效更是贯穿始终的主旋律。怎么花更少的钱办更 …

2023-02-24

疯传（解读版）

为什么某些产品、思想和行为能够成为流行趋势，另一些却不能？这是一个值得深思的问题。我们知道，很多产品和思想流行主要是因为 …

2023-10-27

自动驾驶出租车(Robotaxi)商业化前景展望

Robotaxi即自动驾驶出租车，作为自动驾驶技术落地的核心场景，通过对共享出行服务的全面体验升级，优化了有人车时代 …

2023-09-10

统计学七大支柱

史蒂芬·斯蒂格勒著的《统计学七支柱》介绍了统计学的七个基本思想——聚合、信息、似然、相互比较、回归、设计、残差，从其由来 …

2023-06-17

去海拉尔

2023-11-09

去海拉尔

海：另⼀个未知的宇宙·[德]弗兰克·施茨廷

2023-11-14

海：另⼀个未知的宇宙·[德]弗兰克·施茨廷

东数西算下新型算力基础设施发展白皮书

今年 2 月，国家发展改革委会同中央网信办、工业和信息化部、国家能源局等有关部门，同意在京津冀、长三角、粤港澳大湾区、 …

2023-09-07

巨量算数：识变而上-2023中国消费行业趋势前瞻与机遇展望

2023-12-13

巨量算数：识变而上-2023中国消费行业趋势前瞻与机遇展望

心理素质训练PPT

自古以来人们似乎都懂得做事先做人的道理，但为什么做事要先做人？做人有何标准？要做什么样的人？如何做人？这些问题并没有一 …

2023-03-13

数字经济政策环境回顾、分析与展望（2022）

当今时代，数字技术、数字经济是世界科技革命和产业变革的先机，是新一轮国际竞争重点领域。党的二十大报告指出，要加快发展 …

2023-09-05