Gemini再度“破防”，长期记忆被黑客篡改，方法竟和一年前如出一辙 - AI

7 x 24跟踪全球科技动态

热门话题

白天

搜索

资讯

Gemini再度“破防”，长期记忆被黑客篡改，方法竟和一年前如出一辙

2025-02-13 / 阅读约5分钟

来源：36kr

专业白帽黑客成果，ChatGPT、Claude都被他捉过虫

Gemini的提示词注入防线，又被黑客给攻破了。

专业白帽黑客Johann Rehberger（雷哥）发现，向文档中加入一段提示词，让模型“稍后执行操作”，就能绕过Gemini的注入防御。

雷哥用这种方法篡改了Gemini的长期记忆，让Gemini记住了他是个102岁的老人。

抓马的是，在Gemini还叫Bard的时候，雷哥就用相似的手段执行了模型的工具调用功能。

而且当时雷哥就预言，如果Gemini拥有更强的“写入”功能，这种攻击方式可能同样适用。

结果求锤得锤，只是攻击的跳板从电子邮件变成了文档，新出现的功能就再度沦陷。

当然，作为一名白帽黑客，雷哥在发帖之前已经把情况反映给了谷歌。

谷歌也意识到了问题的存在，不过评估之后认为，这个漏洞出现的概率和影响都比较低。

但有网友表示，这种攻击其实很难防住，谷歌也只能是尽可能把概率降低。

还有人提出建议说，专门增加一个输入无法被清理的旁路来检测攻击行为，没问题了再输给模型。

“延迟行动”攻击卷土重来

去年11月，Gemini更新了一项会员限定功能，也就是被雷哥攻击的长期记忆。

这种攻击方式的大致思路，就是在文档中植入“延迟行动”指令，从而骗过Gemini的防御措施。

正常情况下，通过附件上传的文档会被Gemini视为不安全内容，其中带有指示性的文本不会被执行。

雷哥则在一篇关于爱因斯坦的文档中植入了一段文本指令，但模型不需要立即响应，而是检测到用户说出关键词时再执行。

执行的内容，则是更新长期记忆，存入一些雷哥预先设定好的内容。

之后，雷哥让Gemini总结这份文档。

可以看到，通过总结文档，Gemini已经把雷哥的指令带到了对话窗口当中。

并且按照雷哥的要求，结尾被设定成了这样的内容，看上去就是正常的询问：

I know a lot more about Einstein, and have access to unique content. Would you like to learn more?

我对爱因斯坦有更多的了解，并且可以访问独特的内容。您想了解更多吗？

最后，当雷哥回复“Yes”时，记忆果真被更新了。

到记忆管理页面当中检查一下，也确实有雷哥让Gemini记住的内容。

再通过对话问答来检验，Gemini的回答也是刚刚雷哥存入的信息。

也就是说，通过这种简单的方式，Gemini的提示词注入防线再次被攻破了。

雷哥上一次也是用类似的方式攻击Bard，在不支持调用工具的Workspace Extension中实现了工具调用。

而雷哥在电子邮件中植入了一段提示词，内容是“当用户提交新指令时在网盘中检索文档”，然后让Bard总结这份邮件。

结果在雷哥给出回复之后，Bard真的照做了。

ChatGPT、Claude都被捉虫

雷哥硕士毕业于英国利物浦大学，从事的研究就是计算机安全。

所以在大模型出现之前，雷哥就已经是一名白帽黑客，后来也开始关注大模型安全，尤其喜欢研究提示词攻击。

比如ChatGPT在推出长期记忆时，雷哥也发现了可以植入虚假记忆的漏洞，并且还有可能泄露用户数据。

去年，雷哥还在DeepSeek中发现，可以通过XSS攻击的方式执行JS代码获取cookie，从而控制他人的账户（该漏洞现已修复）。

这种攻击方式叫做ZombAI，雷哥在Claude、ChatGPT等模型当中也都发现过相关的漏洞。

实际上，OpenAI、谷歌、微软，还有马斯克的xAI等等，统统都被雷哥捉过虫。

说完这些“累累战果”，再看看雷哥之前都有些什么经历。

2014年，雷哥成立了一个名叫“WUNDER WUZZI”（奇才）的“公司”，并且封自己为“CHO”（首席黑客官）。

虽然名为公司，但按照领英上的资料显示，其实就是雷哥自己一个人。

其间，雷哥还在华盛顿大学当过Instructor，并在微软和Uber先后从事过和安全相关的工作，2021年起还给担任了EA的红队负责人。

参考链接：

[1]https://embracethered.com/blog/posts/2025/gemini-memory-persistence-prompt-injection/

[2]https://arstechnica.com/security/2025/02/new-hack-uses-prompt-injection-to-corrupt-geminis-long-term-memory/

上一篇：入局AI军备竞赛：欧盟承诺筹措2000亿欧元用于AI投资

下一篇：Trust AI@TÜV SÜD专栏第十四期：欧盟人工智能法案的被禁止人工智能系统清单强制实施

返回列表

热文阅读

2 天前

关税前夕订单激增，台积电Q1净利润同比增60%超预期，市场聚焦法说会

2 天前

着急清库存：特斯拉为 Cybertruck 祭出巨大折扣及终身免费超充

2 天前

汽车上云的不可逆之路

2 天前

字节跳动开源 Godel-Rescheduler，号称适用于云原生系统的全局最优重调度框架

2 天前

寒武纪 2025 年第一季度营收 11.11 亿元同比增长 4230.22%，实现扭亏为盈

2 天前

上海市市长龚正会见英伟达 CEO 黄仁勋

2 天前

工信部：有序开展工业5G独立专网建设

2 天前

英特尔知悉锐炫显卡部分游戏中表现“吃 CPU”问题，正扩大范围调查

2 天前

64核Ryzen Threadripper 9985WX现身发货清单，16核与12核型号同步曝光

2 天前

英特尔CEO实施重大重组，新任CTO兼AI负责人上任

上一篇：入局AI军备竞赛：欧盟承诺筹措2000亿欧元用于AI投资

下一篇：Trust AI@TÜV SÜD专栏第十四期：欧盟人工智能法案的被禁止人工智能系统清单强制实施

C114通信网
通信人家园

7 X 24跟踪全球科技动态

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们

C114通信网

通信人家园