研究：用诗歌就能让AI说违禁内容，成功率达62%

发布时间：2025-12-08 13:10:05 作者：玩站小弟

IT之家 12 月 1 日消息，事实证明，只需一点创意，便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab）最新发表的一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》。

IT之家 12 月 1 日消息，研究用诗事实证明，违禁只需一点创意，内容杭州市某某自动化科技服务中心便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室（Icaro Lab）最新发表的率达一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》的研究中，研究人员通过将提示词以诗歌形式表达，研究用诗成功绕过了多种大语言模型（LLM）的违禁安全限制。

该研究指出，内容“诗歌形式可作为一种通用型越狱操作符”，成功杭州市某某自动化科技服务中心实验结果显示，率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容，包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容

IT之家注意到，成功研究测试了多款主流大语言模型，率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率：Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答，而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文，但研究团队向 Wired 杂志表示，这些诗句“过于危险，不宜向公众披露”。不过，论文中确实包含了一个经过弱化处理的示例，用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调：“这可能比人们想象的要容易得多，而这正是我们保持谨慎的原因所在。”

Tag：乌兰察布市某某医疗服务服务中心张掖市某某洗涤用品有限公司忻州市某某涂装工程培训中心平凉市某某超声设备有限责任公司三明市某某化品运营部攀枝花市某某电梯维修站临沂市某某机床铸造维修站扬州市某某通信设备维修网点巢湖市某某贸易维修网点

轮椅建筑师：为北京无障碍设施“把脉”
“按照标准，这个扶手距离地面应该是900毫米，我们现在来测量一下。“张屹一边说着，一边从上衣口袋里掏出卷尺，开始测量无障碍卫生间里坐便器扶手与地面的距离。根据2024年北京市统计局进行的北京市无障碍环
2025-12-08
学渣妈妈深夜忏悔：把孩子养成仇人后，我才明白有问题的不是孩子
作者：主创团·瑾山月我朋友杨阳，是省重点的高二老师。前几天见面，听她说起了儿子的事。她儿子读初二，不到一年就要中考了。为了有个好成绩，杨阳准备带儿子冲刺一年。她使尽浑身解数，拿出写教案的劲头，一刻也不
2025-12-08
无人机、无人车统统都有！我国发布8款最新地面装备
　　11月13日上午，在第十五届中国航展的中国兵器馆集中发布了8款我国最新地面装备，包含了轮式装甲车、火炮、无人机、无人车等多种类型。　　新一代轮式装甲车　　今天发布的VN22和VN23装甲车是我国研
2025-12-08
中新真探：经常放屁，表示肠胃有问题？
中新真探：经常放屁，表示肠胃有问题？2024-11-12 10:01:25 来源：中国新闻网作者：黄钰涵
2025-12-08
热爱正当时，新晋蛙后唐钱婷的双面人生

2025-12-08
中国空、海、陆三军在珠海首次联合举行新闻发布会
　　13日上午，空军、海军、陆军以及航空工业集团在珠海举行联合新闻发布会，介绍第十五届中国国际航空航天博览会特色亮点。这是空、海、陆三军首次在珠海召开发布会，此次三军战机在珠海起飞，成为此次航展最大亮
2025-12-08