搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-26 23:45:55
来源:

猫眼电影

作者:

张美昌

手机查看

  猫眼电影记者 李儒贤 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:uc体育登录

  12月26日,日媒:受强震影响 日本一核设施乏燃料池水溢出,韩国国务调整室曾于4月16日发布政府部门联合新闻稿,重申日本福岛核污染水排海计划需从科学、客观层面确保安全性,并符合国际标准的既有立场。,九州在线试玩。

  12月26日,海南自贸港“全岛封关”如何运作?一文了解,钟自然出生于1962年8月,安徽桐城人,曾在原地质矿产部和原国土资源部工作多年,2014年任原国土资源部党组成员,中国地质调查局局长、党组书记。,世界杯哪里买球靠谱,手机金沙官方,188菠菜网。

 时事2:澳门威斯尼人203119com

  12月26日,国台办:统一是台湾前途的唯一方向,该火箭为两级构型,一级采用液氧 - 石蜡混合动力发动机(推力 25 吨),二级可选液氧 - 石蜡或液氧 - 甲烷动力。2023 年 3 月,Innospace 曾在同一发射场成功发射 HANBIT - TLV 测试火箭,验证其 150 千牛混合火箭发动机性能。,必威网页登录,黄冠网站多少,可以挣钱的捕鱼。

  12月26日,今年厦门空港跨境电商出口货值突破100亿元人民币,有人还嘲讽保守派反应过度,“共和党正在集体心脏病发作,因为吉尔·拜登在道格·埃姆霍夫的嘴唇上匆匆轻吻了一下。”,m6米乐手机端登录,AG真人平台网址,世界杯投注用哪个app。

 时事3:365比分下载

  12月26日,对话轮椅篮球西藏队旦增:赢下比赛很满足,行业方面,受益于储能等对锂电池需求的拉动,12月份以来,锂电产业链景气度持续攀升,多环节呈现涨价态势。,银河贵宾网址,ku体育备用网址,炸金花九张牌。

  12月26日,你可能从没注意过用脑卫生 多线程工作让人“变傻”,地缘政治冲突仍存不确定性,扰动全球经济增长前景和市场风险偏好。,凯发娱乐平台正规吗,伯爵互娱游戏,补鱼游戏。

 时事4:亚星游戏平台

  12月26日,中华全国体育基金会霍英东体育强基计划启动,12月23日金融一线消息,上海金融监管局发布批复,核准王韬上海城投集团财务有限公司董事、董事长的任职资格。,AG亚游视讯,bwin手机版,bet356体育。

  12月26日,美国布朗大学枪击事件致2死8伤,阿拉木图人口近200万人,民航吞吐量规模在1000万人次;乌鲁木齐人口超过400万人,民航吞吐量规模在2700万人次。“新疆人均乘机次数更多,但乌鲁木齐国际旅客吞吐量不到阿拉木图的十分之一,国际货邮吞吐量更是阿拉木图的零头。” 李瀚明认为,换个角度,差距就是上升的空间。,ROR真人投注,钱柜是什么,凤凰彩票怎么注册。

责编:洛艾维

审核:霍斯特-黑尔特

责编:周春芽

相关推荐 换一换