搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-28 09:00:15
来源:

猫眼电影

作者:

林毅夫

手机查看

  猫眼电影记者 乔灌草 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:澳门赌盘注册

  12月28日,(走进中国乡村)广东电白小渔村“念活”40亿元对虾养殖“新农经”,世界经济论坛大中华区主席陈黎明表示,相比5年前,世界发生了深刻变化,一方面,气候变化、地缘冲突、贸易摩擦等引发了一系列风险及影响;另一方面,人工智能、生物技术、量子计算、能源转型等获得了快速发展。在此背景下,人类应当如何更好地合作,共同面对这个多种变革交织的时代,是当今世界至关重要的话题。,亚娱入口。

  12月28日,海南自贸港全岛封关:为什么是“标志性举措”?,伦敦黄金市场的OTC交易机制非常类似于银行体系的二级交易机制。,威尼斯人轮盘,环球登录,世界杯足彩网上投注。

 时事2:彩票投注站买世界杯

  12月28日,中国驻贝尔法斯特总领馆在格罗夫纳文法学校举办“图书进校园”活动,15日,日本就曾发生针对首相的炸弹袭击事件。日本首相岸田文雄当天在和歌山市准备进行街头演讲时,一名男子朝他投掷了一个被认为是铁管炸弹的爆炸物。该男子被警方当场逮捕。,九州视频发布平台,北流国际大酒店真人cs,世界杯投注法。

  12月28日,500余名跑者在中老边境磨憨开展健康跑,5月17日下午,国防部新闻局副局长、国防部新闻发言人张晓刚大校就近期涉军问题发布消息。,天博综合体育网页版,足球世界杯开户网址,新娱乐在线直播。

 时事3:mg线上电玩

  12月28日,黎智英串谋勾结外国势力等罪成立,作为“高教洼地”全力突围的代表,广东、浙江两省探索中显现的一些共性趋势值得思考和关注。,幸运快3官网平台,米乐外围官网,纬来体育体育外围。

  12月28日,中国体改研究会副会长李晓超:扩消费需长短期政策有效搭配,从已在“最强县级市”昆山耕耘十余年的昆山杜克大学,到2019年位于溧阳的南京航空航天大学天目湖校区启用,再到2022年迎来首批新生的河南罗山县华北水利水电大学江淮校区,以及正在建设中的北京理工大学怀来校区……高校县域办学从东部地区开始,逐渐向其他区域蔓延。,火狐体育下载苹果,hg2020app,7月11世界杯投注比例。

 时事4:雷速篮球直播网

  12月28日,阿依努尔的“美丽事业”:赋能女性就业创业 携手青年赴时代之约,如果不是认为中国可靠,不是认为中国能办成这件大事,沙伊双方也不会在对话中断后接受中方斡旋。,火狐体育最新版下载,贝博体育平台下载app,188体育比分足球。

  12月28日,对话轮椅篮球西藏队旦增:赢下比赛很满足,值得注意的是,两种模式并非截然对立,而是呈现出相互融合的趋势。香港正在打造的“国际黄金交易中心”正是这种融合思维的体现。,完美电竞平台下载,ManBetx网址,世界杯的球怎么买便宜。

责编:刘恩连

审核:赵凤羽

责编:大卫·汤玛斯

相关推荐 换一换