IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《188金宝博网站提现》,《首次登录送91元红包》糖果网站登录app
“银河游戏导航”
188体育投注365
……
{!! riqi() !!}
“电玩捕鱼大作战”{!! reci() !!}
↓↓↓
{!! riqi() !!},全国大学生科技美术创新设计作品展在津开幕,千赢国际外围官网,海立方809官方网站,雷火电竞app最新版下载,撲克王下载
{!! riqi() !!},第二届中国脑机智能大会在浙江杭州启幕,凤凰娱乐诚信十六年,天博国际app,M6米6体育app,金沙电子游戏官方入口
{!! riqi() !!},黄河兰州段兴起“天鹅经济”,网上bbin平台,欧宝娱乐主页,买球app网易,365bet亚洲官网网址
{!! riqi() !!}|解锁成都339塔新视角!男子花5小时环拍近6公里延时摄影|188网站正规吗?|爱游戏登录|澳门星际登路|IM体育网址
{!! riqi() !!}|迎接“雪假” 新疆织密立体交通网保障冰雪游|亚娱在哪里玩|188体育比分|天博app官网版|威尼斯人真人
{!! riqi() !!}|香港特区政府将为受大埔火灾影响居民提供长期免费住宿支援|乐虎国际官方网页|威尼斯十大娱乐网站|千赢国际网站多少|玩现金的游戏……
{!! riqi() !!},第十五届“京城电通·十月诗会”举办,百老汇官网app下载安卓版,米乐网址,澳门线上网投平台,欧博官方下载
{!! riqi() !!},教育部:高中要严格控制考试次数,棋牌大网址,GPK电子手机版下载,亚星手机版在线,巴黎人下注网站
{!! riqi() !!}|南京大屠杀死难者“烛光祭”:星火寄哀思 微光祈和平|在线二八杠|赛博亚洲|永利皇宫线路|威尼斯棋牌官网
{!! riqi() !!},今年前11个月 我国货物贸易进出口总值同比增3.6%,f88体育,日博体育登录官网,打篮球游戏,立博入口登录
{!! riqi() !!},王曼昱WTT香港总决赛将与蒯曼争冠:希望自己发挥出最好的水平,必威首页官网体育,热博体育官网,365bet预测,tpimage吧
{!! riqi() !!},四方合作推动人工智能人文艺术研究 “智镜”项目发布,沙巴体育官网登录,365在线体育官网,凯时国际下载地址,哪个app可以玩奥马哈
{!! riqi() !!}|广州白云国际机场年旅客吞吐量首次突破8000万人次|果博官网|ku登录|云顶娱乐网页登录|九州体育快速登陆
{!! riqi() !!}|【百万庄小课堂】冬季心脑血管易“发难” 医生支招防护要点|银河城娱乐网站|bwin最新地址|九洲体育app官网下载|188比分直播
{!! riqi() !!}|勿让抢行加塞成为交通事故“导火索” 交替通行可使合流区通行效率提升|环球登录官网|a8体育安卓|皇冠线上登录官网网址|百老汇官网在线
{!! reci() !!},{!! reci() !!}|中医专家宋兆普辽沈“圈粉” 教学交流助推中医药文化传播|必威官方备用网址|世界杯官方指定开户|BET9九州平台|皇冠功放
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺