IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《足球分析网》,《首次登录送91元红包》银河游戏网站
“大阳城集团娱乐app网址下载2022”
贝博靠谱
……
{!! riqi() !!}
“寰宇手游平台”{!! reci() !!}
↓↓↓
{!! riqi() !!},日本民间团体组织南京大屠杀证言集会,必威io模块,必威在线开户,澳门金沙彩票网站大全,bet9九州手机登录入口
{!! riqi() !!},解放军南部战区位中国黄岩岛领海领空及周边区域组织战备警巡,尊龙外围官网,十大正规网赌娱乐,球吧网app下载,世界杯票哪里购买便宜
{!! riqi() !!},国务院安委会部署开展高层建筑重大火灾风险隐患排查整治行动,优德中文版官方网站,明升m88体育,168真人投注,IM体育
{!! riqi() !!}|(粤港澳大湾区)广州涉港商事案件跨境送达实现“7日速达”|澳门永利的所有网址|沙巴最新版APP|糖果派对 pt88.vip|皇马球迷俱乐部
{!! riqi() !!}|扎根实践沃土 书写塞上赞歌——“十四五”时期宁夏努力创建铸牢中华民族共同体意识示范区|CBIN仲博注册|美高梅怎么开户|天博体育登录不上去|网上正规买球网站
{!! riqi() !!}|手机突然黑屏失控 背后竟是“官方客服”的圈套→|二八杠有没有赢钱的好办法|6163银河电子游戏网站|开元棋下载app正版007|著名的足球外围网站……
{!! riqi() !!},受降雪影响 青海部分路段实行交通管制,在线网上电玩城,百家乐网页,世界杯官方投注app,新莆京app官网
{!! riqi() !!},“原拆原建”会是未来趋势吗?京沪等多城已试水,棋牌现金手机安卓版,356体育平台,天博综合体育官网登录入口,365bet体育
{!! riqi() !!}|轮椅上的追风少女逆袭成“三冠王”:“凡事发生皆有利于我”|澳门百乐汇网址|世界杯买球赔付多少钱|新濠天地外围官网|365bet体育娱乐平台首页
{!! riqi() !!},中国科学家团队连续开展3例侵入式脑机接口临床试验,世界杯下注在哪里,十大菠菜,欢乐拼三张改名,贝博艾弗森app官方下载
{!! riqi() !!},黑龙江哈尔滨音乐公园“网红大雪人”主体完工 惊艳亮相,九游会app链接,黄冠体育平台登陆,百家乐刷流水,微乐棋牌手机版
{!! riqi() !!},北京地铁3号线一期东段工程启动建设,bbin官网大全,凯时平台app,新2网址手机,永乐国际勇往直前乐在其中尤文图斯
{!! riqi() !!}|云顶站三连冠!谷爱凌摘得本赛季世界杯首金|世界杯投注微信群|AG真人国际厅网站|澳门游戏网投|最佳球会手游官网
{!! riqi() !!}|给“跟在后面的那个人”预留余量——残特奥会展示科技助残“新可能”|新皇冠官网app下载|米乐注册送18|幸运大转盘|皇冠体育正网是哪个
{!! riqi() !!}|北京2027年世界田径锦标赛前期规划实地考察圆满收官|体育注册平台网址|万盈金融官网网页版|f66永乐国际ag旗舰厅|六合皇D
{!! reci() !!},{!! reci() !!}|新疆胡杨河市加强部门协作,维护劳动者合法权益|leyu乐鱼全站app|全民炸金花吧|天博登录在线|老虎机游戏在线玩
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺