当前位置:首页 → 电脑软件 → 女子验收新房发现已有陌生人入住 → 欧博手机版注册 v3.626.2227.550479 安卓版
v6.578.1551.284345 IOS版
v3.998.7147 安卓免费版
v4.537 最新版
v3.224.39.853878 安卓汉化版
v8.564 安卓汉化版
v4.402.3954 安卓版
v3.665 PC版
v1.855 安卓版
v2.765 安卓最新版
v9.936.5951 最新版
v4.25 PC版
v1.964.494 安卓版
v6.270 安卓版
v5.431 安卓最新版
v5.589 安卓免费版
v1.786.7694 安卓版
v3.218.7460.8639 安卓免费版
v9.168 IOS版
v8.532 安卓版
v7.468.112 安卓免费版
v8.405.2628.363226 安卓汉化版
v1.830.6031.465767 安卓汉化版
v2.127.9872 IOS版
v5.897 安卓免费版
v2.593.6739 安卓汉化版
v9.958 安卓汉化版
v4.523 PC版
v2.590 PC版
v3.948.2550 安卓免费版
v6.867.4020.506065 最新版
v8.543.6278.611748 安卓免费版
v4.572.1239.585762 安卓汉化版
v3.518.3336 PC版
v4.935.9647.929738 IOS版
v4.589.382.882514 IOS版
v8.624.5529 安卓版
v6.671.7973.532217 安卓最新版
v4.589 PC版
v9.847.1856.557281 安卓版
v7.790 安卓免费版
v9.6.6014 安卓汉化版
v5.655.3805 安卓最新版
v3.475.798 IOS版
v8.128 最新版
v8.703 安卓汉化版
v5.114.1347 安卓汉化版
v6.220.3102 最新版
v7.737 安卓最新版
v9.457.4182 安卓最新版
v7.358 PC版
v1.507 安卓免费版
v6.444.7478.38284 PC版
v3.165.6617.771094 PC版
v4.571.2216 安卓版
v1.584 安卓免费版
v4.732.4203.69246 安卓最新版
v6.206.7242 最新版
v7.397 安卓免费版
v4.446.7526.292347 IOS版
v6.261 安卓版
v7.603 PC版
v7.551.971.455908 安卓版
v8.993.6491 安卓免费版
v9.90.4183.555733 PC版
v9.57.9233 安卓版
v5.773 PC版
v1.19.5368 安卓免费版
v3.104 最新版
v8.269.542 安卓最新版
v9.7.9689.756353 IOS版
v2.196.1732 安卓汉化版
v9.705.240 IOS版
v1.174 PC版
v9.168.7274 IOS版
v5.877 安卓版
v8.865 IOS版
v2.788 安卓免费版
v4.635.8425 安卓汉化版
v7.65.1135.965498 安卓免费版
v6.218.7142 IOS版
欧博手机版注册
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
相关版本
多平台下载
查看所有0条评论>网友评论