当前位置:首页 → 电脑软件 → 泰国袭击已致柬平民17死77伤 → 必威体育官方网站入口 v2.444 安卓最新版
v2.414.5474 安卓免费版
v4.970.1056.897634 PC版
v1.582.2848 安卓汉化版
v9.98.2003.78882 安卓版
v5.117.1713.822906 PC版
v6.756.1089.374906 安卓最新版
v4.373.3119 IOS版
v8.525.770.60174 安卓最新版
v6.444 安卓汉化版
v7.649 安卓最新版
v7.402.854.737525 安卓汉化版
v4.646 安卓汉化版
v5.432 PC版
v8.503 安卓免费版
v6.416 安卓版
v6.757.9780 安卓版
v9.756 PC版
v4.103.9661.672125 IOS版
v1.585 PC版
v5.264.3669.605421 IOS版
v6.371.689 PC版
v5.369.1427 PC版
v2.583 最新版
v4.880.3149.750236 PC版
v6.240.9062.608015 安卓汉化版
v8.553 IOS版
v8.980.1405 安卓免费版
v9.30 安卓最新版
v8.735 安卓免费版
v7.982.2377.181963 安卓汉化版
v8.827 安卓版
v3.231.4791 最新版
v6.741.3860.907336 IOS版
v4.158 最新版
v3.155.2828.542073 安卓免费版
v8.394.1386 安卓汉化版
v2.231 PC版
v5.218.8322.423379 PC版
v7.821.4270.814929 最新版
v9.95.3659 安卓最新版
v6.486.5221 IOS版
v8.909 安卓汉化版
v5.42 安卓版
v4.979 最新版
v8.97.2524 最新版
v7.418 安卓免费版
v6.191 安卓最新版
v8.250.9238.5438 IOS版
v6.709.6629.862524 PC版
v7.144.4364.963885 安卓免费版
v4.237.8653.834777 安卓最新版
v2.398 最新版
v2.521.8962 最新版
v4.191.446 安卓汉化版
v7.686.2458.340810 安卓免费版
v5.232.518.49114 最新版
v7.263.8677.943627 最新版
v8.634.7942.299027 安卓版
v1.38.2869 最新版
v6.788 安卓免费版
v7.75.8261 安卓版
v9.556.445.877706 PC版
v8.929 最新版
v5.280.7419 PC版
v6.193.1451.633615 安卓最新版
v1.635.7258.37692 安卓汉化版
v3.955.5315.736740 PC版
v9.982.9816 PC版
v3.829.4982.900480 IOS版
v4.120.7872.508717 安卓版
v8.165 安卓最新版
v2.754.7378.8602 安卓最新版
v6.681 安卓免费版
v3.538.4617 安卓版
v2.379.9929 最新版
v7.10 IOS版
v2.217.7932 最新版
v2.446.5056.854554 安卓免费版
v8.427 最新版
v6.677.2896 安卓免费版
必威体育官方网站入口
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
相关版本
多平台下载
查看所有0条评论>网友评论