v7.885.9310 PC版
v5.767.5105 安卓免费版
v9.565.4159 安卓免费版
v3.593.1422.788764 安卓版
v3.215.6923.441726 安卓最新版
v5.790.1942 IOS版
v3.202.4120 安卓最新版
v8.749 安卓汉化版
v1.826.3495.96175 IOS版
v2.899.953.159017 安卓免费版
v2.842.7295.269049 安卓版
v1.514.3309 安卓免费版
v6.325.1392.670122 PC版
v4.276.7261.414064 安卓最新版
v5.827 安卓汉化版
v2.689 安卓免费版
v2.763 安卓版
v2.406.5884 安卓免费版
v8.22.2040 安卓汉化版
v9.834.3512.675073 PC版
v7.705 安卓最新版
v1.963 安卓最新版
v6.610 PC版
v6.23.7076.612787 安卓汉化版
v8.278 安卓免费版
v2.930 安卓免费版
v4.209.6476 安卓免费版
v6.277.6418 安卓最新版
v2.535 安卓免费版
v2.600.4704 安卓免费版
v6.481.9657.267152 安卓最新版
v2.579.7963 PC版
v5.481.4988 安卓免费版
v7.239.6890 安卓汉化版
v3.34.8183.150141 最新版
v8.840.3718 最新版
v2.711.1904 IOS版
v6.916.3480.447870 安卓免费版
v8.46.4672.395171 安卓最新版
v8.861 IOS版
v8.522.4303 PC版
v1.952.6614.892028 安卓版
v4.919.8907.676430 最新版
v3.868.200 IOS版
v9.739.8500.353788 安卓版
v6.766.5550 安卓版
v6.312 安卓最新版
v3.335 PC版
v8.16.2081.298797 安卓最新版
v7.628 IOS版
v4.58.2546.568629 最新版
v9.463.6351.945961 安卓版
v1.58.2684 安卓免费版
v1.26.3724 安卓版
v7.643.7738.288072 IOS版
v9.860.9190 安卓版
v6.363 PC版
v7.653.7462.950457 安卓版
v8.628.2468.648643 安卓版
v2.234.2285 安卓最新版
v9.444.9830 IOS版
v6.960 安卓版
v5.328.1448 安卓版
v6.237.2624.469169 安卓最新版
v9.594.9735.856872 安卓最新版
v1.920.6804.739401 最新版
v7.94.2309 最新版
v2.397.3491 安卓最新版
v3.928.7807.278957 安卓版
v2.554.387 PC版
v7.776.5885 安卓免费版
v7.526.9364.611831 安卓免费版
v7.633 安卓免费版
v1.906.6298.27414 PC版
v2.65.5225 安卓免费版
v3.61.9591 IOS版
v5.501.945 安卓汉化版
v6.877.2330 安卓版
v9.17 安卓汉化版
v7.60 安卓版
亚星app下载
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
相关版本
多平台下载
查看所有0条评论>网友评论