episode 5 - 搜索 News

53 分钟

强化学习成帮凶，对抗攻击LLM有了新方法

他们发现，当把对手建模成强化学习智能体时，其就能学习到哪些扰动最能欺骗模型。一旦学会了策略，对手就会使用该策略生成对抗样本。因此，对抗性智能体无需昂贵的梯度优化即可完成对模型的攻击。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果