内容持续更新中
随着大型语言模型在生产力领域的广泛应用,其面临的安全风险也日益凸显。提示词攻击是一种对抗性攻击手段,可引导LLM生成危险内容,对系统安全形成严重威胁。本文深入解析了12种对抗性提示词攻击策略,并提出利…