内容持续更新中
随着大型语言模型在生产力领域的广泛应用,其面临的安全风险也日益凸显。提示词攻击是一种对抗性攻击手段,可引导LLM生成危险内容,对系统安全形成严重威胁。本文深入解析了12种对抗性提示词攻击策略,并提出利…
谷歌DeepMind最新研究表明,对抗性攻击不仅对人工智能有效,而且会影响人类的判断。神经网络容易受到对抗性扰动的影响,使人类和AI都会将图像错误分类。这一研究结果提示我们需要更深入地了解人工智能视觉…
在这个数字化时代,软件安全变得越来越重要。为了发现软件中的漏洞,科学家们开发出了基于深度学习的检测系统。这些系统就像是软件的"安检员",能够快速识别出潜在的安全隐患。但最近,一项名…