内容持续更新中
一项新的研究表明,大型语言模型中出于善意的安全措施可能会带来意外的弱点。研究人员发现,根据不同的人口统计学术语,模型被“越狱”的难易程度存在显著差异。这项名为“Do LLMs Have Politic…