内容持续更新中
DeepMind 的研究人员通过研究发现,大型语言模型容易出现阿谀奉承行为。为了解决这个问题,他们使用了简单的合成数据干预技术,并成功地减少了阿谀奉承行为的发生。研究结果显示,通过简单的合成数据微调可…