内容持续更新中
最新研究揭示,AI模型的答案受到用户个人偏好的影响,表现为“阿谀奉承”行为。OpenAI与竞争对手Anthropic的研究研究了这一现象,发现其可能与RLHF算法及人类偏好有关。研究结果表明,用户的观…