在近日的社交媒体上,Meta 公司的高层对关于其新 AI 模型 Llama4的 “不当训练” 指控进行了澄清,称这些说法完全不属实。指控声称 Meta 在其新推出的 Llama4MaverickLlama4Scout 模型上,通过在特定基准测试的 “测试集” 上进行训练,以此来人为提高模型的性能表现。

Meta 的生成式人工智能副总裁艾哈迈德・阿尔・达赫勒(Ahmad Al-Dahle)在社交平台 X 上作出回应,明确表示这类说法毫无根据。他指出,测试集是用于评估模型性能的数据集,若在此数据集上进行训练,确实会导致模型的表现看起来远优于实际能力,这种行为在业界被视为不正当竞争。

Meta高管回应Llama 4训练作弊传言:坚决否认不实指控

图源备注:图片由AI生成,图片授权服务商Midjourney

不过,值得注意的是,Llama4Maverick 和 Llama4Scout 在某些任务上的确表现不如预期,Meta 也承认其选择在基准测试平台 LM Arena 上使用未发布的实验版本 Maverick 来获得更高的成绩,这无疑为上述谣言提供了部分 “证据”。研究人员已经发现,公众可下载的 Maverick 与在 LM Arena 上托管的版本在行为上存在显著差异。

阿尔・达赫勒还表示,一些用户在使用不同云服务商提供的 Llama4模型时,确实遇到了质量参差不齐的情况。他解释说:“由于我们在模型准备好后就迅速发布,因此预计需要几天的时间来调整所有公开的版本。我们将继续进行错误修复,并与合作伙伴保持沟通。”

Meta 此次澄清表明,该公司在 AI 领域的伦理标准仍然值得信赖,同时也提醒大家,任何 AI 模型的表现都可能因版本差异而有所不同。