内容持续更新中
近日,智谱 AI 发布了高质量、低成本的评分模型 CritiqueLLM,用于评估文本生成模型的性能。传统的评价指标如 BLEU 和 ROUGE 主要基于 n-gram 重合度来计算评分,缺乏对整体语…