内容持续更新中
在人工智能的世界里,机器学习模型尤其是大型语言模型(LLMs)的推理能力一直是科学家们关注的焦点。 最近,苹果公司的AI研究团队发表了一篇论文,题为《理解大型语言模型在数学推理上的局限性》,为我们揭开…
在人工智能的浩瀚宇宙中,数学曾被视为机器智能最后的堡垒。如今,一个名为FrontierMath的全新基准测试横空出世,将AI的数学推理能力推向了前所未有的极限。 Epoch AI携手60多位数学界顶级…
今天,阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸,性能表现均显著优于同类的开源过程奖励模型,尤其是在识别推理错误方面表现…
近日,360智脑团队宣布成功复现Deepseek的强化学习效果,并正式发布开源推理模型 Light-R1-14B-DS。该模型性能表现超越 DeepSeek-R1-Distill-Llama-70B和…