谷歌DeepMind的AI系统在最新的国际数学奥林匹克竞赛(IMO)上取得了惊人的成绩。
就在刚刚,谷歌DeepMind最新的数学模型捧得了IMO奥数银牌!它不仅以满分成绩做出了6道题中的4道,距离金牌只有1分之差,而且在第4题上只用了19秒,解题质量和速度惊呆了评分的人类评委。





程序能够提出这样一个非显而易见的解法,实在令人印象深刻,远超出我对当前技术水平的预期。




值得一提的是,这些问题首先会被人工翻译成正式的数学语言,然后才会投给AI。
P1









P2








P4





P6










AlphaProof和AlphaGeometry 2,是在形式化证明和特定领域的符号引擎上完成训练。在某种程度上,它们在解决专业的奥林匹克竞赛问题更出色,即使它们基于通用LLM构建的。 而GPT-4o的训练集中,混杂了大量的GitHub代码数据,可能远远超过数学数据。在软件版本中,「v9.11 > v9.9」,可能严重扭曲了数据分布。因此,这个错误在某种程度上是可以理解的。


这一次的竞赛不仅展示了AI在数学推理领域的巨大潜力,还引发了人们对人工智能在未来挑战和机遇的广泛讨论。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则