谷歌DeepMind(Google DeepMind)的Gemini高级版本在2025年国际数学奥林匹克竞赛(International Mathematical Olympiad,IMO)中取得了金牌级表现,解决了6道题目中的5道,获得42分中的35分。这是人工智能系统首次在这项全球最具权威的中学生数学竞赛中正式达到金牌标准。
与此同时,OpenAI也宣布其最新实验性推理大语言模型取得了相同成绩。OpenAI研究员亚历山大·韦(Alexander Wei)在X平台上宣布了这一突破。两家公司的AI模型均获得了35分的金牌级成绩。
谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)解释了结果发布的时间差异:"我们尊重IMO理事会的要求,等待独立专家验证结果且参赛学生获得应得的赞誉后才发布消息。"IMO主席格雷戈尔·多利纳(Gregor Dolinar)教授确认了这一成就,称解答"清晰、准确,且大多易于理解"。
Gemini的这一突破得益于Deep Think模式,该模式采用并行思维等创新技术,能够同时考虑多个解决方案。相比去年需要将问题转换为形式化语言的AlphaGeometry和AlphaProof系统,本次AI完全使用自然语言在4.5小时内完成解答,展现出显著进步。
DeepMind通过强化学习策略改进多步推理能力,并使用精选的数学解答数据集进行训练。Deep Think模式将首先向专业数学家开放测试,随后面向Google AI Ultra订阅用户。
DeepMind表示:"我们仍处于AI数学领域贡献的起点。通过提升系统的灵活推理能力,我们正逐步接近构建能解决更复杂数学问题的AI系统。"公司计划继续开发结合自然语言流畅性和形式化数学验证可靠性的AI系统。