OpenAI与谷歌AI双双摘得IMO金牌

OpenAI和谷歌DeepMind（Google DeepMind）近期宣布，他们的人工智能模型在2025年国际数学奥林匹克竞赛（IMO）中均获得金牌水平的成绩。IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一，此次结果凸显了人工智能系统的快速发展，同时也显示两大科技巨头在AI领域实力相当。

各大人工智能公司正在激烈竞争公众影响力。这场影响力之争对吸引顶尖人工智能人才具有重要意义，特别是对于具有竞赛数学背景的研究人员而言，IMO这样的基准测试具有特殊价值。

去年，谷歌使用需要人工转换问题格式的"形式化"系统在IMO中获得银牌。今年，OpenAI和谷歌都采用了能够直接理解问题并用自然语言生成证明的"非形式化"系统参赛。两家公司表示，他们的AI模型成绩超过了大多数参赛高中生和谷歌去年的模型水平。

在接受科技新闻网站TechCrunch采访时，两家公司的研究人员认为，这些金牌级表现代表AI推理模型在非验证性领域取得重大突破。尽管AI模型在数学或编程等明确答案的领域表现出色，但在购物推荐或复杂研究等模糊性任务上仍面临挑战。

谷歌对OpenAI的成绩发布提出质疑。谷歌DeepMind的CEO和研究人员在社交媒体上指出，OpenAI在周五晚IMO颁奖典礼后过早宣布结果，且未经IMO官方评估。

谷歌DeepMind高级研究员汤隆（Thang Luong）表示，谷歌自去年即与IMO组织方合作，直到获得IMO主席认可和官方评分后才于周一上午公布结果。他强调："IMO组织方有其评分标准，任何未遵循该标准的评估都不能声称达到金牌水平。"

OpenAI高级研究员诺姆·布朗（Noam Brown）解释说，他们聘请了三位了解评分系统的前IMO获奖者进行评估。在得知获得金牌成绩后，公司遵循IMO要求，等到颁奖仪式结束后才发布消息。

尽管谷歌的评估过程更为正式严谨，但更重要的是：领先AI实验室的模型都在快速进步。在今年的IMO中，仅有极少数优秀学生能达到这两家公司AI模型的水平。

虽然OpenAI曾在业界占据领先地位，但当前的竞争格局已远比各公司愿意承认的更为激烈。随着OpenAI计划在未来几个月发布GPT-5，该公司显然希望维持其行业领导者的形象。