OpenAI和谷歌DeepMind(Google DeepMind)近期宣布,他们的人工智能模型在2025年国际数学奥林匹克竞赛(IMO)中均获得金牌水平的成绩。IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一,此次结果凸显了人工智能系统的快速发展,同时也显示两大科技巨头在AI领域实力相当。
各大人工智能公司正在激烈竞争公众影响力。这场影响力之争对吸引顶尖人工智能人才具有重要意义,特别是对于具有竞赛数学背景的研究人员而言,IMO这样的基准测试具有特殊价值。
去年,谷歌使用需要人工转换问题格式的"形式化"系统在IMO中获得银牌。今年,OpenAI和谷歌都采用了能够直接理解问题并用自然语言生成证明的"非形式化"系统参赛。两家公司表示,他们的AI模型成绩超过了大多数参赛高中生和谷歌去年的模型水平。
在接受科技新闻网站TechCrunch采访时,两家公司的研究人员认为,这些金牌级表现代表AI推理模型在非验证性领域取得重大突破。尽管AI模型在数学或编程等明确答案的领域表现出色,但在购物推荐或复杂研究等模糊性任务上仍面临挑战。
谷歌对OpenAI的成绩发布提出质疑。谷歌DeepMind的CEO和研究人员在社交媒体上指出,OpenAI在周五晚IMO颁奖典礼后过早宣布结果,且未经IMO官方评估。
谷歌DeepMind高级研究员汤隆(Thang Luong)表示,谷歌自去年即与IMO组织方合作,直到获得IMO主席认可和官方评分后才于周一上午公布结果。他强调:"IMO组织方有其评分标准,任何未遵循该标准的评估都不能声称达到金牌水平。"
OpenAI高级研究员诺姆·布朗(Noam Brown)解释说,他们聘请了三位了解评分系统的前IMO获奖者进行评估。在得知获得金牌成绩后,公司遵循IMO要求,等到颁奖仪式结束后才发布消息。
尽管谷歌的评估过程更为正式严谨,但更重要的是:领先AI实验室的模型都在快速进步。在今年的IMO中,仅有极少数优秀学生能达到这两家公司AI模型的水平。
虽然OpenAI曾在业界占据领先地位,但当前的竞争格局已远比各公司愿意承认的更为激烈。随着OpenAI计划在未来几个月发布GPT-5,该公司显然希望维持其行业领导者的形象。