AI和姜萍答同一份卷结果如何？人类智慧暂胜一筹

经济观察报 2024-06-16 12:40:59

A+ A-

6月13日，第六届阿里巴巴全球数学竞赛揭晓决赛名单，亮点之一是17岁的江苏涟水中等专业学校学生姜萍，她不仅成功跻身全球前30名，更是该组别中唯一的女性选手。

AI和姜萍答同一份卷结果如何?

本届竞赛引入了新变化，首次增设AI大模型挑战赛，与姜萍等数万名全球数学爱好者同台竞技的是563支由顶尖高校、研究机构及企业组建的AI队伍。尽管AI队伍展现了一定水平，平均分达到18分，接近人类选手平均水平，但最高分34分与人类最高分113分相距甚远，无一支AI队伍进入决赛。

其中，由上海建平中学学生涂津豪设计的AI方案凭借34分夺得AI挑战赛冠军。他采用自辩论策略，让大模型进行自我问答验证，优化解题路径。西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队则分别以27分获得亚军和季军，两队均利用多个智能体协作解题，展现了不同的策略和方法。

浙江大学计算机系统结构实验室的研究员陈天楚分析指出，当前大语言模型在处理需要反复试错和深入思考的数学问题时，逻辑推理和严谨思考能力仍显不足，尚不能与受过专业训练的人类匹敌。AI阅卷点评亦强调了AI在逻辑推理和证明题方面的局限性。

一位来自互联网企业的技术总监对此表示高度关注，认为这次AI挑战赛不仅是对模型能力的检验，也是对AI深层逻辑推理及创新思维局限性的揭示。尽管AI在特定任务上能超越人类，但在复杂逻辑和创新领域，人类依然保持明显优势。

尽管AI队伍未能在此次数学竞赛中胜出人类，技术总监认为这将促进对AI本质的深入理解，并可能激发数学和AI技术的新发展。今年，众多AI队伍尝试了多种策略提升AI的数学能力，预示着未来技术进步的无限可能。

自2018年起，阿里巴巴全球数学竞赛由阿里巴巴公益和达摩院联合举办，以其零门槛、全民可参与的特点，至今已吸引全球25万人次参与，成为规模最大的在线数学竞赛平台。

责任编辑：张蕾

点击查看全文(剩余0%)

AI和姜萍答同一份卷 结果如何？人类智慧暂胜一筹