AI和姜萍答同一份卷 结果如何?人类智慧暂胜一筹

经济观察报 2024-06-16 12:40:59
A+ A-

6月13日,第六届阿里巴巴全球数学竞赛揭晓决赛名单,亮点之一是17岁的江苏涟水中等专业学校学生姜萍,她不仅成功跻身全球前30名,更是该组别中唯一的女性选手。

AI和姜萍答同一份卷 结果如何?

本届竞赛引入了新变化,首次增设AI大模型挑战赛,与姜萍等数万名全球数学爱好者同台竞技的是563支由顶尖高校、研究机构及企业组建的AI队伍。尽管AI队伍展现了一定水平,平均分达到18分,接近人类选手平均水平,但最高分34分与人类最高分113分相距甚远,无一支AI队伍进入决赛。

其中,由上海建平中学学生涂津豪设计的AI方案凭借34分夺得AI挑战赛冠军。他采用自辩论策略,让大模型进行自我问答验证,优化解题路径。西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队则分别以27分获得亚军和季军,两队均利用多个智能体协作解题,展现了不同的策略和方法。

浙江大学计算机系统结构实验室的研究员陈天楚分析指出,当前大语言模型在处理需要反复试错和深入思考的数学问题时,逻辑推理和严谨思考能力仍显不足,尚不能与受过专业训练的人类匹敌。AI阅卷点评亦强调了AI在逻辑推理和证明题方面的局限性。

一位来自互联网企业的技术总监对此表示高度关注,认为这次AI挑战赛不仅是对模型能力的检验,也是对AI深层逻辑推理及创新思维局限性的揭示。尽管AI在特定任务上能超越人类,但在复杂逻辑和创新领域,人类依然保持明显优势。

尽管AI队伍未能在此次数学竞赛中胜出人类,技术总监认为这将促进对AI本质的深入理解,并可能激发数学和AI技术的新发展。今年,众多AI队伍尝试了多种策略提升AI的数学能力,预示着未来技术进步的无限可能。

自2018年起,阿里巴巴全球数学竞赛由阿里巴巴公益和达摩院联合举办,以其零门槛、全民可参与的特点,至今已吸引全球25万人次参与,成为规模最大的在线数学竞赛平台。

责任编辑:张蕾
点击查看全文(剩余0%)

热点新闻

精彩推荐

加载更多……