当大模型参加高考数学,谁是最会答题那一个?

科技IT
2025 06-09 20:39:12
分享

  6月7日下午,随着2025年全国高考数学科目考试落幕,数学相关话题迅速成为网络热议焦点。

  当看到正式公布的高考数学题时,小编瞬间感到“眼前一黑又一黑”,于是决定组织一场大模型解题能力测试,看看它们能否扛住这波难度暴击。

  本次参与测试的大模型包括豆包、夸克、文心 X1 Turbo、DeepSeek-R1和Kimi。测试所选考卷为2025年数学新课标Ⅰ卷,涵盖单选题、多选题及填空题,卷面满分73分。

  先来看测试结果,下图所示:

  经过角逐,综合单选题、多选题和填空题的得分,豆包以63分获得了本第一名,夸克、DeepSeek-R1、文心 X1 Turbo以及Kimi则紧随其后,依次位列第二至第五名。

  接下来,我们来看测试细节:

一、单选题

  首先是单选题,共设置8道题目,每题5分,合计40分。

  第一题:正确答案是C

  五款大模型全部回答正确。

  第二题:正确答案是C

  五款大模型全部回答正确。

  第三题:正确答案是D

  五款大模型全部回答正确。

  第四题:正确答案是B

  五款大模型全部回答正确。

  第五题:正确答案是A

  五款大模型全部回答正确。

  第六题:正确答案是A

  五款大模型全军覆没。

  第七题:正确答案是B

  五款大模型全部回答正确。

  第八题:正确答案是B

  五款大模型全部回答正确。

  在单选题测试环节,五款大模型处第六题外,全部回答正确,均获得35分。

二、多选题

  接下来是多选题,包含3道试题,每题6分,评分规则为答错不得分、少选会根据正确选项数量按比例得分,该部分合计18分。

  第一题:正确答案是B、D

  豆包和Kimi少选,其他大模型全部答对。

  第二题:正确答案是A、C、D

 本题只有夸克和文心X1 Turbo全部选对,相较之下,参与测评的其他大模型均存在不同程度的漏选问题。

  第三题:正确答案是A、C、D

  本题只有豆包选对。

  在多选题测试环节,豆包获得13分、夸克获得16分、文心 X1 Turbo获得14分、DeepSeek-R1获得10分、Kimi获得7分。

三、填空题

  最后来看填空题,共3道,每题5分,合计15分。

  第一题:正确答案是4

 五款大模型全部回答正确。

  第二题:正确答案是±2

 五款大模型全部回答正确。

  第三题:正确答案是61/25

  五款大模型全部回答正确。

  在填空题测试环节,五款大模型在这部分均获得15分。

  写在最后:

  在单选题部分除第六题外全部答对,显示出大模型对基础知识点的掌握较为牢固,尤其是前5题和后两题的高正确率,印证了其在常规题型中的稳定性;填空题则实现全对,无论是整数答案还是分数结果,均能精准输出,体现了对公式应用和计算细节的把控能力。

  但多选题成为明显分水岭,夸克和文心 X1 Turbo在多选题中表现最为出色,显示出更强的综合分析和逻辑推理能力;豆包和DeepSeek-R1表现较为中规中矩,但在某些关键细节上还需要进一步提升;而Kimi则在多选题中存在明显的短板,需要进一步优化对复杂选项的判断能力。

  在高考这场青春的试炼中,每一道题目都是对考生们思维深度与广度的考量。在此,也祝愿广大考生得偿所愿,顺利进入心仪的学府,在更广阔的天地中续写属于自己的精彩篇章。

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。