6月7日下午,随着2025年全国高考数学科目考试落幕,数学相关话题迅速成为网络热议焦点。
当看到正式公布的高考数学题时,小编瞬间感到“眼前一黑又一黑”,于是决定组织一场大模型解题能力测试,看看它们能否扛住这波难度暴击。
本次参与测试的大模型包括豆包、夸克、文心 X1 Turbo、DeepSeek-R1和Kimi。测试所选考卷为2025年数学新课标Ⅰ卷,涵盖单选题、多选题及填空题,卷面满分73分。
先来看测试结果,下图所示:
经过角逐,综合单选题、多选题和填空题的得分,豆包以63分获得了本第一名,夸克、DeepSeek-R1、文心 X1 Turbo以及Kimi则紧随其后,依次位列第二至第五名。
接下来,我们来看测试细节:
一、单选题
首先是单选题,共设置8道题目,每题5分,合计40分。
第一题:正确答案是C
五款大模型全部回答正确。
第二题:正确答案是C
五款大模型全部回答正确。
第三题:正确答案是D
五款大模型全部回答正确。
第四题:正确答案是B
五款大模型全部回答正确。
第五题:正确答案是A
五款大模型全部回答正确。
第六题:正确答案是A
五款大模型全军覆没。
第七题:正确答案是B
五款大模型全部回答正确。
第八题:正确答案是B
五款大模型全部回答正确。
在单选题测试环节,五款大模型处第六题外,全部回答正确,均获得35分。
二、多选题
接下来是多选题,包含3道试题,每题6分,评分规则为答错不得分、少选会根据正确选项数量按比例得分,该部分合计18分。
第一题:正确答案是B、D
豆包和Kimi少选,其他大模型全部答对。
第二题:正确答案是A、C、D
本题只有夸克和文心X1 Turbo全部选对,相较之下,参与测评的其他大模型均存在不同程度的漏选问题。
第三题:正确答案是A、C、D
本题只有豆包选对。
在多选题测试环节,豆包获得13分、夸克获得16分、文心 X1 Turbo获得14分、DeepSeek-R1获得10分、Kimi获得7分。
三、填空题
最后来看填空题,共3道,每题5分,合计15分。
第一题:正确答案是4
五款大模型全部回答正确。
第二题:正确答案是±2
五款大模型全部回答正确。
第三题:正确答案是61/25
五款大模型全部回答正确。
在填空题测试环节,五款大模型在这部分均获得15分。
写在最后:
在单选题部分除第六题外全部答对,显示出大模型对基础知识点的掌握较为牢固,尤其是前5题和后两题的高正确率,印证了其在常规题型中的稳定性;填空题则实现全对,无论是整数答案还是分数结果,均能精准输出,体现了对公式应用和计算细节的把控能力。
但多选题成为明显分水岭,夸克和文心 X1 Turbo在多选题中表现最为出色,显示出更强的综合分析和逻辑推理能力;豆包和DeepSeek-R1表现较为中规中矩,但在某些关键细节上还需要进一步提升;而Kimi则在多选题中存在明显的短板,需要进一步优化对复杂选项的判断能力。
在高考这场青春的试炼中,每一道题目都是对考生们思维深度与广度的考量。在此,也祝愿广大考生得偿所愿,顺利进入心仪的学府,在更广阔的天地中续写属于自己的精彩篇章。