为 AI 领域博主,我最近干了一件特别“损”的事儿:我把 2025 年全国高考真题(语数外全套)原封不动地喂给了 Gemini 3.1 Pro。
我想看看,这个在各种基准测试中“屠榜”的 AI,如果真坐在中国高考的考场里,到底是清北苗子,还是只能混个大专?为了保证测试的真实性,我全程在Gemini 3.1 Pro 镜像站(s.myliang.cn)开启了 Deep Think(深度思考) 模式。
现在,成绩正式曝光,结果有些出人意料,甚至让我想替广大学子捏把汗。
一、 语文:AI 的“浪漫”与“死板”并存
客观题(阅读理解): 满分。Gemini 3.1 Pro 对长文本的逻辑抓取简直是降维打击。无论是文言文断句还是现代文的中心思想,它都能精准定位,甚至能解释出考纲之外的背景知识。
作文: 这是最让我纠结的部分。它写出的作文逻辑严密、引经据典,那种“新质生产力”与“传统文化”的结合点抓得极准。但说实话,“匠气”太重。它太想拿高分了,导致每一段的升华都像标准模板,少了点人类少年那种青涩但鲜活的气息。
估分: 125-135 分。
二、 数学:逻辑怪兽的“巅峰表演”
数学一直是大模型的痛,尤其是涉及空间几何和极值压轴题。但这次 Gemini 3.1 Pro 的表现堪称惊艳。
题型表现评级核心优势选择填空零失误强大的符号运算能力,直接跳过计算陷阱。解析几何极强在多步推导中,思维链(CoT)极其稳定,没有出现中途“断片”。导数压轴题成功解出这是最恐怖的。它在后台进行了约 15 秒的“深度思考”,给出了三种分类讨论的情况。
博主提醒: 它的逻辑推理能力在 ARC-AGI-2 测试中达到了 77.1%,这意味着它不再是靠背题,而是真的在“推导”。
估分: 140-150 分(如果不扣步骤分的话)。
三、 英语:这简直是它的“母语”
英语测试基本失去了意义。不管是完形填空还是短文改错,Gemini 表现得就像一个在地道的伦敦外教。它甚至能敏锐地察觉出考卷中某些题目为了迷惑考生而设置的“中式思维”陷阱。
估分: 145+ 分。
四、 综合分析:AI 考生的弱点在哪里?
虽然总分看起来能轻松上 985,但在实测中我也发现了几个有意思的现象:
过度解读: 在做语文诗歌鉴赏时,它偶尔会把作者的一声叹息解读出“忧国忧民、心系宇宙”的宏大叙事,有点类似我们小时候过度解读课文。
指令冲突: 如果要求它“像个 18 岁的高中生一样答题”,它会故意写错几个单词或用更简单的语法,这种“假装平庸”的逻辑其实挺可怕的。
对新型题型的适应: 对于那种结合了最新时政、需要极强跨学科联想的题目,Gemini 的处理比之前的版本要灵活得多。
五、 总结:我们该焦虑吗?
看完这份“成绩单”,我最大的感受不是恐惧,而是感慨。AI 已经证明了自己在标准化逻辑考核中的统治地位。如果你还在死记硬背、刷题,那么在 Gemini 面前真的没有胜算。
未来的竞争,不在于谁能算出那道压轴题,而在于谁能给 AI 下达更好的指令(Prompt)。如果你想感受这种“学霸级”的思维逻辑,或者想让它帮你分析一下高难度的逻辑题,强烈建议去Gemini 3.1 Pro 镜像站(s.myliang.cn)实测一下。那种看着它在几秒钟内拆解复杂逻辑的感觉,真的会重塑你的学习观。
那么,如果 AI 真的可以参加高考并填报志愿,你觉得它最该去读什么专业?我们在评论区见。




