请登录登录

实测：用Gemini模拟考生做高考题，成绩曝光！

KuiAI2026-03-25 00:03

评测

为 AI 领域博主，我最近干了一件特别“损”的事儿：我把 2025 年全国高考真题（语数外全套）原封不动地喂给了 Gemini 3.1 Pro。

我想看看，这个在各种基准测试中“屠榜”的 AI，如果真坐在中国高考的考场里，到底是清北苗子，还是只能混个大专？为了保证测试的真实性，我全程在Gemini 3.1 Pro 镜像站（s.myliang.cn）开启了 Deep Think（深度思考）模式。

现在，成绩正式曝光，结果有些出人意料，甚至让我想替广大学子捏把汗。

一、语文：AI 的“浪漫”与“死板”并存

客观题（阅读理解）：满分。Gemini 3.1 Pro 对长文本的逻辑抓取简直是降维打击。无论是文言文断句还是现代文的中心思想，它都能精准定位，甚至能解释出考纲之外的背景知识。

作文：这是最让我纠结的部分。它写出的作文逻辑严密、引经据典，那种“新质生产力”与“传统文化”的结合点抓得极准。但说实话，“匠气”太重。它太想拿高分了，导致每一段的升华都像标准模板，少了点人类少年那种青涩但鲜活的气息。

估分： 125-135 分。

二、数学：逻辑怪兽的“巅峰表演”

数学一直是大模型的痛，尤其是涉及空间几何和极值压轴题。但这次 Gemini 3.1 Pro 的表现堪称惊艳。

题型表现评级核心优势选择填空零失误强大的符号运算能力，直接跳过计算陷阱。解析几何极强在多步推导中，思维链（CoT）极其稳定，没有出现中途“断片”。导数压轴题成功解出这是最恐怖的。它在后台进行了约 15 秒的“深度思考”，给出了三种分类讨论的情况。

博主提醒：它的逻辑推理能力在 ARC-AGI-2 测试中达到了 77.1%，这意味着它不再是靠背题，而是真的在“推导”。

估分： 140-150 分（如果不扣步骤分的话）。

三、英语：这简直是它的“母语”

英语测试基本失去了意义。不管是完形填空还是短文改错，Gemini 表现得就像一个在地道的伦敦外教。它甚至能敏锐地察觉出考卷中某些题目为了迷惑考生而设置的“中式思维”陷阱。

估分： 145+ 分。

四、综合分析：AI 考生的弱点在哪里？

虽然总分看起来能轻松上 985，但在实测中我也发现了几个有意思的现象：

过度解读：在做语文诗歌鉴赏时，它偶尔会把作者的一声叹息解读出“忧国忧民、心系宇宙”的宏大叙事，有点类似我们小时候过度解读课文。

指令冲突：如果要求它“像个 18 岁的高中生一样答题”，它会故意写错几个单词或用更简单的语法，这种“假装平庸”的逻辑其实挺可怕的。

对新型题型的适应：对于那种结合了最新时政、需要极强跨学科联想的题目，Gemini 的处理比之前的版本要灵活得多。

五、总结：我们该焦虑吗？

看完这份“成绩单”，我最大的感受不是恐惧，而是感慨。AI 已经证明了自己在标准化逻辑考核中的统治地位。如果你还在死记硬背、刷题，那么在 Gemini 面前真的没有胜算。

未来的竞争，不在于谁能算出那道压轴题，而在于谁能给 AI 下达更好的指令（Prompt）。如果你想感受这种“学霸级”的思维逻辑，或者想让它帮你分析一下高难度的逻辑题，强烈建议去Gemini 3.1 Pro 镜像站（s.myliang.cn）实测一下。那种看着它在几秒钟内拆解复杂逻辑的感觉，真的会重塑你的学习观。

那么，如果 AI 真的可以参加高考并填报志愿，你觉得它最该去读什么专业？我们在评论区见。