请登录登录

ChatGPT哭了！马斯克新AI直接封神

蒜鸟原创 2025-11-18 17:32:49

由华为云驱动

马斯克旗下xAI发布大语言模型Grok 4.1，显著提升速度、减少幻觉率至4%，情感理解能力大幅跃升。

近日，马斯克的xAI公司推出了最新一代大语言模型 Grok 4.1。这次更新距离今年 7 月 Grok 4 发布仅过去四个多月，却带来了用户立刻就能感知到的显著提升。马斯克本人在 X 平台上发帖表示，大家应该会明显感觉到速度和质量的双重飞跃，而实际体验也确实如此。

Grok 4.1 的最大亮点在于它对大模型顽疾的针对性优化。xAI 团队这次把后训练阶段的重心放在了减少幻觉上，通过大规模强化学习和针对信息求取类提示的专项纠偏，新模型在真实世界查询中的幻觉率从 Grok 4 的 12% 左右直接降到 4% 左右，降幅接近三倍。这意味着用户问事实性问题时，Grok 4.1 更不容易胡编乱造，而是给出可靠、可验证的答案。对于依赖 AI 进行研究、写作或决策的用户来说，这无疑是一次实质性进步。

除了更可靠，Grok 4.1 在对话体验上也完成了质的飞跃。官方描述称它在创意、情感和协作交互方面表现出色，更善于捕捉用户细微意图，回复更有共情力、个性更连贯，同时保持了前代模型那种锋利又幽默的风格。在 EQ-Bench 情感智商测试中，Grok 4.1 的得分从 Grok 4 的 1206 分暴涨到 1586 分，在创意写作和人际理解维度同样领先。这让它不再只是冷冰冰的问答机器，而是更像一个真正懂你的对话伙伴。

第三方盲测数据进一步印证了这些改进。在 LMArena 的 Text Arena 排行榜上，Grok 4.1 的思考模式以 1483 的 Elo 分数稳坐第一，甚至非推理的快速模式也拿下第二，领先所有非 xAI 模型 31 分之多。更值得一提的是，在 11 月 1 日到 14 日为期两周的静默灰度测试中，xAI 把新旧模型的回复随机混在一起让用户盲选，结果 Grok 4.1 以 64.78% 的偏好率完胜前代。这份来自真实用户的投票，比任何内部基准都更有说服力。

访问方式也保持了 xAI 一贯的亲民作风。Grok 4.1 已向所有用户免费开放，无论在 grok.com 网站、X 平台，还是 iOS 和 Android 的 Grok App 上，都可以直接使用。进入界面后，Auto 模式默认就是 Grok 4.1，如果你想手动指定，也能在模型选择器里找到它。付费的 SuperGrok 或 Premium+ 用户自然能享受更高配额，但免费版已经足够日常使用。

这次发布没有大张旗鼓的直播，也没有长篇的技术报告，xAI 只是平静地把模型推上线，任由用户自己去感受变化。这种低调反而凸显了自信：当产品真正好用时，不需要太多噱头。和其他厂商动辄几个月一次的大版本迭代相比，xAI 的节奏明显更快，从 Grok 4 到 4.1 只用了不到半年，就实现了从排行榜三十多名到全面登顶的逆袭。

当然，Grok 4.1 并非完美无缺。它依然继承了 Grok 系列一贯的直率风格，有时回答会比其他模型更不加修饰，但这也正是许多用户喜欢它的原因。在当前 AI 军备竞赛白热化的背景下，xAI 用实际表现证明，追求真理和最大化帮助用户，依然能在性能和体验上占据上风。

（字数：928）

点击展开全文