近日,马斯克的xAI公司推出了最新一代大语言模型 Grok 4.1。这次更新距离今年 7 月 Grok 4 发布仅过去四个多月,却带来了用户立刻就能感知到的显著提升。马斯克本人在 X 平台上发帖表示,大家应该会明显感觉到速度和质量的双重飞跃,而实际体验也确实如此。

Grok 4.1 的最大亮点在于它对大模型顽疾的针对性优化。xAI 团队这次把后训练阶段的重心放在了减少幻觉上,通过大规模强化学习和针对信息求取类提示的专项纠偏,新模型在真实世界查询中的幻觉率从 Grok 4 的 12% 左右直接降到 4% 左右,降幅接近三倍。这意味着用户问事实性问题时,Grok 4.1 更不容易胡编乱造,而是给出可靠、可验证的答案。对于依赖 AI 进行研究、写作或决策的用户来说,这无疑是一次实质性进步。

除了更可靠,Grok 4.1 在对话体验上也完成了质的飞跃。官方描述称它在创意、情感和协作交互方面表现出色,更善于捕捉用户细微意图,回复更有共情力、个性更连贯,同时保持了前代模型那种锋利又幽默的风格。在 EQ-Bench 情感智商测试中,Grok 4.1 的得分从 Grok 4 的 1206 分暴涨到 1586 分,在创意写作和人际理解维度同样领先。这让它不再只是冷冰冰的问答机器,而是更像一个真正懂你的对话伙伴。

第三方盲测数据进一步印证了这些改进。在 LMArena 的 Text Arena 排行榜上,Grok 4.1 的思考模式以 1483 的 Elo 分数稳坐第一,甚至非推理的快速模式也拿下第二,领先所有非 xAI 模型 31 分之多。更值得一提的是,在 11 月 1 日到 14 日为期两周的静默灰度测试中,xAI 把新旧模型的回复随机混在一起让用户盲选,结果 Grok 4.1 以 64.78% 的偏好率完胜前代。这份来自真实用户的投票,比任何内部基准都更有说服力。


访问方式也保持了 xAI 一贯的亲民作风。Grok 4.1 已向所有用户免费开放,无论在 grok.com 网站、X 平台,还是 iOS 和 Android 的 Grok App 上,都可以直接使用。进入界面后,Auto 模式默认就是 Grok 4.1,如果你想手动指定,也能在模型选择器里找到它。付费的 SuperGrok 或 Premium+ 用户自然能享受更高配额,但免费版已经足够日常使用。

这次发布没有大张旗鼓的直播,也没有长篇的技术报告,xAI 只是平静地把模型推上线,任由用户自己去感受变化。这种低调反而凸显了自信:当产品真正好用时,不需要太多噱头。和其他厂商动辄几个月一次的大版本迭代相比,xAI 的节奏明显更快,从 Grok 4 到 4.1 只用了不到半年,就实现了从排行榜三十多名到全面登顶的逆袭。
当然,Grok 4.1 并非完美无缺。它依然继承了 Grok 系列一贯的直率风格,有时回答会比其他模型更不加修饰,但这也正是许多用户喜欢它的原因。在当前 AI 军备竞赛白热化的背景下,xAI 用实际表现证明,追求真理和最大化帮助用户,依然能在性能和体验上占据上风。
(字数:928)
绿联[3C认证]能量湃Pro笔记本充电宝200W快充25000毫安时大容量PD130W移动电源适用苹果17华为电脑手机 深空灰【130w大功率/20000mAh】
索尼(SONY)WF-1000XM5 真无线蓝牙耳机 运动防水入耳式 新降噪豆5 1000XM4升级款 AI智能主动降噪 黑色 国行
盖世小鸡(GAMESIR)G8+无线手游体感拉伸游戏手柄 NS手机平板安卓ios苹果switch电脑PC串流joy-con原神三角洲丝之歌
¥314.1
¥349
品胜【3C认证】充电宝22.5W快充自带双线便携10000毫安可上飞机移动电源适用苹果17promax华为小米白
闪极麦金塔35W氮化镓苹果17充电器iPhone16快充头PD20W18W适用iPhone15ProMax华为小米三星平板iPad
倍思车载充电器特斯拉拓展坞Hub新能源点烟口转换器氮化镓超级快充适用modelY/3
中兴(ZTE)G5 Pro 5G移动路由器CPE SIM卡插卡上网WiFi7 BE7200M 2.5G双网口/MC8512/2025款
弥鹿(MiDeer)儿童麦克风话筒音响一体无线k唱歌机玩具六一儿童节生日礼物礼盒 【中国红】升级双麦-麦克风礼盒
韶音(SHOKZ)【李现同款】OpenRun Air骨传导蓝牙无线开放式耳机耳麦不入耳式运动跑步骑行 10分钟快充S803air OpenRun Air石墨黑
网友评论