【太平洋科技快讯】中文大模型基准测评SuperCLUE发布2026年3月最新结果,本次测评汇集 22 款国内外主流大模型,围绕数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。

从整体排名来看,海外头部闭源模型仍占据榜单前列,Anthropic Claude-Opus-4.6、Google Gemini-3.1-Pro-Preview、OpenAI GPT-5.4 分列总分前三。字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53 分拿下国内模型第一,与 GPT-5.4 仅相差 0.95 分,正式进入全球第一梯队,并在智能体任务规划维度超越多款海外模型,跻身全球前五,体现出国产模型在复杂任务编排上的快速进步。
国产厂商方面,小米MiMo-V2 系列两款模型均成功登榜。其中 MiMo-V2-Pro 以 60.67 分位居闭源模型中上游,数学推理单项得分 84.03 分,表现突出;开源版本 MiMo-V2-Flash 在代码生成等垂直场景展现出应用潜力。
本次测评结果显示,中文大模型已从 “追赶” 进入 “并行” 阶段,国产模型在通用能力逼近国际头部水平的同时,在中文理解、智能体、科学计算等方向逐步形成特色优势,为行业应用落地提供更扎实的技术支撑。
¥151
¥239
¥6.7
¥6.7
嘉柏兰【2025最新款丨HIFI全景音】骨传导概念蓝牙耳机耳夹式不入耳超长续航大容量运动跑步骑车高音质 顶配版丨肤色丨全景声升级续航
¥39.9
¥39.9
联想拯救者Y700五代 8.8英寸游戏AI平板 第五代骁龙8至尊 3K 165Hz超高刷新率 16+512GB 碳晶黑
乔锐斯随身wifi无线2026款全国通用5ghz无线流量充电宝二合一官方正品免插卡三网通用无月租可移动wifi 【1万毫安可充电-蓝】-72小时续航5Ghz
飞利浦(PHILIPS)E6510 老年人手机4G全网通超长待机大电池大屏大声大字老人智能直板按键三防学生专功能机 星空黑
¥259
¥259
乔锐斯随身wifi【新疆西藏云南广西可用】2026款全国通用5ghz无限流量便携充电宝二合一无线网络移动wifi 【10000毫安】新疆西藏云南用移动-内地三网通
【加长2.1米】手机支架直播支架落地自拍三脚架直播网课立式折叠支架可伸缩 录视频拍照专业户外 亮黑2.1米超高套装(支架+云台+手机夹)-推荐款
¥14.9
¥14.9
品胜【3C认证可上飞机】充电宝自带双线20000毫安大容量22.5W快充移动电源适用苹果17promax小米华为白
网友评论