SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布,谷歌Gemini-3-pro以83.64分遥遥领先,字节跳动豆包大模型以73.15分跻身前三。测评从基础认知、视觉推理、视觉应用三个维度评估,Gemini-3-pro在三项细分指标中表现突出。
国内商汤科技SenseNova V6.5 Pro排第二,豆包视觉版第三,百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等也进前五,Qwen3-vl是首个开源且总分超70的模型。国际上,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅69.16分。这背后体现出谷歌在视觉大模型领域的强大实力,字节跳动等国内厂商也展现出较强竞争力。随着多模态技术发展,未来各模型竞争将更激烈,开源模型有望带来更多创新。
豆包
Gemini
FOSI AUDIO弗西音频ZD3专业音频解码器HIFI发烧级桌面无线蓝牙DAC无损音乐播放器高音质 ZD3【ESS9039Q2M芯片】
¥945
¥1050
【教育优惠】iPad钢化膜防指纹
¥18
¥28
碳性5号7号电池飞利浦
弥鹿(MiDeer)儿童麦克风话筒音响一体无线k唱歌机玩具六一儿童节生日礼物礼盒 【中国红】升级双麦-麦克风礼盒
miliboo 米泊铁塔MTT602II-AL摄像机三脚架单反广播级高速相机摄影三角架含动态液压云台
京东京造K3Max矮轴机械键盘超薄 三模无线蓝牙Mac适配小巧 佳达隆2.0茶轴 84键办公电脑游戏电竞 天青白色
小米(MI)Pad 8系列悬浮键盘 Xiaomi Pad 8系列悬浮键盘
绿联300W氮化镓充电器套装桌面充电站PPS/PD100WType-C多口快充头适用苹果MacbookPro笔记本电脑240W线
腾龙(Tamron)旗舰店 B061 18-300mm F/3.5-6.3防抖半画幅E卡口/X口/Z卡口/RF卡口微单腾龙18-300镜头18300 索尼E卡口 官方标配 【送腾龙原装UV滤镜大礼包】
网友评论