原以为DeepSeek这头“鲸鱼”,在上周发布V4模型之后,会深潜一段时间休养生息,没想到它却摆出了持续作战的架势。

就在刚刚,一个名为“识图模式”的新选项悄然出现在DeepSeek的对话框上。虽然DeepSeek同时标注上“图片理解功能内测中”的字样,但持续关注DeepSeek乃至AI业界的各位都很清楚,那个被持续讨论多时的DeepSeek多模态能力,终于要来了。
能力很强,但仍有体验遗憾
发现功能上线的时候,我们的编辑正在出差的高铁上。于是随手拍下的高铁场景,就成了DeepSeek识图模式的第一个考题。

从DeepSeek的推理过程中,我们发现了有意思的地方:DeepSeek并不是通过场景里的物体,去判断这可能是一个怎样的场景,而是真正理解了环境中的关键要素——各种文字信息,来实现更准确的推断。在此基础上,DeepSeek对图片中的其他信息亦有自己的理解,因此最终给出的答案,不仅准确,而且相当丰富细致。

下来这个测试,是基于识图模式做的一个发散。在强大的识别和理解能力支撑下,DeepSeek很快给出了答案,并且回答正确。
虽然开幕就给了我们一些暴击,但这并不代表现如今的DeepSeek识图模式就是爆杀状态。

对具体产品进行识别时,似乎是因为模型里产品信息不足,DeepSeek并未思考是否有可能是外观轮廓类似的小米15u和小米17u。所以,虽然推理过程识别出了小米机型和产品外观的各项信息,但最终答案是错误的。

对比之下,更早支持识图功能的豆包,凭借更丰富的训练语料,快速得出了正确答案。所以,DeepSeek这种“过程全对,答案错误”的情况,可以通过补全训练语料的方式来修正改善。

类似的情况出现在DeepSeek识别原神角色装备这一考察中。可以发现,它并不认识刚刚的推出的新角色,但回顾思考过程,我们能发现它认为原神出到了5.x版本的内容,也就是说,它的信息应该停留在去年初,也就是小米15 Ultra 发布以前,与识别手机时的结论一致。
虽不完美,但可成颠覆起点
识图模式的上线,标志着 DeepSeek 这头“深海巨鲸”,终于睁开了它的“眼睛”。这对DeepSeek而言,无疑是一个里程碑;对国产AI来说,也许是一次看似微妙,但足以改变格局的开始。

在竞争日渐激烈的当下, DeepSeek这一功能的上线,意味着国产AI们会加速进入竞争多模态能力的下一阶段。虚拟与现实之间的距离会进一步缩短,物理AI的发展也有可能被快进,AI对普罗大众工作生活的影响,会进一步加深。
太平洋科技将会持续对AI厂商们的识图和语音交互功能发展迭代进行持续关注,也欢迎已经收到DeepSeek识图模式推送的小伙伴们,在评论区里留下你对这一模式的使用体验和技巧分享。
绿联速显充160W氮化镓充电器套装PD100/140W适用苹果三星小米手机笔记本电脑多口Type-C屏显快充头
长城(Great Wall)SPARK 氮化镓S8 850W台式电脑电源金牌全模组ATX3.1/原生PCIe5.1/自动启停/40系50系显卡
VSGO微高摄影包20L户外专业休闲摄影黑鹞通勤微单反相机包双肩包防水耐用大容量器材收纳包
秦轩万能电视机遥控器通用创维TCL海信康佳长虹小米乐视三星索尼等品牌 红外款【纯蓝牙电视不要买】
¥13.3
¥19
Looki L1 AI 生活主理人 Looki PIE ai智能设备 漫画自动生成 十字路口播客罗永浩同款 lookil1绿
¥1499
¥1499
华为儿童手表 5X Pro华为手表智能手表离线定位电话极光紫
小米智能室外摄像机4双摄版 超清500万+500万像素摄像头家用智能监控无线wifi 农村 户外 庭院
vivo iQOO 15 12GB+256GB凌云 第五代骁龙8至尊版 2K 三星珠峰屏 国家补贴 iqoo15游戏电竞手机
雷珞克适用华为240W超级充电头P50/p40 mate50 40pro nova7/8pro充电器适用荣耀50se/60数据线手机充电器 1米6A快充线
网友评论