AI

DeepSeek OCR 2视觉Token消耗降80%,文档解析力超越Gemini 3 Pro

PConline 2026-02-02 17:23:00
产品动态
由华为云驱动

近日,中国AI领军企业DeepSeek发布全新视觉编码器DeepSeek OCR2。它模拟人类视觉扫描模式,摒弃传统CLIP组件,视觉Token消耗量锐减超80%,在OmniDocBench测试中超越Gemini 3 Pro。代码和权重已公开,革新处理逻辑,有望推动视觉模型向低耗高效发展,提升文档处理领域竞争力。

中国AI领军企业DeepSeek发布全新视觉编码器DeepSeek OCR 2。它模拟人类视觉扫描模式,摒弃传统CLIP组件,用“因果流Token”排列整合视觉信息,视觉Token消耗量锐减超80%。在OmniDocBench测试中,它以91.09%的高分超越Gemini 3 Pro,且代码和权重已公开。

技术上,DeepSeek OCR 2革新处理逻辑,既减少Token消耗又提升解析力。这使其在文档处理领域竞争力强,有望推动视觉模型向低耗高效方向发展。

点击展开全文
打开APP,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

相关产品
取消