中国AI领军企业DeepSeek发布全新视觉编码器DeepSeek OCR 2。它模拟人类视觉扫描模式,摒弃传统CLIP组件,用“因果流Token”排列整合视觉信息,视觉Token消耗量锐减超80%。在OmniDocBench测试中,它以91.09%的高分超越Gemini 3 Pro,且代码和权重已公开。
技术上,DeepSeek OCR 2革新处理逻辑,既减少Token消耗又提升解析力。这使其在文档处理领域竞争力强,有望推动视觉模型向低耗高效方向发展。
近日,中国AI领军企业DeepSeek发布全新视觉编码器DeepSeek OCR2。它模拟人类视觉扫描模式,摒弃传统CLIP组件,视觉Token消耗量锐减超80%,在OmniDocBench测试中超越Gemini 3 Pro。代码和权重已公开,革新处理逻辑,有望推动视觉模型向低耗高效发展,提升文档处理领域竞争力。
中国AI领军企业DeepSeek发布全新视觉编码器DeepSeek OCR 2。它模拟人类视觉扫描模式,摒弃传统CLIP组件,用“因果流Token”排列整合视觉信息,视觉Token消耗量锐减超80%。在OmniDocBench测试中,它以91.09%的高分超越Gemini 3 Pro,且代码和权重已公开。
技术上,DeepSeek OCR 2革新处理逻辑,既减少Token消耗又提升解析力。这使其在文档处理领域竞争力强,有望推动视觉模型向低耗高效方向发展。
网友评论