AI

字节跳动开源Lance 3B,30亿参数搞定图视理解与生成!

PConline 2026-05-22 14:22:00
7X24小时AI快讯
由华为云驱动

近日,字节跳动开源原生统一多模态大模型Lance 3B。该模型以30亿激活参数全功能覆盖图像/视频理解与生成任务,采用“共享上下文 + 能力解耦并行”等技术,引入MaPE机制。训练预算控制在128张GPU内,采用Apache 2.0协议开源,有望推动多模态大模型在相关领域的应用和发展。

字节跳动开源原生统一多模态大模型Lance 3B,以30亿激活参数全功能覆盖图像/视频理解与生成任务。它能完成文本/视觉理解、图像及视频生成/编辑,采用Apache 2.0协议开源,权重已上线Hugging Face。在基准测试中,视频生成、图像生成和视频理解均有不错成绩。

技术上,它采用“共享上下文 + 能力解耦并行”及双流专家架构,引入MaPE机制处理多模态边界混淆。训练分四阶段,总预算控制在128张GPU内。这一模型的开源,有望推动多模态大模型在相关领域的应用和发展。

点击展开全文
打开APP,阅读体验更佳

网友评论

太评甄选

更多优惠

相关推荐

相关产品
取消