AI

字节跳动发布全模态大模型,能听会看还能干活,推动多行业应用

PConline 2026-05-07 09:07:00
产品动态
由华为云驱动

近日,字节跳动旗下火山引擎发布豆包大模型家族首款全模态理解模型Doubao - Seed - 2.0 - lite。它打破单一模态限制,视觉与逻辑推理强,融入语音技术,Agent与Coding能力进化。同时上线更高效的mini版本,为企业提供高性价比选择,有望推动全模态技术在多行业应用。

字节跳动旗下火山引擎宣布,豆包大模型家族迎来首款全模态理解模型Doubao-Seed-2.0-lite。它打破单一模态限制,实现视频、图像、音频与文本原生统一理解,视觉与逻辑推理能力出色,超越今年2月的Pro版本。融入语音理解技术,支持19种语种转写及14个语种互译,Agent与Coding能力进化,代码能力覆盖多领域,还实现GUI理解与执行一体化,已在多领域落地。

技术上,该模型是全模态的重磅升级,能进行“音画同步”深度联合推理,对多轮复杂指令遵循度提升。更高效的Doubao-Seed-2.0-mini版本同步上线,为企业低成本部署全模态推理任务提供了高性价比选择,有望推动全模态技术在更多行业应用。

点击展开全文
打开APP,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

相关产品
取消