3月11日,OpenRouter上线了两个神秘模型Healer Alpha与Hunter Alpha。其中Healer Alpha被描述为具备视觉、推理与行动能力的前沿全模态模型,据悉其系统提示词要求严格遵守中国法律法规。
DeepSeek V4将于4月正式发布,该模型由梁文锋团队开发,聚焦多模态能力和长期记忆突破。团队近期发表的论文显示,其研究方向包括条件记忆机制和底层架构优化。DeepSeek V4将深度适配国产芯片,有望成为首个完全运行在国产算力生态上的大模型。
腾讯方面,姚顺雨团队也将在4月发布新的混元模型,规模约30B参数。该模型聚焦上下文学习和真实任务评测,不以打榜为导向。姚顺雨此前已发表相关论文,推动腾讯混元在长上下文与Agent可用性方面的研究。
两大国产AI巨头的研发方向各异:DeepSeek侧重长期记忆和多模态能力,腾讯混元则专注上下文学习和实用评测,但都致力于推动大模型在实际生产环境中的应用。