在12 月 17 日开幕的2025小米人车家全生态合作伙伴大会上,备受瞩目的小米大模型团队迎来了新任掌门人的首次公开亮相。作为Xiaomi MiMO大模型负责人,罗福莉并没有选择常规的客套寒暄,而是直接抛出了一枚技术重磅炸弹——正式发布最新一代MoE(混合专家)大模型MiMo-V2-Flash。对于这一里程碑式的发布,相关负责人将其定义为小米在通往人工通用智能(AGI)宏伟蓝图中的关键第二步,标志着小米在顶级模型研发领域已从跟随迈向了引领。

在随后的技术深度解析环节,有关方面披露了MiMo-V2-Flash背后的硬核架构细节,展现了小米团队在平衡模型性能与算力效率上的独特思考。据悉,该模型并未盲目堆砌参数,而是采用了一种名为Hybrid SWA的混合架构。这种设计被业内评价为极具极简主义美学,既摒弃了繁复的冗余结构,又在长文本推理能力上实现了对传统线性注意力变体的显著超越。

特别值得关注的是,技术团队在研发过程中发现了一个颇为反直觉的现象:窗口大小并非越大越好。经过反复验证,128被确定为最佳的窗口大小设定,一旦超过这个阈值,模型的综合性能反而会出现下滑。这一发现不仅为行业提供了新的调优思路,配合固定的KV缓存设计,更是极大地提升了新模型与现有计算基础设施的兼容性,为大规模快速部署扫清了障碍。
除了架构层面的革新,罗福莉还着重介绍了多标记预测(MTP)技术的应用。这项技术被视为此次性能飞跃的另一大引擎,特别是在强化学习(RL)的高效化方面效果卓著。有别于传统模型逐个预测下一个token的低效模式,MTP技术允许模型在预测时看得更远。数据表明,即便仅在第一层之外进行少量的微调,MTP也能帮助模型获得极高的接受长度。

在具体的编程任务测试中,三层MTP架构的表现尤为抢眼,不仅实现了大于3的接受长度,更将推理速度提升了约2.5倍。这一改进直击当前AI训练的痛点,有效解决了在小批量On-Policy强化学习过程中常见的GPU空转问题,让昂贵的算力资源得到了最大化利用。
在后训练阶段,小米团队展现了极强的技术整合能力。据透露,团队采纳了Thinking Machine提出的On-Policy Distillation(在线策略蒸馏)方案,旨在将多个强化学习模型的优势进行深度融合。这一策略的效果立竿见影:小米成功在传统的监督微调(SFT)和强化学习流程中,以仅仅相当于教师模型五十分之一的计算量,达到了同等水平的性能表现。这种四两拨千斤的方法,展示了学生模型在不断迭代中具备的惊人进化潜力,最终形成了一个自我增强、自我完善的良性闭环。

回顾整个研发历程,相关负责人感慨团队展现出的非凡战力。从理论构想到转化为可上线运行的生产级系统,小米AI团队仅用了短短几个月时间。这种高效与创造力,不仅是小米技术实力的体现,更为其在激烈的人车家全生态竞争中构筑了坚实的护城河。
尼康 D610 D750 24-120套机 全画幅高清单反相机单机后封港版中端单反 店保三年D610+24-85镜头 官方标配
惠普(HP)战99 高性能台式电脑主机 可选13代i3-13100 16G 1TBSSD 商用办公生产力 图文设计 教育学习机 【热卖】主机+23.8英寸 i3/16G/512G
佳匹【莱茵认证超护眼】iphone17Promax钢化膜适用苹果16Pro/15/14/13手机膜AR防蓝光防爆绿光防偷窥膜 超清护眼抗蓝光2片+神器 iPhone15Pro
盈通(yeston) RTX 5060 Ti 8G GDDR7 游戏高手OC PA 电竞光追游戏AI智能学习电脑独立显卡
简雷240超级充电适用华为充电器Mate60pro手机充电头闪充插头mate50pro/30/40适用荣耀nova8/9数据线 1.0米6A快充线
惠普HP【国家补贴】星Book Pro Air 14轻薄笔记本电脑(酷睿Ultra5 225H 16G 512G 2.8K 120Hz AI)银
¥6998
¥6998
鸿蒙智选800万摄像头家用监控器室内360度无死角带夜视全景可对话可视频家庭看护支持华为智慧生活海雀5i4K
iKF Nano空间音频版【爆款推荐|56dB强劲降噪】头戴式主动降噪蓝牙耳机金标认证有线无线耳麦极光银
亿色(ESR)【苹果15W无线充】magsafe磁吸充电器快充iPhone17promax/16/15/14/13/12/华为手机耳机桌面充电器 【苹果15W无线充】星空银丨Magsafe磁吸
¥25
¥109
网友评论