稀宇科技发布新一代大模型MiniMax M3。它具备编程能力,支持100万超长上下文,拥有原生多模态能力,是国内首个集齐图片、视频输入及电脑桌面操作三项核心能力的开源模型,且性能超越GPT - 5.5和Gemini 3.1 Pro。
这背后,M3采用全新稀疏注意力架构,处理超长上下文时单token计算量减半,理解和生成答案阶段分别提速超9倍和15倍。目前API已开放,模型权重与技术报告将在10天内全球开源,有望推动国内AI大模型发展。
近日,稀宇科技发布新一代大模型MiniMax M3。它具备编程能力、支持100万超长上下文、有原生多模态能力,是国内首个集齐三项核心能力的开源模型,多项测试得分超GPT - 5.5和Gemini 3.1 Pro。技术上采用新架构,处理速度大幅提升。目前API已开放,10天内模型权重与报告将全球开源,推动国内AI发展。
稀宇科技发布新一代大模型MiniMax M3。它具备编程能力,支持100万超长上下文,拥有原生多模态能力,是国内首个集齐图片、视频输入及电脑桌面操作三项核心能力的开源模型,且性能超越GPT - 5.5和Gemini 3.1 Pro。
这背后,M3采用全新稀疏注意力架构,处理超长上下文时单token计算量减半,理解和生成答案阶段分别提速超9倍和15倍。目前API已开放,模型权重与技术报告将在10天内全球开源,有望推动国内AI大模型发展。
网友评论