据悉,DeepSeek V4将于4月下旬发布,该模型将带来万亿参数规模和百万级上下文窗口,并首次实现与华为昇腾等国产芯片的深度适配。
3月29日晚,DeepSeek经历了13小时服务中断,业内猜测可能是V4的灰度测试或全量部署。恢复后模型输出逻辑发生显著变化,编码结构更清晰,逻辑严谨度提升,SVG图形生成能力增强。
V4将以Apache 2.0协议开源,企业可自主部署。为迎接V4发布,国内科技巨头已预订数十万片新一代AI算力芯片,计划通过云服务提供DeepSeek新模型,并将其集成到自身AI产品中。受此影响,新AI芯片产品近期价格已上涨约20%。
DeepSeek发布时间已多次延期,原计划于2月中旬春节前后推出,后因国产算力深度适配、架构重构与稳定性打磨等原因推迟。
面对激烈竞争,迟到数月的V4承载着巨大期待。此外,腾讯混元3.0大模型也将于4月发布。