APP下载

请登录登录

NUWA-XL

#视频制作#视频生成

用户评分

暂无

准确性 -响应速度 -易用性 -

我也评评

NUWA-XL是微软亚洲研究院推出的超长视频生成AI模型，采用创新的Diffusion over Diffusion架构，支持并行生成高质量长视频。该模型通过分层结构和局部扩散技术，显著提升生成效率，例如生成1024帧视频时推理速度提升94.26%。NUWA-XL能根据文本描述生成长达11分钟的连贯视频，填补了长视频生成领域的技术空白。

Microsoft

直达网站

核心功能

超长视频生成

16句描述生成11分钟视频

轨迹控制生成

DragNUWA多对象运动控制

多模态输入支持

文本图像轨迹联合生成

分层扩散架构

Diffusion over Diffusion技术

迭代里程碑常见问题相关推荐

产品对比

NUWA-XL

切换

快剪辑

0.0

我也评评

用户评分

4.4

我也评评

准确性

4.6

易用性

4.3

响应速度

4.4

超长视频生成

轨迹控制生成

多模态输入支持

分层扩散架构

相机运动模拟

核心功能

AI快字幕

智能抠图

AI写真

画中画

AI去水印

产品热度

7728

微软

技术背景

360旗下

NUWA-XL

迭代里程碑

DragNUWA发布2024年01月07日: 可控生成多模态; 引入轨迹控制技术，实现语义、空间、时间三维可控视频生成。

NUWA-XL正式推出2023年04月06日: 长视频生成并行计算; 采用Diffusion over Diffusion架构，支持16句文本生成11分钟超长动画。

NUWA-Infinity升级2022年: 无限分辨率视觉创作; 突破分辨率限制，实现任意尺寸高清图像与短视频生成。

NUWA初代发布2021年: 多模态AIGC; 首个多模态生成模型，支持文本、图像、视频跨模态转换。

常见问题

NUWA-XL支持哪些输入方式生成视频？: NUWA-XL支持文本、图像及轨迹控制三种输入方式。用户可通过脚本描述、静态图片结合运动轨迹（如绘制对象移动路径）或直接输入多模态信息，模型会基于这些输入以“粗到细”的流程生成高质量长视频。

NUWA-XL生成视频的最大长度和效率如何？: NUWA-XL采用Diffusion over Diffusion架构，可并行生成超长视频（如11分钟动画），显著优于传统模型（仅3-5秒）。其全局-局部扩散模型协同工作，既保证关键帧连贯性，又提升生成效率，例如16句文本输入即可生成11分钟内容。