NUWA-XL

#视频制作#视频生成

用户评分
查看更多
暂无
准确性 -响应速度 -易用性 -
评分图标 我也评评

NUWA-XL是微软亚洲研究院推出的超长视频生成AI模型,采用创新的Diffusion over Diffusion架构,支持并行生成高质量长视频。该模型通过分层结构和局部扩散技术,显著提升生成效率,例如生成1024帧视频时推理速度提升94.26%。NUWA-XL能根据文本描述生成长达11分钟的连贯视频,填补了长视频生成领域的技术空白。

NUWA-XLMicrosoft
直达网站

核心功能

超长视频生成

16句描述生成11分钟视频

轨迹控制生成

DragNUWA多对象运动控制

多模态输入支持

文本图像轨迹联合生成

分层扩散架构

Diffusion over Diffusion技术

迭代里程碑常见问题相关推荐

产品对比

0.0
评分图标 我也评评
用户评分
4.4
评分图标我也评评
-
准确性
4.6
-
易用性
4.3
-
响应速度
4.4
超长视频生成
轨迹控制生成
多模态输入支持
分层扩散架构
相机运动模拟
核心功能
AI快字幕
智能抠图
AI写真
画中画
AI去水印
-
产品热度
7728
微软
技术背景
360旗下
NUWA-XL
最新模型
-
2023-04-06
更新时间
2025-06-16

迭代里程碑

DragNUWA发布2024年01月07日
可控生成多模态
引入轨迹控制技术,实现语义、空间、时间三维可控视频生成。
NUWA-XL正式推出2023年04月06日
长视频生成并行计算
采用Diffusion over Diffusion架构,支持16句文本生成11分钟超长动画。
NUWA-Infinity升级2022年
无限分辨率视觉创作
突破分辨率限制,实现任意尺寸高清图像与短视频生成。
NUWA初代发布2021年
多模态AIGC
首个多模态生成模型,支持文本、图像、视频跨模态转换。

常见问题

NUWA-XL支持哪些输入方式生成视频?
NUWA-XL支持文本、图像及轨迹控制三种输入方式。用户可通过脚本描述、静态图片结合运动轨迹(如绘制对象移动路径)或直接输入多模态信息,模型会基于这些输入以“粗到细”的流程生成高质量长视频。
NUWA-XL生成视频的最大长度和效率如何?
NUWA-XL采用Diffusion over Diffusion架构,可并行生成超长视频(如11分钟动画),显著优于传统模型(仅3-5秒)。其全局-局部扩散模型协同工作,既保证关键帧连贯性,又提升生成效率,例如16句文本输入即可生成11分钟内容。
NUWA-XL适用于哪些专业场景?
该工具主要服务于电影制作、动画设计及视频游戏开发领域。例如,电影团队可通过脚本快速生成分镜动画,游戏开发者能动态创建场景素材,内容创作者则可高效产出专业级视频剪辑。
如何控制NUWA-XL生成视频的镜头运动?
用户可通过轨迹控制实现平移、倾斜、推拉等镜头效果。例如,在静态图片上标记对象运动轨迹,模型会根据轨迹力度和角度生成相应动态效果,同时支持多对象轨迹同步控制。
NUWA-XL生成的视频如何保证连贯性?
模型通过全局扩散生成关键帧确定剧情主线,再通过局部扩散递归填充中间帧细节,避免传统滑动窗口法的帧间断裂问题。实验显示其生成的11分钟视频情节逻辑自洽,镜头过渡自然。
已经到底了