字节跳动推出全新InfinityStar框架,大幅提升视频生成效率,生成5秒720p视频仅需58秒。该框架可支持图像生成、文本生视频、视频续写等多种视觉生成任务。
这背后,它基于时空金字塔模型,分开处理空间尺度与时间维度,并引入知识继承策略,以预训练VAE为基础。此创新使模型解耦外观与动态信息,能在保证视觉质量的同时实现超高生成速度,有望在视频生成市场占据优势。
近日,字节跳动推出全新InfinityStar框架。该框架支持图像生成、文本生视频等多种视觉生成任务,能大幅提升视频生成效率,生成5秒720p视频仅需58秒。技术上基于时空金字塔模型,引入知识继承策略,解耦外观与动态信息,有望在视频生成领域占据优势。
字节跳动推出全新InfinityStar框架,大幅提升视频生成效率,生成5秒720p视频仅需58秒。该框架可支持图像生成、文本生视频、视频续写等多种视觉生成任务。
这背后,它基于时空金字塔模型,分开处理空间尺度与时间维度,并引入知识继承策略,以预训练VAE为基础。此创新使模型解耦外观与动态信息,能在保证视觉质量的同时实现超高生成速度,有望在视频生成市场占据优势。
网友评论