#音频创作
EchoMimic是一个先进的人像图像动画模型,能够通过音频和选定的面部特征点单独或组合驱动生成逼真的肖像视频。它通过新颖的训练策略,解决了传统方法在音频驱动时可能的不稳定性以及面部关键点驱动可能导致的不自然结果。EchoMimic在多个公共数据集和自收集数据集上进行了全面比较,并在定量和定性评估中展现出了卓越的性能。
音频驱动口型与身体动作同步
结合音频与面部特征生成动画
支持中英文及歌唱语音输入
实现半身人物表情肢体协调
3408
2877
2272