EchoMimic

  • EchoMimic:音频+角色照片生成生动配嘴型视频

    全文摘要本文介绍了EchoMimic,一种新型的肖像视频生成技术,它能够通过音频、面部关键点或二者的组合来驱动生成逼真的动态肖像。EchoMimic通过创新的训练策略,解决了传统方法在音频驱动不稳定或关键点驱动导致不自然的问题,并通过公共数据集和自收集数据集的比较,证明了其在定量和定性评估中的优越性能。 关键段落 参考文献格式 项目地址: https://badtobest.g…

    2024年7月12日