DreamTalk
-
一个基于扩散模型让人物头像说话的框架DreamTalk
DreamTalk是一个基于扩散模型的框架,由清华大学、阿里巴巴和华中科大共同开发。它能够根据音频让人物头像照片说话、唱歌并保持嘴唇的同步和模仿表情变化。该项目使用扩散模型生成动态和表情丰富的说话头部动画,包括去噪网络、风格感知的嘴唇专家、风格预测器、音频和视频处理以及数据和模型训练等关键组件。 亮点: DreamTalk不仅能够处理和生成训练过程中见过的面部类型和表情,还能有…