一个让视频角色对口型的工作流,视频时间要等于或大于音频时长的一半。

本地部署需要下载的模型(不一定要用这些版本的):

1.Wan2_1-I2V-14B-480P_fp8_e4m3fn

https://huggingface.co/Kijai/WanVideo_comfy_fp8_scaled

2.Wan2_1-InfiniTetalk-Single_fp16.safetensors

https://huggingface.co/Kijai/WanVideo_comfy/tree/main/InfiniteTalk

3.lightx2v_I2V_14B_480p_cfg_step_distill_rank128_bf16

https://huggingface.co/Kijai/WanVideo_comfy/tree/main/Lightx2v