一段15秒的MV制作,只需要一张角色参考图,一段15秒以上的歌曲,三段MV描述。使用了infinite Talk和Humo模型。

本地部署需要确保安装了以下模型:

1.Humo(KJ量化版)

https://huggingface.co/Kijai/WanVideo_comfy/tree/main/HuMo

放置文件夹:

whisper_large_v3_encoder_fp16.safetensors

models/audio_encoders

Wan2_1-HuMo-14B_fp16.safetensors

models\diffusion_models

2.InfiniteTalk

https://huggingface.co/MeiGen-AI/InfiniteTalk/tree/main/comfyui

放置位置:models/diffusion-models