

Powered By RTX 4090
输入一张照片,和文字,就可以得到一个播报该文字的数字人
也可以结合下面的流,克隆声音,这样就能得到一个“声音” “文字” “形象” 都高度自定义的数字人了
Epsilon
2024-09-20 更新
Epsilon
2024-09-20 更新
工作流介绍
输入一张照片,和文字,就可以得到一个播报该文字的数字人
也可以结合下面的流,克隆声音,这样就能得到一个“声音” “文字” “形象” 都高度自定义的数字人了
节点信息
9
LoadImage
CosyVoiceNode
Echo_LoadModel
Echo_Sampler
JWImageResizeToSquare
PreviewAudio
SaveAudio
TextNode
VHS_VideoCombine