1.该工作流为LTX2.3音图驱数字人工作流,提供多种配置可供选择(FP8版,KJ版,GUFF版)。在线版默认使用FP8版本。

2.质量最好的还是原版。但如果使用KJ大神的模型(ltx-2.3-22b-distilled_transformer_only_fp8_scaled),则是在低配置、快速、高质量之间的最优模型。

3.强烈建议使用横屏,竖屏可以生成,但效果不佳。

4.音频驱动的提示词可以简单,因此需要自己写的时候断开提示词连接即可。默认使用自动提示词,也可以在其他智能体用提示词模板生成视频提示词。

5.如果需要I2V文生图,则开启开关。

6.关于分辨率选择问题:

(1)LTX输出视频尺寸必须是32的倍数,因此如果为了保证视频比例为16:9,可以参考以下尺寸:512×288 ;1024×576
(2)其他近似16:9画幅:1920×1088
(3)另外1280×720/736输出视频均为1280×704
(4)1280×768可以正常输出
(5)分辨率越高效果越好,但配置要求更高

7.默认参数(1280*736,10秒)运行一次约80点左右,7分钟


免费领生成币:点"右上角自己头像">邀请码>填写邀请码,免费领1000点RH币,每天登录送100!

邀请码:rh-v1443