ltx-2.3-22b-dev-fp8-Lightricks-官方版
38 5 18

写实

3D立体

人物加强

主体加强

元素加强

画面控制

其他

V2.3

ltx-2.3-22b-dev-fp8-Lightricks-官方版
-----------------------------------------------
LTX-2.3模型系列/全套下载

通过网盘分享的文件：LTX2.3版模型全套
链接: https://pan.baidu.com/s/1hN4rDcNqhAKb1_PLsnIGyg?pwd=77ra 提取码: 77ra
-----------------------------------------------

LTX-2.3 是由Lightricks公司研发的新一代开源音视频一体化生成模型，为 LTX-2 系列的升级版本，目前已在阿里云魔搭社区（ModelScope）上线发布，同时推出了 FP8 量化优化版本（ltx-2.3-fp8），核心面向文本生成视频（T2V）、图像生成视频（I2V）等 AIGC 视频创作场景，是一款兼顾生成效果、工程可控性和部署实用性的多模态生成模型。
核心研发背景与定位
LTX-2.3 延续了 LTX 系列基于Diffusion Transformer（DiT）扩散变换器的核心架构，是对 LTX-2 的全面功能与效果升级，主打音视频同步生成核心能力，区别于传统单一视频生成模型，可实现文本 / 图像输入下的视频 + 音频一体化创作，同时针对开源社区的实际使用需求优化了动态表现、画质、兼容性等问题，定位为面向工业级和个人创作者的开源视频生成解决方案，兼顾免费使用、工程可控和本地化部署特性。
该模型同时提供基础版、量化版（FP8）及配套的 LoRA/IC-LoRA 模型，适配不同硬件资源和使用场景，目前已支持 ComfyUI、Hugging Face Diffusers 等主流开源框架，开箱即用性强。
核心升级与功能亮点
作为 LTX-2 的迭代版本，LTX-2.3 在生成效果、功能支持、细节表现上实现了多维度提升，也是该版本的核心竞争力：
彻底解决音频破音问题：针对此前版本文本 / 图像生成视频时的音频失真、破音问题完成优化，音画同步效果大幅提升，人物说话、场景音效的自然度显著改善。
动态表现与镜头效果升级：运镜、切镜逻辑更合理，大场景动态（如拳击、赛车、赛博朋克城市画面）的流畅度大幅提升，运动画面的连贯性在开源视频生成模型中表现优异。
竖屏场景原生支持：新增竖屏视频生成适配，贴合短视频、社交媒体创作的主流需求，无需额外调整即可生成符合移动端展示的视频内容。
人物面部生成稳定性提升：即使画面中人物面部占比较小，也能有效避免面部崩坏、扭曲问题，写实人物场景的生成效果更自然。
中文场景适配优化：首次实现中文视频的自动字幕生成能力（英文场景暂不支持），虽字幕识别仍有小瑕疵，但完成了对中文创作场景的核心适配。
画质与细节优化：风光、写实、恐怖风格等静态 / 低动态场景的画质表现优秀，10 秒级短视频的细节还原度高。
模型版本与形态
Lightricks 为 LTX-2.3 提供了多形态模型包，适配不同使用需求，均已在魔搭社区更新：
基础版（LTX-2.3）：完整功能版本，包含 3 个基础模型及配套 LoRA/IC-LoRA，主模型文件约 40+GB，保留全部生成能力，效果最佳。
FP8 量化版（ltx-2.3-fp8）：针对显存占用和推理速度优化的低精度版本，大幅降低硬件门槛，适合资源受限的本地化部署。
适用场景
LTX-2.3 延续了 LTX 系列的多场景适配性，结合升级后的功能，更贴合短视频创作、商业内容制作、个性化创意生成等实际需求，核心适用场景包括：
社交媒体 / 自媒体创作：快速生成竖屏短视频、剧情短片、风景 / 创意视频，支持中文字幕自动生成，贴合抖音、小红书等平台需求。
商业广告与商品展示：通过图像 / 文本快速生成电商商品动态展示视频、品牌广告短片，降低制作成本。
教育与培训：教师可通过文字提示生成教学动态视频，配合音频同步讲解，丰富教学形式。
游戏与虚拟内容：为游戏角色、虚拟场景生成动态动画和配套音效，提升虚拟世界沉浸感。
艺术创作与视觉叙事：支持赛博朋克、写实、恐怖等多种风格，满足创作者的个性化艺术表达需求。
目前存在的局限性
LTX-2.3 仍为开源阶段的优化版本，存在少量未完善的问题，使用时需注意：
二次元生成效果较差：写实场景表现优异，但二次元风格的视频生成效果不佳，官方建议二次元创作优先使用图像生成视频（I2V）模式，而非文本生成视频（T2V）。
高动态场景画质衰减：大动态画面（如高速运动、复杂场景切换）会出现轻微的 “颗粒感 / 大果粒” 问题，画质略低于低动态场景。
LoRA 参数需精细调整：使用配套 LoRA 时若强度拉满（设为 1），易出现人物面部变老、扭曲问题，需降低强度并配合采样器调整。
字幕生成精度有限：中文自动字幕虽能生成，但存在部分文字识别错误、不完整的问题，需后期校对。
视频时长暂限短帧：目前最优生成效果集中在 10 秒级短视频，长时长视频的场景一致性仍有提升空间。
部署与使用适配
框架支持：原生支持ComfyUI（图形化操作，适合个人创作者）、Hugging Face Diffusers（底层代码库，适合开发者程序化部署），可通过一键整合包快速搭建工作流。
硬件要求：基础版主模型约 40+GB，建议使用高性能 GPU（如 NVIDIA RTX 4090/50 系、A100/H100）；FP8 量化版可降低硬件门槛，支持中低配置 GPU 本地化运行。
使用技巧：生成时降低蒸馏 LoRA 强度、使用普通采样器跑 4 步并将降噪值调至 0.3-0.5，可有效优化画质和人物面部表现。
与同类开源模型的核心优势
此模型源自站外搬运（搬运地址: https://www.modelscope.cn/models/Lightricks/ ），若原作者对于本次搬运的结果存在异议，可点

申诉

我们会在 24 小时内，按照原作者的要求，对本模型展开编辑、删除或是转移给原作者等相关处理。由衷欢迎原作者入驻本站，共建 AI绘图的学习交流社区。

Dream2046

关注

Dream2046

关注

写实

3D立体

人物加强

主体加强

元素加强

画面控制

其他

模型信息

未冻结

原创作者：

Lightricks

模型类型：

Unet

基础模型：

LTX2.3

文件名称：

models/unet/ltx-2.3-22b-dev-fp8.safetensors

MD5：

0e6a8a5f2a675e32ae324d68e0c8264f

ltx-2.3-22b-dev-fp8-Lightricks-官方版
-----------------------------------------------
LTX-2.3模型系列/全套下载

通过网盘分享的文件：LTX2.3版模型全套
链接: https://pan.baidu.com/s/1hN4rDcNqhAKb1_PLsnIGyg?pwd=77ra 提取码: 77ra
-----------------------------------------------

申诉

ltx-2.3-22b-dev-fp8-Lightricks-官方版 38 5 18

写实

3D立体

人物加强

主体加强

元素加强

画面控制

其他

写实

3D立体

人物加强

主体加强

元素加强

画面控制

其他

模型信息

ltx-2.3-22b-dev-fp8-Lightricks-官方版
38 5 18