
VoiceGate 是基于 VoxCPM2 与 ComfyUI 构建的跨语言视频智能配音引擎。VoxCPM2 支持 30 种语言(含东南亚八国语言)与 9 种中文方言(粤语、四川话、吴语、东北话、闽南语等),具备声音克隆与音色设计能力。引擎通过自研 VoiceBridge 插件实现 TTS 语音与 SRT 字幕时间戳的帧级对齐,确保配音与画面精准同步。
完整链路覆盖 ASR 字幕提取、LLM 翻译、多语言 TTS 到音频对齐合并,节点图可视化编排,开箱即用。
输入:视频和目标语言
输出:克隆输入视频的音色,生成一段目标语言的视频,同时输出对应的字幕。输出音频与输入视频实现字幕级别的对准。
输入的目标语言请从下面拷贝:Arabic, Burmese, Chinese, Danish, Dutch, English, Finnish, French, German, Greek, Hebrew, Hindi, Indonesian, Italian, Japanese, Khmer, Korean, Lao, Malay, Norwegian, Polish, Portuguese, Russian, Spanish, Swahili, Swedish, Tagalog, Thai, Turkish, Vietnamese
GitHub项目:
https://github.com/YanTianlong-01/VoiceGate
VoiceGate 是基于 VoxCPM2 与 ComfyUI 构建的跨语言视频智能配音引擎。VoxCPM2 支持 30 种语言(含东南亚八国语言)与 9 种中文方言(粤语、四川话、吴语、东北话、闽南语等),具备声音克隆与音色设计能力。引擎通过自研 VoiceBridge 插件实现 TTS 语音与 SRT 字幕时间戳的帧级对齐,确保配音与画面精准同步。
完整链路覆盖 ASR 字幕提取、LLM 翻译、多语言 TTS 到音频对齐合并,节点图可视化编排,开箱即用。
输入:视频和目标语言
输出:克隆输入视频的音色,生成一段目标语言的视频,同时输出对应的字幕。输出音频与输入视频实现字幕级别的对准。
输入的目标语言请从下面拷贝:Arabic, Burmese, Chinese, Danish, Dutch, English, Finnish, French, German, Greek, Hebrew, Hindi, Indonesian, Italian, Japanese, Khmer, Korean, Lao, Malay, Norwegian, Polish, Portuguese, Russian, Spanish, Swahili, Swedish, Tagalog, Thai, Turkish, Vietnamese
GitHub项目:
https://github.com/YanTianlong-01/VoiceGate